ライフサイエンスにおける機械翻訳の進化と翻訳テクノロジーパートナー選定時に必ず押さえておくべき7つのポイント
翻訳テクノロジーは70年以上前から今日までに大きく変化してきました。特に、機械翻訳(MT)と翻訳メモリ(TM)は技術とビジネスを大きく進化させています。
これらのテクノロジーの進化を受け、ライフサイエンス企業は、人工知能(AI)及び機械翻訳テクノロジーに投資することで、大幅なコスト削減や市場投入期間の短縮、翻訳の一貫性と品質の向上、世界規模のオペレーションワークフローの合理化を行っています。
ライフサイエンス企業にとっては、これらの翻訳テクノロジーの進化が、どのようなメリットを自社にもたらすのかを理解することが欠かせません。そのためには、機械翻訳が開発されてからどのような発展をしてきたかを知るとともに、翻訳テクノロジーのパートナーを決める際に考慮すべき点を理解することが重要です。
〈目次〉
1.機械翻訳の成り立ちと市場規模
2.ライフサイエンスと機械翻訳
3.ライフサイエンスにおける翻訳メモリの重要性
4.翻訳テクノロジーパートナーを選択する際に押さえておくべきポイントとは?
5.最後に
機械翻訳の成り立ちと市場規模
機械翻訳は、1947年にロックフェラー財団の研究者であったウォーレン・ウィーバーが初めて提案しました。そこから大きな進歩を遂げ、機械翻訳と言語テクノロジーは誕生から現在に至るまで、常に進歩しつづけてきました。
実際、Global Market Insightsによると、機械翻訳市場は2020年の6億5,000万ドルから2027年までに約30億ドルまで成長すると予測されています。
この成長は、世界的なAIへの投資や企業の海外展開が進んでいることによるコンテンツのローカライズ需要、コスト効率の良いタイムリーな翻訳に対する需要の高まり、母国語が異なるお客様に対する顧客サービスと顧客体験の向上を重視などいくつもの要因が重なったものです。この特徴は、ライフサイエンスとヘルスケア組織で顕著に見られます。
ライフサイエンスと機械翻訳
では、ライフサイエンスの分野において機械翻訳はどのように進化してきたのでしょうか?これに答えるには、まず機械翻訳の主要なタイプを理解する必要があります。
- ルールベース機械翻訳(RBMT):RBMTは、1950年代に言語テクノロジー分野に登場した最初の機械翻訳です。RBMTは、ソース言語とターゲット言語の文法に基づいてコンテンツを翻訳します。特にライフサイエンスなどの規制が定められた業界においては通常、多くの編集を要します。
- 用例ベース機械翻訳(EBMT):1980年代にEBMTとして知られる新しいツールが出現しました。このモデルでは、ソース言語のフレーズまたは類似性を活用して、ターゲット言語で対応する翻訳に一致させます。
- 統計ベース機械翻訳(SMT):統計ベース機械翻訳は、おそらく最もよく知られているタイプの機械翻訳です。1990年代に初めて言語テクノロジー分野に登場しました。このモデルでは、ソース言語の単語をターゲット言語に一致させます。Google TranslateはSMTの一例です。
- ハイブリッド機械翻訳:ハイブリッド機械翻訳はその名のとおり、2つの異なるタイプの機械翻訳を組み合わせたものです。一般にハイブリッド機械翻訳と呼ばれるものは、RBMTとSMTを組み合わせたものを指しています。このモデルの最大の特徴は、翻訳メモリを活用して翻訳の品質向上を図っていることです。ただし、それでも通常は言語スペシャリストによるポストエディットプロセス*が必要です。
*ポストエディットプロセスは、機械翻訳エンジンから出力された翻訳文を人間が編集、手直しすることです。
- ニューラル機械翻訳(NMT):言語テクノロジー分野に登場した最新の機械翻訳技術は、人工知能(AI)に大きく依存したNMTです。NMTの理論は2013年に初めて論文で公表されました。人間の脳に似せたニューラルネットワークで動作し、機械翻訳の統計モデルを利用して学習します。つまり、NMTはルールに依存する代わりに、ソースとなる言語のテキストを関連するテキストにマッピングすることで直接学習するのです。
特にNMTにおいては、翻訳エンジンのトレーニングを「より直感的で正確にする機械学習のメリット」がスポットライトを浴びるようになりました。機械翻訳は、劇的に進展を遂げていますが、ライフサイエンスなど規制が定められた業界においては、最高の翻訳品質を得るためには、人によるポストエディットが必要です。
ライフサイエンスにおける翻訳メモリの重要性
機械翻訳は、グローバルに事業を展開するライフサイエンス企業に多くのメリットをもたらしましたが、業界で起きた自動翻訳テクノロジーの進歩は機械翻訳だけではありません。
実は、機械翻訳がこれほどまでの成功を収め、広く利用されるようになった理由の一つは、翻訳メモリの進化があります。1970年代後半から1980年代前半に翻訳メモリが初めて登場したときは、言語スペシャリストの翻訳作業を軽減し、納期を短縮して機械翻訳の品質を向上するための一つの方法として考えられていました。最近では、翻訳メモリは企業がデータリポジトリを構築してより高速で安価な翻訳を行うために、最も広く使用されているツールの一つです。
ライフサイエンス企業にとっては、企業固有の専門用語に加えて、業界に関連する用語の翻訳メモリの活用は必須となります。頭字語や専門用語に大きく依存するライフサイエンス業界では、翻訳メモリは特に機械翻訳と組み合わせて使用すると大きな力を発揮します。より高品質のデータを収集し、より良い自動翻訳テクノロジーの開発に集中することによって、翻訳メモリの主な役割は企業の翻訳データベースから機械翻訳のトレーニングツールに変化していっています。
翻訳テクノロジーパートナーを選択する際に押さえておくべきポイントとは?
セキュアで、簡単に使用できる翻訳テクノロジーを求めるライフサイエンス企業は増え続けています。翻訳テクノロジーの最適なパートナーを選択する際は、下記ポイントについて検討が必要です。
- 統合機能:コンテンツの転送を合理化し、ワークフローの中断を避けるため、翻訳管理プラットフォームに業界をリードするコンテンツリポジトリとの統合機能があることを確認します。
- クラウドインターフェイス:世界中、いつでもどこでも翻訳プロジェクトにアクセスできることは、複数のタイムゾーンと地域にまたがり事業展開するグローバル・ライフサイエンス企業にとっては重要です。翻訳テクノロジーのパートナー企業が提供するプラットフォームに、いつでもどこでも容易にアクセスできることを必ず確認してください。
- 検証済みのエコシステム:機械翻訳で最も重要な機能は、規制に確実に準拠していることです。翻訳パートナー企業のシステムがセキュアかつ規制に確実に準拠していることを確認してください。システムはCFR 21 Part 11に準拠していることが理想です。
- レポート機能とKPI指標:翻訳テクノロジーパートナー企業のプラットフォームに、品質、コスト、タイムラインの可視性と透明性が高いレポート機能が搭載されていることを確認してください。
- ベンダーに依存しない:翻訳メモリ(TM)、機械翻訳(MT)などの言語資産を活用するため、特定のベンダーに依存しないパートナーシップを検討します。これにより、異なるベンダー間であっても一貫性が保たれされます。
- オンラインレビュー:マニュアルプロセスを排し、プロジェクト管理にかかる時間を短縮できるオンラインレビューと編集機能があることを確認してください。
- 技術革新と継続的な改善:最後になりましたが、前述の条件と同じくらい重要な点は、翻訳テクノロジーパートナーが製品およびプロセスを改善する方法を絶えず探求していることです。この記事全体で解説しているように、翻訳テクノロジーは絶え間なく進歩しているため、技術革新に投資してテクノロジーの向上を推進しているパートナーが必要です。
最後に
ライフサイエンス企業における機械翻訳、翻訳メモリ、およびそのメリットの詳細については、弊社トランスパーフェクト・ジャパンにお問い合わせください。
GlobalLink AIポータルのデモをご覧になるには、こちらをクリックしてください。
【トランスパーフェクト】
トランスパーフェクトは、世界最大の言語サービスおよびテクノロジーソリューションプロバイダーとして、グローバル企業をサポートしています。6大陸100以上の都市に拠点を展開し、世界中のお客様に向けて、170以上の言語で幅広いサービスを提供しています。TransPerfectのGlobalLink®テクノロジーは、5,000社以上のグローバル企業で採用され、強力かつシンプルな多言語コンテンツ管理を実現しています。品質と顧客サービスに徹底的にこだわるTransPerfectは、ISO 9001およびISO 17100への完全準拠の認証を取得しています。TransPerfectはニューヨークにグローバル本社、ロンドンと香港に地域本社を置いています。詳細については、弊社ウェブサイトをご覧ください。