情報通信研究機構:自動車法規文の自動翻訳をニューラル技術で高精度化

情報通信研究機構:自動車法規文の自動翻訳をニューラル技術で高精度化

記事画像

情報通信研究機構(NICT)は、トヨタ自動車と、自動車法規を対象としたニューラル英日・中日自動翻訳の共同研究を実施し、実用度向上を確認した。これにより、自動車業界全体でのニューラル自動翻訳の活用が大きく期待できる。今後は、本技術を法規文以外のマニュアル等の多種多様な文献に展開するとともに、多言語化を進め、自動車産業で必要となるあらゆる翻訳を高効率化することを目指す。

 自動車及び自動車部品の設計・製造・輸出に当たっては、安全確保・環境保護等の様々な観点から、各国が定める法規の要件を満足することが求められている。そのためには、頻繁に改訂される各国の法規情報を迅速かつ正確に理解する必要があり、現状は、人による翻訳のため、精度確保には時間が掛かっている。情報の高速・高精度な翻訳は、トヨタをはじめとする自動車業界の業務効率化の鍵となっている。

 NICTでは、2017年から総務省と連携して、ニューラル翻訳*1技術に不可欠な翻訳データを集積する翻訳バンク*2を運営し、製薬会社をはじめとして多数の組織からデータの提供を受けて、翻訳データの集積・活用を進めてきた。また、トヨタとは2018年6月から「自動車法規文章の自動翻訳エンジンの研究開発」で共同研究を進めてきた。

 NICTは、トヨタが提供した自動車法規に関する英日・中日翻訳データを基に、汎用英日・中日ニューラルネットワーク翻訳エンジンのアダプテーション*3を行い、実用度を向上させた。
 トヨタが自動車法規についてアダプテーション後の実用度を評価したところ、英日翻訳について、アダプテーション前と比べ、自動翻訳エンジンの約24%、中日翻訳については、約11%の実用度向上が得られた。これを受けて、トヨタでは、実用度向上の検討を継続することとなった。
 各国語の法規の翻訳は、自動車にとどまるものでなく輸出される全ての生産物に対して存在し、その翻訳の高速化・高精度化は同様に不可欠となり、翻訳バンクによって実現されていくことが期待される。

 今回は、英日・中日翻訳の片方向のみだが、今後は、@双方向に、更には、多言語にすること、Aオーナーズマニュアル等の多種多様な文献に展開すること、B自動車産業全体に広げること、C広域にわたる輸出産業に広げることを目指す。

*1 ニューラル翻訳(NMT)
脳の神経回路を模したニューラルネットワークを用いた自動翻訳技術。膨大な翻訳データを用いてトレーニングしたニューラルネットワークで翻訳することで、従来の翻訳技術よりも高い翻訳精度が確認されている。
https://www.nict.go.jp/press/2017/06/28-1.html (NICT)
*2 翻訳バンク
ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となる。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいる。
http://h-bank.nict.go.jp/index.html
https://www.nict.go.jp/press/2017/09/08-1.html(NICT)
提供された翻訳データは、既存の翻訳データと併せて、ニューラルネットのトレーニングに活用され、技術移転される。最新版の翻訳精度は、NICTの開発した音声翻訳アプリVoiceTra*4や文字ベースの自動翻訳システムTexTra*5で自由に確認できる。
*3 アダプテーション
翻訳バンクで追加した翻訳データを用いて、精度を改善するようにトレーニング済みのNMTのニューラルネットワークを更に調整すること。
*4 VoiceTra
言葉の壁で困らない社会実現を目指してNICTが開発した多言語音声翻訳アプリ。NMTを用いて、観光地での旅行会話はもとより、病院、商業施設といった様々なシーンで精度の高い音声翻訳を提供している。世界31の言語に対応。
https://voicetra.nict.go.jp/
*5 TexTra
NICTでは、文字入力用のNMTをTexTraと名付けて公開している。公開サイト「みんなの自動翻訳@TexTra」では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、ワードやパワーポイントのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用するなど、様々な方法で翻訳精度を試すことができる。
https://mt-auto-minhon-mlt.ucri.jgn-x.jp/(NICT)

続きを読む記事テキスト

関連記事(外部サイト)