東京大学松尾研発・AIスタートアップ ELYZAは、BERT以降の汎用言語モデルを活用した日本語AIエンジン「ELYZA Brain」の開発に成功した。

ELYZAは、「未踏の領域で、あたりまえを創る」をミッションに掲げ、AI領域に強みを持つ東京大学・松尾研究室出身のメンバーで創立されたAIスタートアップ。未踏の問題の解決をめざしNLP(自然言語処理技術)×AI分野の技術に焦点を当て、研究開発に取り組んでいる。同研究室出身の代表をはじめとし、経済産業省主催「未踏事業」出身エンジニア、東京大学在籍のAIエンジニア、メガベンチャーのテックリードなど、最新のテクノロジーを扱える技術力の高いメンバーが結集。2020年9月現在、東証一部上場企業のプロジェクトに複数取り組んでおり、価値検証フェーズから本格開発に進んだプロジェクトは80%以上を占める。

今回開発に成功した「ELYZA Brain」は、NLP領域における国内最大級の日本語AIエンジンだ。日本語テキストデータの学習量及びモデルの大きさは国内最大級を誇り、特定の技術課題ではネイティブな日本語話者の精度を超えている。
AI研究において、2012年に深層学習を用いた手法の登場によりブレイクスルーが起き、2015年には画像認識分野において「人間を超える」精度が実現された。それ以降、自動運転や顔認証、不良品検出など、人間を代替するようなユースケースでの社会実装が進められ、現在ではさまざまな分野において実用化が推進されている。一方、NLPでは「人間を超える」精度は実現されておらず、画像認識分野と比較しても社会実装に至る分野は限られていた。

そのような中、2018年秋にGoogleより汎用言語モデル「BERT」が発表され、2019年には自然言語処理分野で「人間を超える」精度が実現するブレイクスルーが起きた。ELYZAはこうした技術革新を背景に、強みである技術力を活かし、BERT以降の汎用言語モデルを活用した日本語特化のAIエンジン「ELYZA Brain」の開発に成功。

ELYZA Brainは、テキストを扱うさまざまな業務に適用可能であり、十分な学習データを準備することができれば「読む」「書く」「対話」を含む業務を高精度に支援するツールを実現可能。例えば、法律領域では、契約書をELYZA Brainに大量に学習させることで、当事者・契約期間等の基本情報やその他関心条項を自動で抽出するツールの開発が期待できる。

ELYZAは、ELYZA Brainにより将来実現し得る未来のユースケース「NLP30」を策定し、あらゆる分野で未踏の領域を実現するための活動をしている。今回のELYZA Brainの開発に伴い、高精度にテキストを扱うAIの開発により実現可能となった新しい働き方、サービスを実現するためのプログラムとして「パートナープログラムNLP30」を開始する。このプログラムは、ELYZAがAIアセットを提供する「逆求人型の事業共創プログラム」となり、ELYZAとともに未踏領域へ挑戦する各業界の企業パートナーを募集する。採択プロジェクトには検証フェーズの開発リソースを無償提供し、未来のユースケースの実現に取り組んでいく。
自然言語処理技術のブレイクスルーにより将来実現し得る未来のユースケース「NLP30」
自然言語処理技術のブレイクスルーにより将来実現し得る未来のユースケース「NLP30」