ChatGPTを初めとする生成型AIが広く普及するようになりましたが、その基盤技術である大規模言語モデル(LLM)の大きな進歩なくしては実現しませんでした。
現在は、アメリカ発祥のLLMが大勢を占めており、日本企業・団体も独自のLLMを開発し、ビジネスに活用する動きが広がっています。その中で、2023年8月18日に東京大学の松尾豊教授の研究室は、日本語と英語に対応した独自のLLMを開発し、無償で公開すると発表しました。
生成AIの基盤技術を無償公開 東大・松尾教授の研究室 – 日本経済新聞 (nikkei.com)
本記事では、日本企業・団体による日本製LLMとも言える開発の状況と今後について詳しく解説します。
LLMの概要と日本製LLMの必要性
LLMは、人工知能の一種であり、大量の学習データと深層学習を組み合わせて構築される言語モデルです。これにより、AIが与えられたテキストを理解して次に出現する単語を統計的に予測し、文章を生成することができます。
AIの商業利用において、LLMはその根幹であり非常に重要ではありますが、現状は英語で記述されたデータを大量に学習したアメリカ製のものが主流であり、日本語データの少なさ故に、その回答の精度は見劣りしてしまっています。
そのため、日本語に特化したLLMは日本企業にとって非常に高い需要があるため、一部の企業・団体で独自に開発を開始する必要に迫られています。これは、技術的にLLMの性能はパラメーター数や学習データ量が増えれば増えるほど向上する法則があるためです。
また、企業のビジネスモデルに沿った専門性の観点からも自社製のLLMの構築が必要とされています。現行のChatGPTは汎用的でありすぎるため、各企業のニーズからある分野に特化した使用には適さないという側面もあります。ニーズに合わせて最適な規模や学習量を選ぶことができるため、より効果的にLLMを活用することが可能です。企業は、専門的な生成型AIを構築することで、顧客により適切なサービスや製品を提供することができます。
得られたデータや実績からの再学習においても、自社製のLLMであれば、ノウハウの蓄積やアウトプットの調整が自前で可能になります。
その観点では、ChatGPTがオープンソースであり学習したデータを全て吸い上げる仕様であることから、セキュリティの面でもメリットがあります(ChatGPTに学習させないように設定することも可能ですが)。
自社製LLMの開発事例
以下が、代表的な日本製LLMの開発事例です。
サイバーエージェントのLLM開発事例
サイバーエージェントは、AIを活用した広告クリエイティブ制作領域でのサービスにおいて、独自の日本語LLMを活用しています。彼らのLLMは130億パラメータまで開発されており、極予測AI、極予測TD、極予測LPなどのサービスで活用されています。サイバーエージェントは、自社の大規模な日本語データを活かし、日本語に特化した独自のLLMを開発することで、より高品質な広告クリエイティブを実現しています。
NECのLLM開発事例
NECもまた、独自のLLMを開発し、ビジネスに活用しています。彼らのLLMは、130億パラメーターまでの規模を持ち、日本語に特化させています。但し、独自の工夫により高い性能を実現しつつパラメーター数を抑えることで、消費電力を抑えることに成功しています。
NECは、LLMのライセンスを提供するだけでなく、日本市場のニーズに合わせた専用ハードウェアやソフトウェア、コンサルティングサービスなどを含めた「NEC Generative AI Service」を提供しています。これにより、企業は独自のLLMを活用したビジネス開発を推進することができます。
その他
その他にも、NTTやソフトバンク、NICT(国立研究開発法人 情報通信研究機構)、ABEJAなどの企業・団体が自前のLLM開発に乗り出しています。
日本製LLM開発の課題
良いことづくめに思える日本製LLMの自社開発ですが、当然課題もあります。
多くの投資と労力、時間をかけて膨大なデータを数カ月かけて学習させなければなりませんが、途中で失敗することもあり、そうなるとそれまでにかけていたものが全部無駄になってしまいます。
また、LLM自体の定義が曖昧であり、どれくらいのパラメーターを搭載すればLLMと呼べるかは決まっていないため、性能を満たさなくても『自社製LLM』が名乗れてしまいます。
また、自社製と言いながら、その実態はアメリカ製のLLMに追加で日本語データを学習させた『なんちゃって自社製AI』も作れてしまいます。
現在のAIブームに乗って、自社アピールの方法として使うこともあることには注意したいですね。
まとめ
日本企業によるLLMの開発と活用が広がっています。サイバーエージェントやNECなど、多くの企業・団体が独自の日本語LLMを開発し、ビジネスに活用しています。日本語に特化したLLMの開発は、日本企業にとって大きな強みとなります。
東京大学が日本語特化LLMを無償で公開するなど、今後も日本製LLMの発展と活用がさらに進展し、日本がAIの分野で国際的に主導権を握るような未来を期待したいですね。
AIと共に未来を創る!
コメント