名古屋大の森健策教授(本人提供)
 名古屋大の森健策教授(本人提供)
 CT画像の診断にVLMを応用するイメージ
 大規模視覚言語モデル(VLM)の特徴

 急速に進化する生成人工知能(AI)。文書だけでなく画像や音声などを同時に処理できる大規模視覚言語モデル(VLM)の開発が各国で進んでいる。東京大や名古屋大などではVLMを医療現場で実用化しようとする試みが始まっている。開発の現状や課題を探った。

 ▽医師の助けに

 生成AIの基盤技術としては、大量の文書を学習させ、自然な文章の理解や出力に特化した大規模言語モデル(LLM)が用いられている。米オープンAIの「チャットGPT」のGPTシリーズやグーグルの「ジェミニ」などが代表的で、AIのさまざまなサービスの基盤となっている。

 LLMをさらに発展させ、視覚と言語に関わる複数のデータを統合し、解析するの...

残り1106文字(全文:1406文字)