大規模言語モデル(LLM)
だいきぼげんごもでる
意味
大規模言語モデル(LLM:Large Language Model)とは、膨大な量のテキストデータを学習したAIモデルのこと。人間のように自然な文章を生成したり、質問に答えたり、要約や翻訳を行ったりできる。ChatGPTに使われているGPT-4などが代表例。
概要
Large Language Model。 膨大な量のテキストデータ(インターネット上のほぼ全ての文章など)を学習し、人間のように自然な文章を理解したり生成したりできるAIモデル。 ChatGPT(GPTシリーズ)やGoogleのGeminiが代表例。
仕組み
「ある単語の次に、どの単語が来る確率が高いか」を確率的に予測しているだけだが、パラメータ(計算式の係数)の数が数千億〜数兆個と桁違いに多いため、まるで意味を理解しているかのような高度な推論や創造が可能になった(創発)。
できること
翻訳、要約、プログラミング、チャット、小説の執筆など多岐にわたる。 「AIの民主化」をもたらした革命的な技術。