ハルシネーションが模倣しているのは？

6リアクション

はじめに

大規模言語モデルが、事実とは異なる情報をさも真実であるかのように出力する現象は、一般にハルシネーションと呼ばれています。この言葉は、本来は人間が実在しないものを知覚する幻覚を指すものですが、計算機がもっともらしい嘘をつく様子がそれに似ていることから定着しました。

しかし、この現象を単なるシステムの故障や精度の不足として片付けるのは、事象の半分しか見ていないことになります。計算機が言葉を紡ぐ仕組みと、人間が世界を認識し、記憶を再構成する仕組みを並べてみると、そこには驚くほど共通した構造が見えてきました。

本稿では、ハルシネーションという現象を計算機の不具合としてではなく、情報の不足を補完しようとする設計上の必然、あるいは人間の認知構造を忠実に再現した結果として捉え直してみたいと思います。私たちが何を持って正しいと判断し、何を持って間違いと断じるのか。その判断基盤そのものを点検する機会として、この問題を掘り下げていきます。

1章：空白を埋めるための予測回路

計算機が次の単語を予測する際、その背後にあるのは膨大な統計的確率です。特定の文脈において、次に来る確率が最も高い断片を選び続けることで、文章は形成されます。ここで重要なのは、計算機には真実を照合するための現実世界という参照点が存在しないことです。

彼らにとっての世界は、学習データの中に存在する言葉の並びそのものです。もし、ある事実に関する情報が学習データの中に欠落していたとしても、システムは出力を停止するように設計されていません。なぜなら、その設計思想の根底には、文脈を維持し、対話を継続させるという報酬系が組み込まれているからです。

これは、私たちが道を聞かれた際に、うろ覚えの記憶を無意識に補完して答えてしまう心理的な動きに似ています。全く知らないと答えることは、コミュニケーションの遮断を意味します。私たちの脳もまた、断片的な情報からもっともらしい全体像を瞬時に作り上げ、空白を埋めることで認知の負荷を下げようとする性質を持っています。

この予測回路による補完は、情報が十分にあるときには流暢な知性として機能しますが、情報が欠如した瞬間に、その同じ仕組みがもっともらしい嘘を生み出す装置へと反転します。ハルシネーションは、高度な予測能力が引き起こす副作用であり、精度の問題というよりは、システムの在り方そのものに根ざした現象と言えます。

2章：記憶の再構成と情報の劣化

人間の記憶は、ビデオテープのように過去をそのまま保存しているわけではありません。思い出すという行為は、その都度、脳内に散らばった断片を集め、現在の文脈に合わせて物語を再構成する作業です。このプロセスにおいて、私たちはしばしば事実を歪め、存在しなかった細部を付け加えます。

計算機における学習もまた、情報の圧縮と再構成の連続です。何兆もの言葉を有限の数式に落とし込む過程で、細かな事実は捨象され、概念的なつながりへと変換されます。出力の際、モデルはその圧縮された概念から再び言葉を復元しようとしますが、その過程で細部の整合性が失われることがあります。

この現象は、コピー機で何度も複写を繰り返すと、文字の輪郭がぼやけ、やがて元の形とは異なる記号に変化していく様子に似ています。情報の解像度が下がる一方で、文章としての滑らかさだけが維持されるため、受け手はその変質に気づくことができません。

私たちが自分の過去を語る際、都合の悪い部分を無意識に削ぎ落としたり、劇的な要素を足したりするのも、ある種の自己保存のための再構成です。計算機も同様に、論理的な一貫性を保とうとするあまり、事実という重石を外して、文脈という流れに身を任せてしまうのです。つまり、ハルシネーションは情報の劣化の結果であると同時に、一貫性を守ろうとする設計の副産物でもあります。

3章：確信という名の認知バイアス

ハルシネーションがこれほどまでに問題視されるのは、それが非常に断定的で、自信に満ちた口調で行われるからです。計算機は、自分が生成している内容が真実であるかどうかを疑う機能を持ち合わせていません。提示された確率に基づき、ただ淡々と、最も適切と思われる回答を差し出します。

この確信に満ちた振る舞いもまた、人間の判断プロセスを鏡のように映し出しています。人間には、一度思い込んだ情報を正当化するために都合の良い証拠だけを集める、確証バイアスという性質があります。また、自分の知識が不足している分野ほど、自分の能力を過大評価してしまう傾向も知られています。

声が大きく、よどみなく話す人物を、私たちは無意識に信頼してしまいます。計算機が出力する滑らかな文章は、私たちのこの脆弱な判断基盤を的確に突いてきます。中身が空虚であっても、形式が整っていれば、私たちの脳はそれを正しいものとして受け入れるためのコストを支払おうとしません。

判断のコストを下げるために、私たちは複雑な事象を単純なパターンに当てはめて理解しようとします。計算機のハルシネーションは、まさにそのパターン化された知識の提供に特化しています。私たちが期待する答え、私たちが納得しやすい論理構成を、システムは過去のデータから抽出して提供します。その結果として生じるのは、真実の追求ではなく、期待への合致です。

4章：設計としての責任と対話の境界線

もし、ハルシネーションを完全になくそうとするならば、計算機の創造性や柔軟性は著しく損なわれることになるでしょう。厳格な事実確認のみを許容するシステムは、辞書やデータベースの検索と変わりありません。私たちが対話型AIに求めているのは、未知の組み合わせによる発想や、曖昧な指示からの意図の汲み取りです。

この柔軟性と正確性のトレードオフは、私たちが他人と会話する際にも常に存在しています。友人ととりとめのない空想話をするのと、医師から診断結果を聞くのとでは、許容される情報の不確かさが異なります。問題は、私たちが計算機に対して、常に後者の厳密さを期待しながら、前者のような気軽な対話を求めているという、期待の不一致にあります。

システムをより堅牢にするためには、出力された情報の出所を明示したり、不明な点については正直に分からないと答えるような回路を、事後的に追加する必要があります。これは、人間が教育を通じて、自分の発言に責任を持つことや、根拠を確認する習慣を身につける過程と重なります。

しかし、どれほどガードレールを設けたとしても、言葉という道具が持つ本質的な曖昧さを完全に排除することはできません。言葉は常に、送り手と受け手の間の解釈というフィルターを通ります。ハルシネーションは、技術的な障壁というよりも、言葉を用いたコミュニケーションというシステムそのものが内包している不安定さの露呈であると考えるべきです。

おわりに

ハルシネーションという現象を深く観察していくと、それは計算機の欠陥を指し示しているのではなく、むしろ言葉を扱う存在としての私たちの限界を突きつけていることに気づかされます。

計算機が吐き出すもっともらしい嘘は、私たちが日頃、いかに雰囲気や文脈だけで物事を判断し、不確かな記憶を補完しながら生きているかを浮き彫りにします。彼らは単に、人間が過去に残してきた膨大な言葉の痕跡をなぞり、そこに潜むバイアスや思考の癖を純粋に拡大して見せているに過ぎません。

社会を模倣して小中学校という閉鎖的な社会でいじめが起こるさまと同じように、ハルシネーションを人間の模倣であると結論づけるのは容易ですが、それ以上に重要なのは、その鏡に映った自分たちの認知構造を、どう管理していくかという視点です。情報の正確性を計算機のみに依存するのではなく、受け手である私たちが、情報の背景にある構造を点検するコストを惜しまないこと。その判断の主体性を維持し続けることが、技術との持続可能な関係を築くための前提条件となります。

計算機が嘘をつくことを止める日は、おそらく来ないでしょう。しかし、その嘘が生まれる仕組みを理解し、私たちの脳がそれをどう受け取ってしまうのかという設計上の特性を知ることで、私たちはより冷静に、この新しい知性の断片と向き合えるようになるはずです。

このブログ一覧は

メンバー投稿記事

です

メンバー登録すると、限定記事の閲覧やメンバー同士の交流、限定イベントへの参加などができます。

CDLEコミュニティサイトβ版

JDLA（一般社団法人日本ディープラーニング協会）が実施する、G検定・E資格の合格者のみが参加できる、10万人を超える日本最大級のAIコミュニティ「CDLE」の紹介サイトです。 CDLEでは、ディープラーニングの社会実装の日本代表として、社会を発展させるエバンジェリストたちが集まり、学び合い・アウトプットする場を提供しています。

詳細を見る

CDLEメンバー

¥55/月(税込)

登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。もっとみる閉じる

登録情報を確認の上、事前登録された方へ本登録のご案内メールを送信します。

このプランに入会する

その他のプランもみる

6リアクション

メンバーの方はこちらからログイン

ふらっとガバナンス～ナイジェリアと投資教育～

知識蒸留 —— ベテランのコツを新人に引き継ぐ実装ガイド