Author: John Ball

  • | |

    理解とは、単なる暗記ではない

    私たちは年齢に関係なく、常に、そして継続的に学び続けます。学びを止めることは決してありません。しかし、多くの科学者が「私たちは若い頃に学ぶのをやめる」というモデルを提唱していると聞いたら、驚かれるでしょうか?それは誤りです。もちろん、その点を証明するためにはさらなる研究が役立つでしょう。誰かが実験科学を用いてくれる必要があります!   東京のスターバックス1階からの眺め – すごい!コーヒーを片手に、言語と私たちの理解能力についてさらに学ぶのに最適な場所です!   さて、なぜ私が「学習は若い頃に止まらない」と主張できるのでしょうか?なぜそれほど自信があるのでしょう? 「Preada」という(架空の)言葉を知っていますか?これはPradaのように眼鏡を売るブランドです。PreadaはPradaのデザインにさらなる努力(Effort)を加えており、その名前がPraEdaとなっています!さて、もしこれらの文章があなたにとって何の意味も持たなければ、あなた何も学んでいないことになります。しかし、もし今Praedaのことを知ったなら、あなたは架空の会社を表す新しい単語を学んだことになります。これで証明されました。私たちはコミュニケーションの中で新しい単語を学ぶ能力に見られるように、学び続けるのです。 なぜ今日の統計的AIは失敗する運命にあるのでしょうか?それは、言語の使用法が無限であるため、(正確な認識を提供するための)あらゆる種類のコミュニケーションの例を見つけるという目標が、失敗する運命にあるからです。 東京のスターバックスで私が何を学んだか見てみましょう!     「Please hand this receipt to our Barista at the hand off.」(このレシートを受け渡し場所でバリスタにお渡しください。)いいえ、これは素晴らしい英語ではありませんが、私は完璧に理解できます。コーヒーショップで飲み物を注文するとき、彼らが飲み物を作って私の名前を呼ぶか(または呼び出しベルを鳴らす)、準備ができたことを知らせてくれることを私は知っています。受け取り場所(飲み物の受け渡し)で、私はレシートをバリスタに渡す必要があります。 私は問題のプロセスについて膨大な量を理解しており、私の「hand off」(私が手放すもの)から彼らの「hand off」(彼らが私にくれるもの)への視点の変化を理解できます。 これは非常に高度で複雑な科学のようなものです。言語理解は、現実世界を扱う上で非常に多くの考慮事項を扱います。1980年代の相互作用は「スクリプト」や「フレーム」といったもので呼ばれていました。カリフォルニア大学バークレー校のFrameNetシステムは、これらの種類の「フレーム」を文書化しようとしています。 もしあなたが年を取りすぎて学べないと言うなら、2番目の文を翻訳してあげましょう。「We sincerely serve our almondmilk beverages to our customers by using this receipt.」これは次のような意味です: 「このレシートをアーモンドミルクコーヒーと交換してください。」 本当に。私が省いた誠実さもいくらかありますが、レシートが飲み物を提供させるわけではありません!私は「almondmilk」という単語を「almond」と「milk」の2つの単語に翻訳しました。 状況に対する私の広範な理解力によって、私は標準的でない英語を、非常に明確で曖昧さのない要求に楽々と変換することができます。Patom理論の形成につながった長年の脳の観察に基づけば、私たちは新しい言語形式を認識するために複数の言語事例を保存する必要なく、これを再現できます。私たちは、フレーズや出来事の異なる視点だけでなく、その場で単語を学ぶことができるのです! 言語のメッセージを解読する私たちの驚くべきスキルを示すために、もう一つ例を挙げましょう。注:私は文字だけでなく、単語、フレーズ、関係性の意味も認識できないので、ここでは日本語を認識しようとはしません!    標準的でない英語を理解する2番目の例。ここには4つの文があり、それぞれに解読すべき「間違い」があります。それは簡単で、私たち英語ネイティブスピーカーが皆持っている広大な言語知識を示しています。 私の英語と彼らの英語を対比させるために、各文を見直してみましょう。 “To Customers who use table” (テーブルをご利用のお客様へ) なるほど、私なら「Customers」を大文字にはしません。「table」ではなく「this table」(このテーブル)ですね。この文は次の文への導入なので、コロン「:」があると良いかもしれません。 “This table will be reserved from 16:30 to close.” (このテーブルは16:30から閉店まで予約席となります。) 私なら「to」を「until」に変えるでしょう。なぜかって?わかりませんが、期間の終点を示す時間ベースの参照では「until」の方が好みです。「close」だけよりも「we close」(私たちが閉店する)の方が明確かもしれません。「… from 16:30 until we close.」のように。 “When the time comes, the staff will communicate to you” (時間になりましたら、スタッフがお声がけします) うーん。これは難しいですね、私ならそんなに直接的には言いません。おそらく、「16:30以降もまだいらっしゃる場合は、お声がけさせていただきます。」(私は各文がピリオドで終わるのが好きです)スタッフが私たちに「話しかける」(communicate WITH)と言う必要はありません。 “We thank you for your cooperation” (ご協力ありがとうございます) ピリオドを追加!まあ、これは私の好みです。これは私たちに何をすべきかを丁寧に伝える方法です。「警告はしましたよ」はもっと直接的ですが、お客様に対して失礼です。多くの人が協力しないかもしれないので、「仮定のクローズ」を使っています!しかし、私たちは「ご協力」という偽の記述を「感謝します…」という感謝の言葉に埋め込むことができます。 結論 言語は非常に精密で正確なコミュニケーションの道具です。文脈の中で構成可能な単語やフレーズを無限に使えるため、私たちは要求を伝えるために書かれた以上のことをはるかに多く理解することができます。 理解とは、単なる暗記ではありません。これらの例は、私がこれまで見たことのない単語やフレーズを示しています! この例では、東京のスターバックスで、日本語を母国語とする人々によって完璧に理解可能な英語が作られています。私がその違いについてエッセイを書くこともできますが、コミュニケーションの目的は、要点を簡潔に伝えることです。このコミュニケーションへの基本的なアプローチ(詳細についてはグライスの公理を参照)は、私たちが直接教わることはありませんが、それでも従っているように見える標準的な人間のモデルです。 統計的AIが「いつの日か」私が今日述べた無数の点を理解できるようになるだろうと期待している人々(時々「ホピウム」と呼ばれます)にとって、このエッセイが今日のAIアプローチを超えて目を向けるよう説得するかもしれません。なぜなら、次世代のAIは認知科学から生まれつつあるからです!    素晴らしいスターバックスの最上階から東京を見渡す景色!    ここはどこでしたっけ?コーヒーショップ、バー、それとも博物館?! もっと関わってみませんか? ゲーム感覚で言語を学べるシステムを実現する私たちの今後のプロジェクトに参加したい方は、進捗を追跡するサイトはこちらです(クリック)。そのサイトの連絡先リストにメールアドレスを追加することで、最新情報を受け取ることができます。     John Ball inside AIは読者に支えられている出版物です。新しい投稿を受け取り、私の活動を支援するために、無料または有料の購読者になることをご検討ください。    

  • | |

    Speech Genieの魔法

    大人になってから新しい言語を学ぶのは難しく、上達するには何年もかかると言われています。しかし、本当にそうなのでしょうか?今回は、Chris Lonsdale氏をお招きしてお話を伺います。彼は、自身が20代で新しい言語を習得した際の成功体験を再現するために設計されたシステム、Kungfu Englishの創設者です。 今すぐ登録 Chris氏は言語教育者であり、心理言語学者でもあります。彼のシステムは、2000年代初頭から、中国語を母国語とする人々に英語を教え続けてきました。この度、私は彼と共に、私の脳科学に基づいたAIソリューションを、彼の言語学習アプリケーションの汎用版に統合するプロジェクトを開始しました。その成果が… Introducing Speech Genieです! 最初に利用可能となる言語は、英語と中国語です。 Speech Genieの魔法は、私たちが母国語を自然に身につけたのと同じように、脳が本来持つ能力を活かして言語を学ぶ点にあります。あなたの「Language Parent」となるアバターを使い、エクササイズを通じて、新しい言語の習得という目標に向かって着実に進むことができます。 何百、何千ものフレーズの暗記を必要とする他のシステムとは異なり、あなたの学習の旅は、流暢な会話力を身につけるためにデザインされたコースの上で、まず「音の認識」、次に「モノの認識」、そして「音の生成(発話)」をマスターすることに焦点を当てています。目標は、わずか6ヶ月で流暢な会話力を身につけることです。 私たちのプロジェクトの進捗について、さらに詳しく知りたい方は、製品リリース時にVIPメンバーシップのオプションが付いた、近日公開予定のプログラムにサインアップいただけます。 もっと深く関わってみませんか? ゲーム感覚で楽しめる言語学習システムの実現を目指す、私たちのプロジェクトに参加したい方は、こちらのサイトで進捗状況をご確認いただけます(クリック)。サイトの連絡先リストにメールアドレスを追加して最新情報を受け取るか、VIPメンバーになることも可能です。   「John Ball inside AI」は、読者の皆様に支えられているメディアです。新しい投稿を受け取り、私の活動をサポートするために、無料または有料の読者登録をご検討ください。    

  • What Can AI Truly Understand? – PATOM理論と言語が本当に「意味する」もの

    私は人生のほとんどをひとつの問いに取りつかれたように生きてきました。人間はどうやって言語を理解しているのか。単に聞こえた言葉を繰り返すことでもなく、表面的なパターンを見分けることでもなく、どのようにして言葉を現実世界の意味と結びつけているのか。この根源的な問いがずっと私の中心にあり続けました。専門家に同じ質問を投げかければ十人いれば十二通りの答えが返ってきてもおかしくありません。言語理解とは何か。それを定義しようとするだけで研究者の足元さえ揺らぐほど曖昧で複雑なテーマなのです。 しかし私たち人間にとって理解とはもっと単純です。言葉が意味として心に落ちるその瞬間のことです。意味とは予測するものではなく体験として立ち上がるものです。 人工知能という言葉がバズワードになるよりずっと前から私は記憶の構造や認知のパターン、人間の脳のアーキテクチャについて研究を続けてきました。神経科学、発達心理学、言語学、論理学、数学。そういった分野を横断しながら機械は言語の意味をどのように理解しうるのかという問いを追い続けていたのです。大企業で開発チームを率い複雑なシステムを構築しながらも心の奥には常にこのテーマがありました。 長年の研究の末に私がたどり着いた結論はAI研究者の多くが快く受け入れないものでした。人間の言語能力は統計では説明できないという事実です。ビッグデータに依存しているわけでも次に来る単語を確率的に予測しているわけでもありません。子どもは確率計算などしませんし膨大な文章を読むこともありません。数千の発話を聞き音と意味の対応関係を見つけ脳のパターン構造を使って一般化するだけで母語を獲得していきます。 この観察が私をPATOM理論、Pattern-Oriented Theory of Mindの構築へ導きました。PATOMはニューラルネットワークでもベイズ推論でも統計的なトランスフォーマーでもありません。人間の記憶がどのようにパターンを形成し保存し圧縮し再利用するのかという生物学的仕組みをモデル化した認知アーキテクチャです。パターンが層のように積み重なり意味のネットワークを作り柔軟で創造的な理解力を生み出します。 PATOMを初めてコンピュータ上に実装し、それまで一度も見たことのない文を理解し応答する姿を見た時、私はひとつの境界を越えたと感じました。それは確率ではなく認知によって言語が処理された瞬間でした。言葉から意味への直接的なマッピングが成立した瞬間でした。正しく設計されたパターン理解こそが本物の知能を生み出すと確信しました。 当時AIの世界はより大規模により多くのデータをより多くの計算資源をという方向にひたすら進んでいました。しかし私は繰り返し主張しました。大きさは賢さではないと。オウムは人間の言葉を完璧に模倣できますが意味を理解しているわけではありません。子どもはそれほど多くの言語に触れていなくても「ボール取って」と言われれば正確に意味を理解します。理解の本質はパターンの接地、現実経験との結びつきにあります。接地がなければどれほど流暢に文章を生成できてもそれは理解ではありません。 私は何年にもわたり論文を書き講演を行い多言語を同じ内部パターンで処理できる認知モデルを示しました。英語、中国語、アラビア語、韓国語。どれだけ表現体系が異なっても内部の記憶構造は共通の仕組みで動きます。予測と言語理解の違いを示し脳に近い形で意味が成長し圧縮される様子を説明しました。しかしひとつ欠けていたものがありました。エンジンは完成したのに実社会でその力を発揮する乗り物がなかったのです。 その欠けていたピースを埋めたのがクリス・ロンズデールとの出会いでした。彼は私とは違う角度から同じ問題に挑んでいました。私が機械はどう理解するかを追っていたのに対し彼は人間の脳はどう自然に言語を習得するのかを探究していました。彼の話を聞いた瞬間私は気づきました。彼は私が理論的に構築してきた仕組みを人間の学習環境として実践的に説明していたのです。 意味を中心にした環境、安全で感情的負荷の少ない状態、マルチセンサー入力による深い記憶形成、自然に成長する理解のパターン。私たちは同じコインの両面を見ていました。 クリスは言いました。次の時代の脳ベース言語学習システムを作りたい。学習者にリアルタイムで応答しレベルに合わせて自然に会話を成立させ間違いを恐れず練習できる環境が必要だと。その瞬間私は認知AIが果たすべき役割を理解しました。AIは人間の意図を理解し意味を読み取り自然な方向へ導く認知の橋となるべきなのです。 こうしてSpeech Genieの基盤が生まれました。 Speech Genieはチャットボットではありません。キャラクターをかぶせたLLMでもありません。世界で初めて実用レベルで実装された認知人工知能による言語習得システムです。 Speech GenieのAIは統計的な予測で次の単語を選びません。学習者が何を伝えようとしているのかを理解します。発話のパターンをとらえ文脈を読み取り学習者が処理できるレベルに応じて応答します。母語を学ぶ子どものように新しい言語の意味パターンを脳内に形成できるよう導きます。 多くのAIは流暢に話せるものの自分が何を言っているか理解していないという問題があります。Speech Genieの認知AIは違います。語の関係を理解し意図を推測し学習者が言おうとしている方向へ自然に調整します。間違えても恥ずかしくありません。AIは判断せず理解し学習者に寄り添い自然に導きます。まるで親が子どもの言葉の意味を読み取り自然に正しい表現へ導くように。 人間の脳は言語を扱うとき驚くべき能力を発揮します。無限の表現を丸暗記するのではなくパターンとして圧縮し再利用し限られたデータから無限の生成力を生み出します。PATOM理論はこの仕組みそのものをモデル化しています。そのためSpeech Genieは巨大なデータを必要としません。構造化されたパターンにより学習し適応し創造します。軽量で効率的で安全性も高いのです。意味に基づく理解なのでランダムな幻覚も起きません。 クリスの脳ベース学習と私の認知AI研究が融合したとき最後のピースがはまったような感覚がありました。人間はリラックスした状態で理解可能な入力を聴きマルチセンサーの刺激を通じて自然に言語を習得します。機械は意味を理解し意図に基づいて学習の方向を示します。この相互作用が直感的で自然で安全な学習環境を生み出します。 大人の学習者が言語習得で最もつまずく理由は恐れです。間違える恐れ恥をかく恐れ発音を指摘される不安。これらは脳の柔軟性を奪い新しいパターンの形成を阻害します。しかしSpeech Genieの中ではその恐れが消えます。AIは判断せず理解し文脈に合わせて優しく導くからです。 Speech Genieが返すフィードバックは統計ではなく認知に基づきます。「多くの人が次にこう言いがちだから」ではなく「あなたの意図はこうだと思います、合っていますか」という姿勢から始まります。情報と知能の違い模倣と言語理解の違いはここに現れます。 このプロジェクトを進めるほど私は繰り返し思います。これはAIの世界で初めて意味ベースのモデルを人間の学習に適用する試みだということです。人に賢く見せるためではなく人自身の知性を育てるためのAI。知識ではなく理解を育むためのAI。認知パートナーとして人とともに理解を構築するAIです。 言語は人間にとって世界を広げる最も強力な道具です。新しい言語を習得すれば新しい機会、新しい文化、新しい関係が広がります。言語の力は使うほど豊かになります。Speech Genieはこの成長を自然にそして劇的に加速します。人間の学び方と機械の理解の仕方が初めて本当の意味で溶け合うからです。 なぜ今この技術を世に出すのかと聞かれれば答えは明らかです。準備が整ったからです。認知AIの基盤は完成し意味理解のエンジンは安定しクリスの研究が最適な環境を作りました。私たちは単に言語を教えるだけではなく学びそのものの概念を変えるシステムを作っているのです。 Speech Genieは認知AIの終わりではありません。これは始まりです。機械がデータを吐き出す存在ではなく人間の理解を深める認知のパートナーとなる未来。その第一歩がここから始まります。 この旅に参加するということは単に言語を学ぶのではなく意味を中心に据えた新しい知能観の誕生に立ち会うことです。予測ではなく意味、模倣ではなく理解、相関ではなく認知。Speech Genieは言語を通じてあなた自身の知性を高めるためのツールです。 言語は理解への扉であり理解は知能の基盤であり知能とは意味のパターンから生まれます。Speech Genieはそのパターンをあなたの中に育てていきます。 – John Ball