การประชุมทางภาษาศาสตร์: RRG 2025
การประชุมทางภาษาศาสตร์ที่เมืองโกเบ ประเทศญี่ปุ่น เพิ่งเสร็จสิ้นไปครับ ผู้เชี่ยวชาญด้านภาษาศาสตร์จากทั่วโลกได้นำเสนอความคืบหน้าของงานวิจัยเป็นภาษาอังกฤษตลอด 2 วันเต็ม โดยครอบคลุมภาษาที่หลากหลาย เช่น ญี่ปุ่น, ไต้หวัน, กวางตุ้ง, เบรอตง, เวียดนาม, เยอรมัน, แมนดาริน, ภาษาต่างๆ ในเม็กซิโก, ภาษามือไต้หวัน และภาษาต่างๆ ในแอฟริกาอีกมากมาย ทุกท่านต่างใช้ RRG เป็นโมเดลในการสื่อสาร ผู้พัฒนาหลัก Robert D. Van Valin, Jr. ได้ทำงานและขยายชุมชนระดับโลกนี้มาอย่างต่อเนื่องตั้งแต่ช่วงต้นทศวรรษ 1980
สิ่งที่ทำให้ผลงานของ Van Valin มีความสำคัญอย่างยิ่งในศตวรรษที่ 20 และ 21 ก็คือการนำโมเดลที่ คำในภาษาเชื่อมโยงกับความหมายของมัน ด้วยอัลกอริทึมเพียงหนึ่งเดียว โดยไม่ขึ้นอยู่กับว่าเป็นภาษาใด มาปรับใช้ครับ แม้ว่าทุกภาษาจะแตกต่างกันทั้งในด้านคำศัพท์ วลี การเขียน และการออกเสียง แต่ก็น่าทึ่งมากที่โมเดลเพียงหนึ่งเดียวนี้สามารถอธิบายลักษณะร่วมของภาษาทั้งหมดได้
ในมุมมองของผม การนำเสนอที่ถือเป็นความก้าวหน้าครั้งสำคัญของปีนี้อยู่ในบทความเรื่อง “Towards a new representation of discourse in RRG” โดย Balogh, Bentley และ Shimojo ซึ่งได้รับการสนับสนุนอย่างแข็งขันจากการนำเสนอหลักของ Van Valin ในหัวข้อ “Information Structure and Argument Linking Reconceived” ซึ่งเป็นช่วงปิดท้ายการประชุมครับ
โมเดลที่ก้าวล้ำ
โมเดล RRG ใหม่ที่ใช้อธิบายเรื่องปริจเฉท (discourse) นั้นดูสมเหตุสมผล แต่สิ่งสำคัญในทางวิทยาศาสตร์คือการทำให้การสังเกตการณ์สอดคล้องกับโมเดล แล้วจึงทำการคาดการณ์ที่ตรงกับการทดลอง ในกรณีนี้ แผนภาพต่อไปนี้ถูกเสนอในบทความแรก และได้รับการยืนยันด้วยหลักฐานจากการทดลองในบทความที่สองซึ่งเป็นการนำเสนอหลักครับ
รูปที่ 1 ด้านล่างแสดงการเปลี่ยนแปลงของโมเดลครับ
นี่คือความก้าวหน้าทางวิทยาศาสตร์ครับ และในการใช้งาน AI ของผมนั้น ผมยังไม่ได้ตรวจสอบโมเดลใหม่อย่างละเอียดว่ามันจะนำไปปรับใช้กับเอนจิ้นการสนทนาที่มีอยู่ได้อย่างไร แต่ผมมั่นใจว่ามีข้อแตกต่างที่สำคัญบางอย่างในบทความที่สามารถนำมาประยุกต์ใช้ได้แน่นอน
ในฐานะข้อเสนอใหม่ Van Valin ได้ให้การสนับสนุนโมเดลนี้อย่างมากในบทสรุปของเขาครับ:
“Balogh, Bentley & Shimojo ได้เสนอแนวทางใหม่ในการทำความเข้าใจปฏิสัมพันธ์ระหว่างวากยสัมพันธ์ (syntax), อรรถศาสตร์ (semantics) และปริจเฉท-วัจนปฏิบัติศาสตร์ (discourse pragmatics) ใน RRG ในการบรรยายวันนี้ ผมได้พยายามต่อยอดจากงานของพวกเขา เพราะผมรู้สึกว่าแนวทางของพวกเขาน่าสนใจมากและเสนอทางแก้ปัญหาเกี่ยวกับการใช้ DRSs เพื่อแทน ICG ใน RRG ที่พวกเขาได้หยิบยกขึ้นมา”
ในทางปฏิบัติ มันอธิบายการสังเกตการณ์ที่รู้จักกันดีในภาษาได้เป็นอย่างดี เช่น ความหมายของคำว่า ‘Mary did too’ ในประโยค:
“John ate a chocolate. Mary did, too.”
คำตอบ: “Mary ate chocolate, also.” (แมรี่ก็กินช็อกโกแลตด้วย)
การประยุกต์ใช้การทำงานของสมองเพื่อตอบคำถามอัตโนมัติ
การบรรยายของผมได้สานต่องานของผมในการอธิบายทฤษฎีสมอง Patom ครับ การมีโมเดลสมองที่ไม่ใช่การคำนวณเป็นพื้นฐานได้ชี้แนวทางแก้ไขปัญหาทางวิทยาศาสตร์ที่ยังไม่คลี่คลายอีกหลายข้อ เช่น:
-
มนุษย์เข้าใจความหมายของคำในภาษาได้อย่างไรโดยไม่จำเป็นต้องใช้เสิร์ชเอนจิ้น
-
ทำไมการเรียนรู้ภาษาถึงสามารถเร่งความเร็วได้ด้วยแบบฝึกหัดที่เสนอโดยนักจิตภาษาศาสตร์ Chris Lonsdale เพื่อช่วยให้ผู้ใหญ่เรียนรู้ภาษาเพิ่มเติม
-
อะไรคือสิ่งที่ขาดหายไปซึ่งเป็นอุปสรรคต่อความก้าวหน้าในด้านที่สำคัญของ AI มาตั้งแต่ทศวรรษ 1950
-
และ RRG ทำงานร่วมกับระบบที่เราสร้างขึ้นที่ Pat Labs ในออสเตรเลียได้อย่างไร โดยมีข้อแตกต่างที่สำคัญบางประการ เช่น โมเดลทางวากยสัมพันธ์ การนำไปใช้อรรถศาสตร์ และกลยุทธ์ในการสร้าง AI ที่ใช้ภาษาแห่งยุคถัดไป (Next Generation of language-based AI)
การบรรยายฉบับเต็ม 45 นาทีของผมพร้อมช่วงถามตอบ สามารถรับชมได้บน YouTube ที่นี่ครับ.
ผมจะขอสรุปภาพรวมของแต่ละประเด็นเหล่านี้ตามลำดับนะครับ
ทำไมเราถึงไม่ต้องการเสิร์ชเอนจิ้นในสมอง? มีอะไรผิดปกติในวงการ AI?
ทฤษฎี Patom สร้างแบบจำลองสมองให้เป็นหน่วยจับคู่รูปแบบ (pattern-matching) ซึ่งรูปแบบใดๆ จะถูกจัดเก็บได้เพียงครั้งเดียวในฐานะอะตอมของรูปแบบนั้น ในทางภาษา นี่หมายความว่ามีตัวแทนสำหรับตัวอักษร ‘c’ เพียงหนึ่งเดียวเท่านั้น เป็นต้น ไม่ต้องกังวลนะครับ มีรูปแบบภาพมากมายที่สามารถเชื่อมโยงกับรูปแบบระดับสูงเพียงหนึ่งเดียวนี้ได้ รูปภาพเหล่านั้นทั้งหมดล้วนหมายถึง ‘ตัวอักษร c’ ครับ
AI ยังไม่ก้าวหน้าไปมากนักเมื่อเทียบกับเป้าหมายที่ตั้งไว้ในทศวรรษ 1950 ดังจะเห็นได้จากการที่ยังไม่มีหุ่นยนต์เดินไปมาทำสิ่งต่างๆ ให้เรา หุ่นยนต์ที่ทำความสะอาด ขับรถ และทำงานฝีมือหรืองานที่ต้องใช้ทักษะของมนุษย์อยู่ที่ไหนกันครับ? หุ่นยนต์ที่พูดคุยกับเราได้ทุกภาษาและเข้าใจสิ่งที่เราต้องการอยู่ที่ไหน?
Generative AI เช่น ChatGPT และอื่นๆ ยังขาดองค์ประกอบสำคัญจากภาษาศาสตร์ ส่งผลให้มีการใช้พลังงานอย่างสิ้นเปลืองและสิ้นเปลืองมากในการขับเคลื่อน GPU และจำเป็นต้องมีศูนย์ข้อมูลเพื่อทำงานทางสถิติที่จำเป็นสำหรับการออกแบบของ Generative AI ครับ
วิศวกรรม Generative AI พร้อมที่จะถูกแทนที่แล้วครับ โซลูชันอย่างของผมที่สามารถทำงานบนแล็ปท็อป นาฬิกา หรือโทรศัพท์มือถือ ได้รับการสนับสนุนจากผู้เชี่ยวชาญด้านแมชชีนเลิร์นนิงและ AI ที่มองเห็นข้อจำกัดของ Generative AI
ความคืบหน้าด้านการเรียนรู้ภาษา
ประกาศเปิดตัวผลิตภัณฑ์ ‘Speech Genie’ ครับ! Speech Genie จะสานต่องานที่ได้พิสูจน์แล้วว่าสามารถช่วยให้ผู้เรียนภาษาอังกฤษประสบความสำเร็จได้จริง หากต้องการติดตามความคืบหน้าของเรา สามารถเข้าไปที่เว็บไซต์ใหม่ของ Speech Genie ได้ที่นี่เลยครับ (คลิก)
Speech Genie กำลังเตรียมสร้างผลิตภัณฑ์ใหม่ที่จะสานต่องานซึ่งได้รับการพิสูจน์ประสิทธิภาพมาแล้วสำหรับผู้เรียนภาษาอังกฤษ และในครั้งนี้ จะมีการนำระบบของ Pat Labs ที่ผมพัฒนามาตั้งแต่ช่วงต้นยุค 2000 เข้ามาผสมผสานด้วยครับ เอนจิ้น AI จะช่วยให้สามารถสร้างประโยคตามความต้องการของนักพัฒนาคอร์สเรียนเพื่อโต้ตอบกับความก้าวหน้าของผู้ใช้ โดยไม่ต้องกังวลว่าตัวอย่างประโยคเหล่านั้นจะไม่ถูกต้อง
การผสมผสานเทคนิค AI เข้ากับวิทยาศาสตร์ทางภาษาศาสตร์ของ RRG นี้ จะช่วยให้เราสามารถทดสอบข้อสังเกตที่มีมาอย่างยาวนานเกี่ยวกับความสามารถของผู้ใหญ่ในการเรียนรู้ภาษาเพิ่มเติม และสานต่อเป้าหมายมาตรฐานของเราที่ว่า:
“เรียนรู้ภาษาใดก็ได้ใน 6 เดือน!”
อะไรคือสมมติฐานของผมเกี่ยวกับความก้าวหน้าที่หยุดชะงักของ AI?
การขาดความก้าวหน้าทางวิทยาศาสตร์สมองได้เป็นอุปสรรคต่อทุกแง่มุมของ AI เนื่องจากการใช้โมเดลคอมพิวเตอร์มาพร้อมกับข้อจำกัดพื้นฐานสำหรับการจำลองสมองทางชีวภาพ แม้แต่สัตว์ในยุคแรกๆ อย่างปลาก็สามารถจัดการกับวัตถุที่รับรู้ได้หลายประสาทสัมผัสในบริบทต่างๆ ได้ ทักษะดังกล่าวช่วยให้ผู้ล่าและเหยื่ออยู่รอดและสืบพันธุ์สิ่งมีชีวิตที่ดีที่สุดได้
ในวิดีโอของผม ผมได้แสดงให้เห็นถึงความแตกต่างอย่างมากระหว่างหุ่นยนต์สองขาในปัจจุบันกับสัตว์อย่างสุนัข สุนัขมีความสามารถที่น่าทึ่งในการควบคุมการเคลื่อนไหวและการติดตามวัตถุ ในขณะที่หุ่นยนต์ดูไม่เสถียรและเคลื่อนไหวช้า
การพัฒนาการควบคุมทางประสาทสัมผัสและการเคลื่อนไหว เช่นเดียวกับโมเดลสมองอย่างทฤษฎี Patom มีแนวโน้มที่จะช่วยให้สามารถบูรณาการเข้ากับหุ่นยนต์ในอนาคตเพื่อรองรับการจำลองภาษาของมนุษย์ได้เช่นกันครับ
RRG ให้อะไรกับเราในการสนทนาบ้าง?
ระบบและการสาธิตในวิดีโอที่เกี่ยวข้องใช้พื้นฐานของ RRG ในการจดจำคำในภาษาและจับคู่กับตัวแทนทางความหมายในบริบทโดยใช้พจนานุกรม เช่นเดียวกับศาสตร์แห่งสัญญะหรือสัญศาสตร์ (semiotics) ระบบจะแปลงจากข้อความเป็นความหมาย และในทางกลับกัน จากความหมายเป็นข้อความครับ
มันใช้ประโยชน์จากสิทธิบัตรล่าสุดของผมที่อธิบายกลไกในการทำสิ่งนี้อย่างมีประสิทธิภาพบนระบบคอมพิวเตอร์ครับ
ในขณะที่ระบบ Generative AI ในปัจจุบันไม่ได้นำแนวคิดเรื่อง Immediate Common Ground (ICG) หรือพื้นความเข้าใจร่วมกันในปัจจุบันขณะมาใช้ ซึ่งเป็นแนวคิดของการสนทนาในบริบทปัจจุบันเท่านั้น การเพิ่มองค์ประกอบสำคัญนี้เข้าไปมีแนวโน้มที่จะสร้าง AI ยุคถัดไปที่ใช้ความหมายของภาษา ซึ่งในหลายกรณีอาจต้องการความรู้ที่จำกัดมากเท่านั้นครับ
ในการบรรยายของผม ได้มีการพูดคุยถึงการปรับแนวทางต่างๆ ระหว่างวิทยาศาสตร์ RRG และปฏิสัมพันธ์กับโมเดลความหมายที่อิงตามความหมายของคำ (word-sense-based semantic model) ครับ
บทสรุป
การประชุม RRG ในปีนี้เป็นงานที่น่าทึ่งมากครับที่ได้เข้าร่วม
ห้องที่เต็มไปด้วยผู้เชี่ยวชาญด้าน RRG พร้อมงานวิจัยเฉพาะทางเกี่ยวกับภาษาแม่ของตนเอง ภาษาอื่นๆ และภาษาที่ใกล้สูญพันธุ์ หมายถึงความหลากหลายของรูปแบบและการวิเคราะห์ที่เปิดหูเปิดตาอย่างมากครับ
เป็นเรื่องน่าเสียดายที่ต้องจากประเทศญี่ปุ่นที่ยอดเยี่ยมและความงดงามตระการตาของเมืองต่างๆ ที่เราไปเยือน ทั้งโกเบ โตเกียว และชิโมดะ
แต่ความก้าวหน้าทางวิทยาศาสตร์ RRG ก็นำไปสู่ก้าวต่อไป ซึ่งสำหรับผมแล้วคือการนำ ระบบการเรียนรู้ภาษา ที่จะใช้ประโยชน์จากบริการ AI ที่ผมดูแลมาเป็นเวลานาน ออกสู่เชิงพาณิชย์ครับ
และทางเลือกใหม่นอกเหนือจาก AI ที่มีข้อผิดพลาดง่ายในปัจจุบันอย่าง ChatGPT ก็มีแนวโน้มที่จะลดความจำเป็นในการสร้างศูนย์ข้อมูลทุกหนทุกแห่ง ซึ่งจะเพิ่มความต้องการไฟฟ้าและน้ำอย่างมหาศาล เพื่อมาใช้ AI ที่ใช้พลังงานต่ำและมีความแม่นยำแทนครับ
แทนที่จะต้องรันแมชชีนเลิร์นนิงราคาแพง AI ที่มีพื้นฐานจากวิทยาศาสตร์การรู้คิด (cognitive science) จะนำโมเดล RRG และโมเดลอื่นๆ มาใช้เพื่อนำเครื่องมือที่สำคัญมากมายออกสู่ตลาดโดยใช้ภาษาของมนุษย์ครับ
อยากมีส่วนร่วมมากขึ้นไหมครับ?
หากคุณอยากมีส่วนร่วมกับโปรเจกต์ใหม่ของเราที่จะสร้างระบบเรียนรู้ภาษาในรูปแบบเกม สามารถติดตามความคืบหน้าได้ที่เว็บไซต์นี้เลยครับ (คลิก) คุณสามารถรับข่าวสารได้โดยการเพิ่มอีเมลของคุณในรายชื่อผู้ติดต่อบนเว็บไซต์นั้นครับ
อยากอ่านเพิ่มเติมไหมครับ?
หากคุณต้องการอ่านเกี่ยวกับการประยุกต์ใช้วิทยาศาสตร์สมองกับปัญหาของ AI คุณสามารถอ่านหนังสือเล่มล่าสุดของผม “How to Solve AI with Our Brain: The Final Frontier in Science” เพื่อทำความเข้าใจแง่มุมต่างๆ ของวิทยาศาสตร์สมองที่เราสามารถนำมาประยุกต์ใช้ได้ และเหตุผลที่ว่าทำไมการเปรียบเทียบที่ดีที่สุดในปัจจุบันคือสมองในฐานะเครื่องจับคู่รูปแบบ (pattern-matcher) ลิงก์หนังสือบน Amazon ในสหรัฐอเมริกา (และที่อื่นๆ) อยู่ที่นี่ครับ
ในดีไซน์ปกด้านล่างนี้ คุณจะเห็นสมองของมนุษย์ที่รวมเอาประสาทสัมผัสต่างๆ เช่น ดวงตา เข้าไว้ด้วยกัน การทำงานของสมองกำลังถูกนำไปประยุกต์ใช้กับหุ่นยนต์ที่คล้ายมนุษย์ซึ่งกำลังได้รับการพัฒนาด้วยวิทยาศาสตร์สมองเพื่อมุ่งสู่การจำลองมนุษย์อย่างสมบูรณ์ทั้งในด้านรูปลักษณ์และความสามารถครับ

