ทำไมระบบโครงข่ายประสาทเทียมถึงยังไม่เข้ามาแทนคน? ในโลกของ AI เครื่องควรเลียนแบบสิ่งที่เราทำ ไม่ใช่แค่คำนวณสถิติ

เราจะทำอะไรได้บ้างด้วย “การทดลองทางความคิด” เพื่อพัฒนา AI ของเรา? ภาพถ่ายโดย Kazi Mizan บน Unsplash
ความก้าวหน้าใน AI และ AGI ถูกนำไปใช้ในองค์กรค่อนข้างช้า เพราะ generative AI ในวันนี้ยังทำงานไม่ได้อย่างที่ผู้บริหารบิ๊กเทคหลายคนคาดการณ์ไว้ เราถูกเล่า “เรื่องแฟนตาซี” ว่าอีกไม่นานวิทยาศาสตร์ทั้งหมดจะถูกแก้ได้ด้วยเครื่องจักรที่ไปกวาดสถิติจากงานวิจัยที่มีอยู่แล้ว
แต่ถ้างานวิจัยทางวิทยาศาสตร์มีคำตอบของวิทยาศาสตร์ในอนาคตอยู่แล้ว เราจะได้ประโยชน์อะไรจาก AI ในเมื่อวิทยาศาสตร์นั้น ถูกเขียนไว้แล้ว? AI ในวันนี้ชัดเจนว่ายังขาดชิ้นส่วนสำคัญ—ความเข้าใจว่าโลกทำงานอย่างไรในความสมจริงแบบหลายประสาทสัมผัส และปฏิสัมพันธ์ระหว่างสิ่งที่มองเห็นกับสิ่งที่จินตนาการ
กาลิเลโอไม่ได้เขียนว่า ดาวเคราะห์ในระบบสุริยะมีดวงจันทร์เหมือนโลก เพราะไปอ่านจากหนังสือ แต่เพราะเขาเห็นมันผ่านกล้องโทรทรรศน์ที่เขาสร้างเอง จากนั้นเขาก็บันทึกสิ่งที่สังเกตได้จากกล้องคืนแล้วคืนเล่า จนค้นพบ “รูปแบบ” ขึ้นมา! แบบจำลองของเขาเกิดจากสมองของเขาเอง โดยเอาแนวคิดเรื่องโลกกับดวงจันทร์ของเรา มาผสานกับสิ่งที่เขาสังเกตจากดาวพฤหัสบดีและจุดเล็ก ๆ ที่โคจรรอบมัน แบบจำลองสุริยศูนย์กลางของโลกเกิดจากการวิเคราะห์การสังเกตแบบนี้ ไม่ใช่แค่จากการ อ่าน งานของคนอื่น
เป้าหมายวันนี้ – แบบจำลองสมองที่ดีที่สุด
วันนี้ผมจะนำเสนอทฤษฎี Patom ซึ่งเป็นแบบจำลองสมองที่อธิบายว่าเมื่อสมองเสียหายแล้วจะเกิดอะไรขึ้นตามมา ผมจะใช้คำพูดอ้างอิงจากตอนเปิดตัวทฤษฎีนี้
สิ่งนี้จะปูทางให้การวิเคราะห์ในครั้งหน้า สำหรับการวิเคราะห์ประโยคของผมว่า: “ใบหน้าของแม่คุณ” ซึ่งแสดงความสามารถโดยกำเนิดของเราในการทำ “เวทมนตร์” ส่วนใหญ่ที่เราเห็นในภาษามนุษย์ ในวิทยาศาสตร์ เราควรโฟกัสการศึกษาที่ “คำถามที่ถูกต้อง” ครับ
สมองไม่ใช่คอมพิวเตอร์
ตั้งแต่ทศวรรษ 1970 หลายสาขาวิทยาศาสตร์เริ่มเอนเอียงจากแบบจำลองที่โฟกัสรายละเอียดเฉพาะของสิ่งที่ศึกษา ไปสู่แบบจำลองที่โฟกัสเรื่อง การคำนวณ รางวัลและการยกย่องระดับสูงมักตกเป็นของผู้นำที่ตั้งชื่อภาควิชาใหม่ ๆ เช่น ภาษาศาสตร์เชิงคำนวณ (Computational Linguistics), ประสาทวิทยาศาสตร์เชิงคำนวณ (Computational Neuroscience) และแม้แต่จิตวิทยาเชิงคำนวณ (Computational Psychology) ยังมีการผสานสาขาวิทยาศาสตร์กับวิศวกรรมเข้าด้วยกันด้วยชื่ออย่าง “Computational Science and Engineering (CSE)!”
แนวทางที่ดีกว่า: มนุษยชาติควรเรียนรู้ที่จะทำให้วิทยาศาสตร์เดินหน้าต่อไป จนกว่าทางเลือกอื่น ๆ จะได้รับการพิสูจน์
แนวคิดเดิมของแมชชีนเลิร์นนิง (ML) นำไปสู่ดีพเลิร์นนิง และนำไปสู่โมเดลภาษาขนาดใหญ่ (Large Language Models) โมเดลทั้งหมดนั้นอาศัย ML แต่ผมจะให้คุณเห็นว่านี่ไม่ใช่วิธีที่สมองมนุษย์หรือสัตว์ทำงาน เรามีเหตุผลที่ดีกว่าแค่คำพูดว่า “สมองคือคอมพิวเตอร์”
วันนี้เราจะเห็นว่าเหตุใด ML จึงไม่ใช่แบบจำลองที่เหมาะสำหรับ AI หรือ AGI และแบบจำลองเชิงแข่งขันของทฤษฎี pattern-atom หรือทฤษฎี Patom เริ่มอธิบายการทำงานของสมองได้อย่างไร โดยไม่ต้องใช้คำเปรียบเทียบ “คอมพิวเตอร์ดิจิทัล” มาบดบังการตัดสินของเรา
สมองสัตว์ – เกิดมาเพื่อวิ่ง
อิมพาลาในสภาพแวดล้อมแอฟริกาสามารถยืนได้ภายในราว 10 นาทีหลังคลอด และตามแม่ได้ทันภายในประมาณ 30 นาที พวกมันไม่มีชุดข้อมูลฝึก (training datasets) การเอาชีวิตรอดต้องอาศัยโชคเล็กน้อยในชั่วโมงแรก ๆ หลังเกิด แต่ลูกแรกเกิดก็เปลี่ยนตัวเองอย่างรวดเร็วเป็นสัตว์ที่กระโดดและสปรินต์ได้ จนหนีผู้ล่าได้
ไม่ได้ใช้ ML แทบไม่มีโอกาสให้ “เรียนรู้” ว่ากล้ามเนื้อและเซนเซอร์ของตัวเองทำงานอย่างไรเพื่อควบคุมร่างกายให้ทำความสามารถสุดทึ่งอย่างการกระโดดและการสปรินต์ที่จำเป็นต่อการอยู่รอด ความสามารถจำนวนมากมาจากพันธุกรรม
ในทำนองเดียวกัน สมองมนุษย์ใช้พันธุกรรมเพื่อเอื้อให้เราสื่อสารและเอาตัวรอด โดยไม่ต้องถูกสอนว่าควรจำแนกวัตถุอย่างไร สมองเราก็ทำได้ และสมองเรายังสามารถติดป้ายชื่อให้วัตถุซับซ้อนที่มาจากหลายประสาทสัมผัสได้อย่างเป็นธรรมชาติ พร้อมทั้งบรรยายสถานการณ์ที่ไม่เคยเห็นมาก่อนได้—ด้วยการผสม “ความประทับใจ/ร่องรอยประสบการณ์” (สิ่งที่เราเคยเจอ) เข้ากับ “ความคิด” (ชิ้นส่วนของประสบการณ์ที่ถูกนำมาจัดเรียงใหม่ในรูปแบบใหม่)
สมองทำงานอย่างไรจากมุมมองภายใน
ประสบการณ์ส่วนตัวของเราต่อโลกเป็นเรื่องอัตวิสัย แต่มันให้ข้อมูลเชิงสังเกตที่หนักแน่นในเชิงวิทยาศาสตร์ ความสามารถที่เกิดจากประสบการณ์เหล่านี้สามารถใช้ช่วยสนับสนุนแบบจำลองได้ และจากนั้นเราก็ทดสอบแบบจำลองกับปัญหาอื่น ๆ เพื่อสนับสนุนหรือหักล้างมัน
การทดลองทางความคิดในยุค 1990
เพื่อแนะนำทฤษฎี Patom ซึ่งเป็นแบบจำลองสมองเชิงทฤษฎี ผมเขียนการทดลองทางความคิดต่อไปนี้ให้กับสถานีวิทยุ ABC ของออสเตรเลีย (รายการ Ockham’s Razor)
เริ่มจากเรื่องการเรียนรู้—หรือการสอนสมองของเราให้รู้บางอย่าง มันคืออะไรกันแน่?
“เครือข่าย” ของสมองมนุษย์
เรามักได้ยินว่า โครงข่ายประสาทเทียม อยู่เบื้องหลัง AI แต่สิ่งนั้นคือโครงข่ายประสาทเทียมแบบประดิษฐ์ (ANNs) ที่ “ได้แรงบันดาลใจ” จากสมองมนุษย์ (ซึ่ง ANNs ไม่ได้เหมือนสมองในหลายประเด็นสำคัญ)
แล้ว “เครือข่าย” ของสมองกำลังทำอะไรอยู่กันแน่? แบบจำลองหนึ่งบอกว่ามันกำลังทำงานแบบเดียวกับที่คอมพิวเตอร์ดิจิทัลทำ เพียงแต่ทำในวิธีที่เราแทบจินตนาการไม่ออก ราวกับว่ามีโปรแกรมถูกเขียนไว้ในสมองเพื่อควบคุมทุกอย่าง! แต่สมองเริ่มต้น—เหมือนลูกอิมพาลาแรกเกิด—ด้วยการเคลื่อนไหว
และอย่าลืมว่า ความสามารถด้านการเคลื่อนไหวของสัตว์นั้นเหนือกว่าหุ่นยนต์ยุคปัจจุบันทั้งหมดมาก นี่คืออุปมาของผมเรื่องการเรียนรู้วงสวิงกอล์ฟจาก Ockham’s Razor:
“ถ้าผมกำลังตีลูก สมองของผมกำลังเก็บรูปแบบที่จำเป็นต่อการขยับกล้ามเนื้อจำนวนมากของผมให้ถูกทาง เราทำซ้ำการกระทำเพื่อปรับสภาพรูปแบบเหล่านั้น โดยปกติเราจะพูดว่าเรากำลังเรียนรู้ที่จะตีลูก แน่นอน ไม่ใช่ว่าเรากำลังสอนสมองให้จำลำดับการขยับกล้ามเนื้อ”
ลองคิดดูสักครู่ แค่การเหวี่ยงไม้—อาจทำตามคำแนะนำด้วยคำพูดจากโค้ช—และฝึกปรับเทคนิคด้วยการท่องจำซ้ำ ๆ สมองของเราต้องสั่งการให้เกิดการหดและคลายกล้ามเนื้อจำนวนมหาศาล ในขณะที่ร่างกายรักษาสมดุลและปรับแก้ไปเอง โดยไม่เคยถูกสอนอย่างชัดเจนเลยว่าต้องทรงตัวยังไง
ในมนุษย์ การเรียนรู้อาจมองได้ว่าเป็นการเก็บรูปแบบจำนวนมหาศาลที่ประกอบด้วยกล้ามเนื้อทั้งหมดของเรา หรือแบบจำลองที่ง่ายกว่านั้น แต่ไม่อาจเป็น โปรแกรมในสมอง ได้ เพราะสมองของเราช้าเกินกว่าจะสร้างช่วงการเคลื่อนไหวของกล้ามเนื้อแบบเรียลไทม์ได้โดยไม่มีประสบการณ์มาก่อน สิ่งนั้นเรียกว่า ballistic motion
ทีนี้เข้าสู่ การทดลองทางความคิดจริง ๆ ถ้าเรานั่งอยู่ “ข้างในสมอง” ตรงจุดที่มันเชื่อมกับไขสันหลังเพื่อควบคุมและรับความรู้สึกจากร่างกาย เราจะเห็นอะไร?
“ลองจินตนาการว่าคุณนั่งอยู่ข้างในสมองของคุณ ขณะที่แขนของคุณขว้างลูก การขยับแขนจะสร้างชุดรูปแบบของสัญญาณที่ส่งมาจากเส้นประสาทรับความรู้สึกในแขนของคุณ เซลล์ประสาทรับความรู้สึกที่เชื่อมกับกล้ามเนื้อในแขนจะยิงสัญญาณเมื่อแขนเคลื่อนไหว นั่นคือหน้าที่ของมัน ถ้าคุณเก็บรูปแบบเหล่านี้ไว้ในสมอง คุณก็สามารถเล่นซ้ำการเคลื่อนไหวได้ โดยกระตุ้นรูปแบบเดิมผ่านเซลล์ประสาทสั่งการของคุณ”
สังเกตว่าในการทดลองทางความคิดของเรา มีเซนเซอร์หลากหลายชนิดในร่างกายที่ให้ฟีดแบ็กเฉพาะทาง ขณะที่กล้ามเนื้อถูกขยับไปพร้อม ๆ กัน
“พูดอีกแบบคือ ขณะที่คุณนั่งอยู่ในสมองและรับรูปแบบสัญญาณจากประสาทสัมผัส คุณแค่ต้องบันทึกลำดับและจังหวะเวลาของสัญญาณไว้ ต่อมา ถ้าคุณอยากทำการเคลื่อนไหวเดิมซ้ำ ก็เพียง ‘เล่นย้อน’ รูปแบบนั้นด้วยเซลล์ประสาทสั่งการที่ควบคุมกล้ามเนื้อแขน นี่คือการจับคู่รูปแบบ ไม่ใช่การประมวลผล สมองเรียนรู้ด้วยการลงมือทำ ตอนเป็นเด็ก เราใช้เวลามากกับการขยับทั้งตัวเราเองและวัตถุรอบ ๆ ตัว สิ่งนี้สอนสมองให้รู้ลำดับสำคัญของกล้ามเนื้อ การมองเห็น และการได้ยิน ที่เราใช้ไปตลอดชีวิต ผมเรียกการจับคู่รูปแบบนี้ว่า ‘การเรียนรู้’”
ตอนนี้ อุปมานี้ใช้ได้กับหน้าที่บางอย่างของเซลล์สมองเรา แต่อาจไม่ใช่ทั้งหมด แนวคิดเรื่องการกระตุ้นกล้ามเนื้อด้วยสัญญาณไฟฟ้า-เคมีคือสิ่งที่เรามีให้ใช้เป็นฐาน และจังหวะเวลาของการกระตุ้นเหล่านั้นเป็นรูปแบบที่ซับซ้อนพอสมควร ซึ่งต้องอาศัยการสั่งให้กล้ามเนื้อจำนวนมากหดและคลายตามเวลา
แม้แต่การผลิตเสียงพูดก็เดินตามระบบนี้ เพราะต้องใช้ชุดการควบคุมกล้ามเนื้อเป็นลำดับ แต่เรายังต้องขุดลึกกว่านี้
ครั้งหน้า
ในบทความถัดไปของผม วลี “ใบหน้าของแม่คุณ” จะเป็นเวทีที่ยอดเยี่ยมมากในการอธิบายว่าสมองของเราทำงานอย่างไรให้สอดคล้องกับสิ่งที่เราพูด สิ่งที่เราได้ยิน และวิธีที่เราเข้าใจมัน ภาษาไม่ได้เริ่มจากคำศัพท์ แต่มาจากสมองของเรา และเหมือนลูกอิมพาลาแรกเกิด เรามีคลังความสามารถอันทรงพลังที่ช่วยให้เราอยู่รอด—ตั้งแต่นิ้วมือข้างละ 5 นิ้วที่ใช้หยิบจับเครื่องมือ ไปจนถึงการเดินสองขาที่ทำให้มือของเราว่าง และไปจนถึงภาษาที่ทำให้เราทำสิ่งที่เทียบไม่ได้ แต่เรื่องนั้นไว้ครั้งหน้าครับ

