Daboost / ชัตเตอร์บุ๊ก

กับ ล่าสุดถูกไล่ออกและมีการจ้างใหม่อย่างรวดเร็ว ของ Sam Altman โดย OpenAI การอภิปรายเกี่ยวกับการพัฒนาและการใช้ปัญญาประดิษฐ์ (AI) ได้รับความสนใจอีกครั้ง สิ่งที่ผิดปกติกว่านั้นคือประเด็นสำคัญในการรายงานของสื่อคือความสามารถ ระบบ AI ในการทำคณิตศาสตร์.

เห็นได้ชัดว่าดราม่าบางเรื่องที่ OpenAI เกี่ยวข้องกับการพัฒนาสิ่งใหม่ของบริษัท อัลกอริธึม AI ที่เรียกว่า Q*. ระบบนี้ได้รับการกล่าวถึงว่าเป็นความก้าวหน้าครั้งสำคัญ และคุณลักษณะเด่นประการหนึ่งของมันคือความสามารถในการให้เหตุผลทางคณิตศาสตร์

แต่คณิตศาสตร์ไม่ใช่รากฐานของ AI ใช่ไหม ระบบ AI จะมีปัญหากับการให้เหตุผลทางคณิตศาสตร์ได้อย่างไร ในเมื่อคอมพิวเตอร์และเครื่องคิดเลขสามารถทำงานทางคณิตศาสตร์ได้

AI ไม่ใช่สิ่งเดียว มันเป็นกลยุทธ์ที่ปะติดปะต่อกันในการคำนวณโดยไม่ได้รับคำแนะนำโดยตรงจากมนุษย์ ดังที่เราจะได้เห็นว่าระบบ AI บางระบบมีความสามารถด้านคณิตศาสตร์

อย่างไรก็ตาม หนึ่งในเทคโนโลยีที่สำคัญที่สุดในปัจจุบัน นั่นคือโมเดลภาษาขนาดใหญ่ (LLM) ที่อยู่เบื้องหลังแชทบอท AI เช่น ChatGPT ได้พยายามดิ้นรนเพื่อเลียนแบบการใช้เหตุผลทางคณิตศาสตร์มาจนถึงตอนนี้ เนื่องจากได้รับการออกแบบให้เน้นไปที่ภาษา


กราฟิกสมัครสมาชิกภายในตัวเอง


หากอัลกอริธึม Q* ใหม่ของบริษัทสามารถแก้ปัญหาทางคณิตศาสตร์ที่มองไม่เห็นได้ นั่นก็อาจจะดี จะเป็นความก้าวหน้าครั้งสำคัญ. คณิตศาสตร์เป็นรูปแบบหนึ่งของการใช้เหตุผลของมนุษย์ในสมัยโบราณนั่นเอง โมเดลภาษาขนาดใหญ่ (LLM) จนถึงตอนนี้ก็พยายามดิ้นรนที่จะเลียนแบบ LLM เป็นเทคโนโลยีที่รองรับระบบต่างๆ เช่น ChatGPT ของ OpenAI.

ในขณะที่เขียน รายละเอียดของอัลกอริธึม Q* และความสามารถของมันนั้นมีจำกัด แต่มีความน่าสนใจอย่างมาก ดังนั้นจึงมีรายละเอียดปลีกย่อยต่างๆ ที่ต้องพิจารณาก่อนที่จะถือว่า Q* ประสบความสำเร็จ

ตัวอย่างเช่น คณิตศาสตร์เป็นวิชาที่ทุกคนมีส่วนร่วมในขอบเขตที่แตกต่างกัน และระดับของคณิตศาสตร์ที่ Q* มีความสามารถนั้นยังไม่ชัดเจน อย่างไรก็ตาม มีการตีพิมพ์ผลงานทางวิชาการที่ใช้รูปแบบอื่นของ AI เพื่อพัฒนาคณิตศาสตร์ระดับการวิจัย (รวมถึงบางส่วนที่เขียนเองด้วยและอีกรายการหนึ่งเขียนโดยทีมนักคณิตศาสตร์ร่วมกับนักวิจัยที่ Google DeepMind)

ระบบ AI เหล่านี้สามารถอธิบายได้ว่ามีความสามารถทางคณิตศาสตร์ อย่างไรก็ตาม อาจเป็นไปได้ว่า Q* ไม่ได้ถูกใช้เพื่อช่วยนักวิชาการในการทำงาน แต่มีจุดประสงค์เพื่อจุดประสงค์อื่น

อย่างไรก็ตาม แม้ว่า Q* จะไม่สามารถก้าวข้ามขอบเขตของการวิจัยที่ล้ำสมัยได้ แต่ก็มีแนวโน้มว่าจะพบความสำคัญบางประการในลักษณะที่ถูกสร้างขึ้นซึ่งอาจเพิ่มโอกาสอันยั่วยวนสำหรับการพัฒนาในอนาคต

สะดวกสบายมากยิ่งขึ้น

ในสังคม เรามีความรู้สึกสบายใจมากขึ้นเมื่อมีการใช้ AI ผู้เชี่ยวชาญเพื่อแก้ไขปัญหาประเภทต่างๆ ที่กำหนดไว้ล่วงหน้า ตัวอย่างเช่น, ผู้ช่วยดิจิตอล, การจดจำใบหน้าและ ระบบแนะนำออนไลน์ จะคุ้นเคยกับคนส่วนใหญ่ สิ่งที่ยังคงเข้าใจยากคือสิ่งที่เรียกว่า “ปัญญาประดิษฐ์ทั่วไป” (AGI) ที่มีความสามารถในการให้เหตุผลกว้างๆ เทียบได้กับความสามารถของมนุษย์

คณิตศาสตร์เป็นทักษะพื้นฐานที่เราปรารถนาที่จะสอนให้กับเด็กนักเรียนทุกคน และจะถือเป็นหลักชัยสำคัญในการค้นหา AGI อย่างแน่นอน แล้วระบบ AI ที่มีความสามารถทางคณิตศาสตร์จะช่วยเหลือสังคมได้อย่างไร?

กรอบความคิดทางคณิตศาสตร์มีความเกี่ยวข้องกับการใช้งานที่หลากหลาย เช่น การเขียนโค้ดและวิศวกรรมศาสตร์ ดังนั้นการใช้เหตุผลทางคณิตศาสตร์จึงเป็นทักษะที่สำคัญที่สามารถถ่ายทอดได้สำหรับทั้งมนุษย์และปัญญาประดิษฐ์ ที่น่าประชดประการหนึ่งก็คือ AI อยู่ในระดับพื้นฐานโดยอิงจากคณิตศาสตร์

ตัวอย่างเช่น เทคนิคหลายอย่างที่นำมาใช้โดยอัลกอริธึม AI ท้ายที่สุดแล้วลงไปถึงพื้นที่ทางคณิตศาสตร์ที่เรียกว่า พีชคณิตเมทริกซ์. เมทริกซ์เป็นเพียงตารางตัวเลข ซึ่งมีภาพดิจิทัลเป็นตัวอย่างที่คุ้นเคย แต่ละพิกเซลนั้น ไม่มีอะไรมากไปกว่าข้อมูลตัวเลข.

โมเดลภาษาขนาดใหญ่ก็ถือเป็นแบบจำลองทางคณิตศาสตร์เช่นกัน จากตัวอย่างข้อความจำนวนมาก เครื่องจักรสามารถเรียนรู้ความน่าจะเป็นของคำเหล่านั้นได้ มีแนวโน้มที่จะปฏิบัติตามข้อความแจ้ง (หรือคำถาม) จากผู้ใช้ ไปยังแชทบอท หากคุณต้องการให้ LLM ที่ได้รับการฝึกอบรมล่วงหน้ามีความเชี่ยวชาญในหัวข้อใดหัวข้อหนึ่ง ก็สามารถปรับเปลี่ยนเนื้อหาในวรรณคดีคณิตศาสตร์หรือขอบเขตการเรียนรู้อื่นๆ ได้อย่างละเอียด LLM สามารถสร้างข้อความที่อ่านได้ราวกับเข้าใจคณิตศาสตร์

น่าเสียดายที่การทำเช่นนี้ทำให้เกิด LLM ที่สามารถบลัฟได้ดี แต่มีรายละเอียดไม่ดี ปัญหาคือว่า ตามคำจำกัดความแล้ว ข้อความทางคณิตศาสตร์อาจถูกกำหนดให้เป็นข้อความหนึ่งได้ ค่าบูลีนที่ชัดเจน (นั่นคือจริงหรือเท็จ) การใช้เหตุผลทางคณิตศาสตร์เท่ากับการหักตรรกะของข้อความทางคณิตศาสตร์ใหม่จากข้อความที่สร้างขึ้นก่อนหน้านี้

ผู้สนับสนุนปีศาจ

โดยปกติแล้ว วิธีการใดๆ ก็ตามในการให้เหตุผลทางคณิตศาสตร์ที่อาศัยความน่าจะเป็นทางภาษาจะต้องขับออกนอกเส้นทางของมัน วิธีหนึ่งในการหลีกเลี่ยงสิ่งนี้อาจเป็นการรวมระบบการตรวจสอบอย่างเป็นทางการเข้ากับสถาปัตยกรรม (เช่นเดียวกับวิธีการสร้าง LLM) ซึ่งจะตรวจสอบตรรกะเบื้องหลังการก้าวกระโดดของแบบจำลองภาษาขนาดใหญ่อย่างต่อเนื่อง

เบาะแสที่ทำไปแล้วอาจอยู่ในชื่อ Q* ซึ่งอาจหมายถึงได้ อัลกอริธึมที่พัฒนาขึ้นมาย้อนกลับไปในทศวรรษ 1970 เพื่อช่วยในการให้เหตุผลแบบนิรนัย อีกทางหนึ่ง Q* อาจหมายถึง Q-learning ซึ่งโมเดลสามารถปรับปรุงเมื่อเวลาผ่านไปโดยการทดสอบและให้รางวัลข้อสรุปที่ถูกต้อง

แต่มีความท้าทายหลายประการในการสร้าง AI ที่มีความสามารถทางคณิตศาสตร์ ตัวอย่างเช่น คณิตศาสตร์ที่น่าสนใจที่สุดบางส่วนประกอบด้วยเหตุการณ์ที่ไม่น่าเป็นไปได้สูง มีหลายสถานการณ์ที่ใครๆ ก็คิดว่ามีรูปแบบอยู่โดยอิงจากจำนวนที่น้อย แต่จะพังทลายลงอย่างไม่คาดคิดเมื่อตรวจสอบกรณีและปัญหาที่เพียงพอ ความสามารถนี้เป็นเรื่องยากที่จะรวมเข้ากับเครื่องจักร

ความท้าทายอีกประการหนึ่งอาจทำให้ประหลาดใจ: การวิจัยทางคณิตศาสตร์สามารถสร้างสรรค์ได้สูง ก็ต้องเป็นเช่นนั้นเพราะผู้ปฏิบัติงานจำเป็นต้องคิดค้นแนวคิดใหม่ๆแต่ยังติดอยู่ภายใน กฎเกณฑ์อย่างเป็นทางการของเรื่องโบราณ.

วิธีการของ AI ใดๆ ที่ได้รับการฝึกฝนมาเพื่อค้นหารูปแบบในคณิตศาสตร์ที่มีอยู่แล้วเท่านั้น ไม่น่าจะสร้างคณิตศาสตร์ใหม่ขึ้นมาได้อย่างแท้จริง เมื่อพิจารณาถึงความสัมพันธ์ระหว่างคณิตศาสตร์และเทคโนโลยี สิ่งนี้ดูเหมือนจะขัดขวางแนวคิดเรื่องการปฏิวัติทางเทคโนโลยีใหม่ๆ

แต่ลองเล่นเป็นผู้สนับสนุนปีศาจสักพัก แล้วลองจินตนาการว่า AI จะสามารถสร้างคณิตศาสตร์ใหม่ได้หรือไม่ ข้อโต้แย้งก่อนหน้านี้เกี่ยวกับเรื่องนี้มีข้อบกพร่อง ซึ่งอาจกล่าวได้ว่านักคณิตศาสตร์ที่เป็นมนุษย์ที่เก่งที่สุดก็ได้รับการฝึกอบรมเกี่ยวกับคณิตศาสตร์ที่มีอยู่แล้วโดยเฉพาะเช่นกัน โมเดลภาษาขนาดใหญ่เคยทำให้เราประหลาดใจมาก่อน และจะทำเช่นนั้นอีกครั้งสนทนา

ทอมโอลิเวอร์, อาจารย์ประจำสาขาวิชาวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์ มหาวิทยาลัยเวสต์มิ

บทความนี้ตีพิมพ์ซ้ำจาก สนทนา ภายใต้ใบอนุญาตครีเอทีฟคอมมอนส์ อ่าน บทความต้นฉบับ.