Image by Matheus Bertelli, from Pexels

AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง

Reading Time: 1 min

First published Apr 8, 2025

Updated 2 times since publishing

Written by: Kiara Fabbri อดีตนักเขียนข่าวทางด้านเทคโนโลยี
Translated by ทีมแปลภาษา ทีมแปลภาษาและบริการแปลภาษา

สตาร์ทอัพจีน DeepSeek ร่วมกับมหาวิทยาลัย Tsinghua กล่าวว่า พวกเขาได้พัฒนาวิธีที่ฉลาดขึ้นในการช่วยให้โมเดลปัญญาประดิษฐ์คิดได้ดียิ่งขึ้นและเร็วขึ้น โดยไม่จำเป็นต้องใช้คอมพิวเตอร์ขนาดใหญ่หรือทรัพยากรที่มีราคาแพง

รีบหรือเปล่า? นี่คือข้อมูลสำคัญๆที่คุณควรทราบ:

DeepSeek สร้าง AI ที่สามารถปรับปรุงตัวเองด้วยวิธี Self-Principled Critique Tuning (SPCT).
SPCT สอนให้ AI พิจารณาผลงานของตัวเองโดยใช้กฎที่สร้างขึ้นด้วยตัวเอง.
วิธีนี้ส่งเสริมการทำงานที่มีประสิทธิภาพโดยไม่ต้องใช้พลังการคำนวณที่มากมาย.

การทะลุผ่านมาจากเทคนิคใหม่ที่เรียกว่า Self-Principled Critique Tuning (SPCT) หรือการปรับแต่งตามหลักการตัวเอง SPCT ต่างจากการทำให้โมเดล AI ใหญ่ขึ้นเพื่อปรับปรุงประสิทธิภาพ – โดย SPCT ไม่ต้องการพลังงานและความสามารถในการคำนวณมากนักในการสอน AI ให้ตัดสินใจเรื่องงานของตัวเองด้วยกฎที่สร้างขึ้นด้วยตนเอง.

วิธีการทำงานของมันคือผ่าน “ผู้ตัดสิน” ที่ภายในซึ่งสามารถตรวจสอบว่าการตอบสนองของ AI ทั้งสอดคล้องกับกฎการตัดสินใจภายใน และเหมาะสมสำหรับการส่งออกผลลัพธ์ในรูปแบบที่มนุษย์สามารถเข้าใจได้ เมื่อ AI ให้การตอบสนองที่แข็งแกร่ง มันจะได้รับคำติชมที่เชิงบวก ซึ่งช่วยให้มันสามารถปรับปรุงความสามารถในการตอบคำถามที่คล้ายคลึงกันในครั้งถัดไปได้

DeepSeek นำวิธีนี้มาใช้เป็นส่วนหนึ่งของระบบ DeepSeek-GRM ซึ่งย่อมาจาก Generative Reward Modeling ด้วยวิธีการที่ไม่เหมือนกับวิธีการดั้งเดิม GRM ทำการตรวจสอบแบบขนานเพื่อเพิ่มความถูกต้องและความสอดคล้อง

“เราขอเสนอวิธีการปรับปรุงการวิจารณ์ตามหลักธรรมนูญส่วนบุคคล (SPCT) เพื่อส่งเสริมพฤติกรรมการสร้างรางวัลที่มีขนาดใหญ่” นักวิจัยเขียนในเอกสารวิชาการของพวกเขา “SPCT ทำให้[the model]สามารถปรับตัวให้เหมาะสมกับหลักธรรมนูญและการวิจารณ์ที่ขึ้นกับคำสั่งและการตอบสนอง ซึ่งนำไปสู่รางวัลผลที่ดีขึ้น”

ด้วยระบบนี้ DeepSeek อ้างว่า AI ของบริษัทสามารถทำงานได้ดีกว่าคู่แข่ง เช่น Gemini ของ Google, Llama ของ Meta, และ GPT-4o ของ OpenAI, โดยเฉพาะในงานที่ซับซ้อนเช่นการใช้เหตุผลหรือการตัดสินใจ ดังที่ Euronews ได้ระบุไว้

ที่สำคัญ, DeepSeek กล่าวว่ามีแผนที่จะปล่อยเครื่องมือใหม่เหล่านี้ในรูปแบบของซอฟต์แวร์ที่เปิดเผยต้นฉบับ แต่ยังไม่ได้แจ้งวันที่จะเปิดตัวเครื่องมือเหล่านั้น

AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง

We're thrilled you enjoyed our work!