AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง

Image by Matheus Bertelli, from Pexels

AI ของ DeepSeek เรียนรู้วิธีคิดด้วยตัวเอง

Reading Time: 1 min

Updated 2 times since publishing

  • Kiara Fabbri

    Written by: Kiara Fabbri อดีตนักเขียนข่าวทางด้านเทคโนโลยี

  • ทีมแปลภาษา

    Translated by ทีมแปลภาษา ทีมแปลภาษาและบริการแปลภาษา

สตาร์ทอัพจีน DeepSeek ร่วมกับมหาวิทยาลัย Tsinghua กล่าวว่า พวกเขาได้พัฒนาวิธีที่ฉลาดขึ้นในการช่วยให้โมเดลปัญญาประดิษฐ์คิดได้ดียิ่งขึ้นและเร็วขึ้น โดยไม่จำเป็นต้องใช้คอมพิวเตอร์ขนาดใหญ่หรือทรัพยากรที่มีราคาแพง

รีบหรือเปล่า? นี่คือข้อมูลสำคัญๆที่คุณควรทราบ:

  • DeepSeek สร้าง AI ที่สามารถปรับปรุงตัวเองด้วยวิธี Self-Principled Critique Tuning (SPCT).
  • SPCT สอนให้ AI พิจารณาผลงานของตัวเองโดยใช้กฎที่สร้างขึ้นด้วยตัวเอง.
  • วิธีนี้ส่งเสริมการทำงานที่มีประสิทธิภาพโดยไม่ต้องใช้พลังการคำนวณที่มากมาย.

การทะลุผ่านมาจากเทคนิคใหม่ที่เรียกว่า Self-Principled Critique Tuning (SPCT) หรือการปรับแต่งตามหลักการตัวเอง SPCT ต่างจากการทำให้โมเดล AI ใหญ่ขึ้นเพื่อปรับปรุงประสิทธิภาพ – โดย SPCT ไม่ต้องการพลังงานและความสามารถในการคำนวณมากนักในการสอน AI ให้ตัดสินใจเรื่องงานของตัวเองด้วยกฎที่สร้างขึ้นด้วยตนเอง.

วิธีการทำงานของมันคือผ่าน “ผู้ตัดสิน” ที่ภายในซึ่งสามารถตรวจสอบว่าการตอบสนองของ AI ทั้งสอดคล้องกับกฎการตัดสินใจภายใน และเหมาะสมสำหรับการส่งออกผลลัพธ์ในรูปแบบที่มนุษย์สามารถเข้าใจได้ เมื่อ AI ให้การตอบสนองที่แข็งแกร่ง มันจะได้รับคำติชมที่เชิงบวก ซึ่งช่วยให้มันสามารถปรับปรุงความสามารถในการตอบคำถามที่คล้ายคลึงกันในครั้งถัดไปได้

DeepSeek นำวิธีนี้มาใช้เป็นส่วนหนึ่งของระบบ DeepSeek-GRM ซึ่งย่อมาจาก Generative Reward Modeling ด้วยวิธีการที่ไม่เหมือนกับวิธีการดั้งเดิม GRM ทำการตรวจสอบแบบขนานเพื่อเพิ่มความถูกต้องและความสอดคล้อง

“เราขอเสนอวิธีการปรับปรุงการวิจารณ์ตามหลักธรรมนูญส่วนบุคคล (SPCT) เพื่อส่งเสริมพฤติกรรมการสร้างรางวัลที่มีขนาดใหญ่” นักวิจัยเขียนในเอกสารวิชาการของพวกเขา “SPCT ทำให้[the model]สามารถปรับตัวให้เหมาะสมกับหลักธรรมนูญและการวิจารณ์ที่ขึ้นกับคำสั่งและการตอบสนอง ซึ่งนำไปสู่รางวัลผลที่ดีขึ้น”

ด้วยระบบนี้ DeepSeek อ้างว่า AI ของบริษัทสามารถทำงานได้ดีกว่าคู่แข่ง เช่น Gemini ของ Google, Llama ของ Meta, และ GPT-4o ของ OpenAI, โดยเฉพาะในงานที่ซับซ้อนเช่นการใช้เหตุผลหรือการตัดสินใจ ดังที่ Euronews ได้ระบุไว้

ที่สำคัญ, DeepSeek กล่าวว่ามีแผนที่จะปล่อยเครื่องมือใหม่เหล่านี้ในรูปแบบของซอฟต์แวร์ที่เปิดเผยต้นฉบับ แต่ยังไม่ได้แจ้งวันที่จะเปิดตัวเครื่องมือเหล่านั้น

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back