Alibaba ปล่อยโมเดล AI ใหม่ Qwen และอ้างว่ามีประสิทธิภาพเกิน DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba ปล่อยโมเดล AI ใหม่ Qwen และอ้างว่ามีประสิทธิภาพเกิน DeepSeek-V3

Reading Time: 1 min

Updated 2 times since publishing

  • Andrea Miliani

    Written by: Andrea Miliani อดีตผู้เชี่ยวชาญด้านข่าวสารทางเทคโนโลยี

  • ทีมแปลภาษา

    Translated by ทีมแปลภาษา ทีมแปลภาษาและบริการแปลภาษา

ยักษ์จีน Alibaba ได้เปิดตัวรุ่นล่าสุดของโมเดล AI ชั้นนำ Qwen ในวันพุธนี้ บริษัทอ้างว่าสามารถทำงานได้ดีกว่า DeepSeek-V3 ที่เป็นที่นิยม

รีบหรือไร้เวลา? นี่คือข้อมูลสำคัญที่คุณควรรู้!

  • Alibaba ได้ปล่อยโมเดลวิเคราะห์ล่าสุดของตน Qwen 2.5-Max ในวันพุธนี้
  • ยักษ์ใหญ่ชาวจีนอ้างว่า มันสามารถทำงานได้ดีกว่าโมเดลที่เป็นที่นิยมเช่น DeepSeek-V3, GPT-4o, และ Llama-3.1-405B
  • บริษัทยังเปิดตัว Qwen2.5-VL ในสัปดาห์นี้, โมเดล AI ที่สามารถประมวลผลภาพและทำหน้าที่เป็นตัวแทน AI โดยใช้คอมพิวเตอร์และโทรศัพท์มือถือในการทำงาน

ตามที่ Reuters รายงาน อาลีบาบาได้เปิดตัว Qwen 2.5-Max ซึ่งเป็นโมเดลการใช้เหตุผลใหม่ที่ว่าเป็นของตน ในช่วงเทศกาลปีใหม่จันทร์ที่จีน ก็เพื่อที่จะมาร่วมเข้ากับการพัฒนา AI ระดับใหญ่ในวันที่ผ่านมาและเพิ่มการแข่งขันในประเทศ

ในวันจันทร์ที่ผ่านมา, DeepSeek ขึ้นไปอยู่ในอันดับหนึ่งของ App Store ของ Apple ในสหรัฐอเมริกา โดยได้แซง ChatGPT ทำให้บริษัทอื่นๆ ในอุตสาหกรรม AI ตกใจ และนักลงทุนรู้สึกตื่นตระหนก—หุ้นของ Nvidia ตกลง 17% ในหนึ่งวันเท่านั้น.

ตอนนี้, Alibaba ได้ประกาศเปิดตัวเวอร์ชั่นล่าสุดของโมเดล Qwen ของมัน—มันได้เปิดตัว 100 โมเดล AI ที่เปิดให้นักพัฒนาใช้งานได้ฟรีสำหรับ Qwen suite ในเดือนกันยายนปีที่ผ่านมา—ซึ่งมั่นใจว่าจะมีผลลัพธ์ดีกว่าโมเดลชั้นนำที่เป็นที่นิยม.

“Qwen 2.5-Max ทำผลงานได้ดีกว่า (…) ในเกือบทุกด้าน เมื่อเทียบกับ GPT-4o, DeepSeek-V3 และ Llama-3.1-405B,” บริษัทเขียนบนบัญชี WeChat อย่างเป็นทางการของตน

API ของโมเดลการให้เหตุผลใหม่ Qwen 2.5-Max สามารถใช้ได้ผ่าน cloud ของ Alibaba และผู้ใช้ยังสามารถทดสอบโมเดลบน หน้าแชท ของเรา

“เรากำลังพัฒนา Qwen2.5-Max ซึ่งเป็นโมเดล MoE ขนาดใหญ่ที่ได้รับการฝึกสอนล่วงหน้าจากมากกว่า 20 ล้านล้านโทเค็น และได้รับการฝึกสอนต่อยอดด้วยวิธีการ Supervised Fine-Tuning (SFT) และ Reinforcement Learning from Human Feedback (RLHF)” เขียนโดยทีม Qwen ที่ Github

ยักษ์ใหญ่จากประเทศจีนยังได้ปล่อย Qwen2.5-VL ในวันจันทร์ ซึ่งเป็นชุดของโมเดล AI ที่เป็นหลากหลายรูปแบบที่สามารถประมวลผลภาพ และเข้าถึงโทรศัพท์มือถือและคอมพิวเตอร์เพื่อทำงาน OpenAI ได้ประกาศคุณลักษณะที่คล้ายกัน Operator ซึ่งอนุญาตให้ ChatGPT ทำงานโดยอิสระโดยควบคุมคอมพิวเตอร์ของผู้ใช้

ตามทีมงานของ Alibaba ระบุว่า รุ่น Qwen ทั้งหมดมีประสิทธิภาพสูงกว่ารุ่นที่คล้ายคลึงจาก OpenAI, Microsoft, Google, Meta, และ DeepSeek.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back