Photo by John Schnobrich on Unsplash

Alibaba ปล่อยโมเดล AI ใหม่ Qwen และอ้างว่ามีประสิทธิภาพเกิน DeepSeek-V3

Reading Time: 1 min

First published Jan 31, 2025

Updated 2 times since publishing

Written by: Andrea Miliani อดีตผู้เชี่ยวชาญด้านข่าวสารทางเทคโนโลยี
Translated by ทีมแปลภาษา ทีมแปลภาษาและบริการแปลภาษา

ยักษ์จีน Alibaba ได้เปิดตัวรุ่นล่าสุดของโมเดล AI ชั้นนำ Qwen ในวันพุธนี้ บริษัทอ้างว่าสามารถทำงานได้ดีกว่า DeepSeek-V3 ที่เป็นที่นิยม

รีบหรือไร้เวลา? นี่คือข้อมูลสำคัญที่คุณควรรู้!

Alibaba ได้ปล่อยโมเดลวิเคราะห์ล่าสุดของตน Qwen 2.5-Max ในวันพุธนี้
ยักษ์ใหญ่ชาวจีนอ้างว่า มันสามารถทำงานได้ดีกว่าโมเดลที่เป็นที่นิยมเช่น DeepSeek-V3, GPT-4o, และ Llama-3.1-405B
บริษัทยังเปิดตัว Qwen2.5-VL ในสัปดาห์นี้, โมเดล AI ที่สามารถประมวลผลภาพและทำหน้าที่เป็นตัวแทน AI โดยใช้คอมพิวเตอร์และโทรศัพท์มือถือในการทำงาน

ตามที่ Reuters รายงาน อาลีบาบาได้เปิดตัว Qwen 2.5-Max ซึ่งเป็นโมเดลการใช้เหตุผลใหม่ที่ว่าเป็นของตน ในช่วงเทศกาลปีใหม่จันทร์ที่จีน ก็เพื่อที่จะมาร่วมเข้ากับการพัฒนา AI ระดับใหญ่ในวันที่ผ่านมาและเพิ่มการแข่งขันในประเทศ

ในวันจันทร์ที่ผ่านมา, DeepSeek ขึ้นไปอยู่ในอันดับหนึ่งของ App Store ของ Apple ในสหรัฐอเมริกา โดยได้แซง ChatGPT ทำให้บริษัทอื่นๆ ในอุตสาหกรรม AI ตกใจ และนักลงทุนรู้สึกตื่นตระหนก—หุ้นของ Nvidia ตกลง 17% ในหนึ่งวันเท่านั้น.

ตอนนี้, Alibaba ได้ประกาศเปิดตัวเวอร์ชั่นล่าสุดของโมเดล Qwen ของมัน—มันได้เปิดตัว 100 โมเดล AI ที่เปิดให้นักพัฒนาใช้งานได้ฟรีสำหรับ Qwen suite ในเดือนกันยายนปีที่ผ่านมา—ซึ่งมั่นใจว่าจะมีผลลัพธ์ดีกว่าโมเดลชั้นนำที่เป็นที่นิยม.

“Qwen 2.5-Max ทำผลงานได้ดีกว่า (…) ในเกือบทุกด้าน เมื่อเทียบกับ GPT-4o, DeepSeek-V3 และ Llama-3.1-405B,” บริษัทเขียนบนบัญชี WeChat อย่างเป็นทางการของตน

API ของโมเดลการให้เหตุผลใหม่ Qwen 2.5-Max สามารถใช้ได้ผ่าน cloud ของ Alibaba และผู้ใช้ยังสามารถทดสอบโมเดลบน หน้าแชท ของเรา

“เรากำลังพัฒนา Qwen2.5-Max ซึ่งเป็นโมเดล MoE ขนาดใหญ่ที่ได้รับการฝึกสอนล่วงหน้าจากมากกว่า 20 ล้านล้านโทเค็น และได้รับการฝึกสอนต่อยอดด้วยวิธีการ Supervised Fine-Tuning (SFT) และ Reinforcement Learning from Human Feedback (RLHF)” เขียนโดยทีม Qwen ที่ Github

ยักษ์ใหญ่จากประเทศจีนยังได้ปล่อย Qwen2.5-VL ในวันจันทร์ ซึ่งเป็นชุดของโมเดล AI ที่เป็นหลากหลายรูปแบบที่สามารถประมวลผลภาพ และเข้าถึงโทรศัพท์มือถือและคอมพิวเตอร์เพื่อทำงาน OpenAI ได้ประกาศคุณลักษณะที่คล้ายกัน Operator ซึ่งอนุญาตให้ ChatGPT ทำงานโดยอิสระโดยควบคุมคอมพิวเตอร์ของผู้ใช้

ตามทีมงานของ Alibaba ระบุว่า รุ่น Qwen ทั้งหมดมีประสิทธิภาพสูงกว่ารุ่นที่คล้ายคลึงจาก OpenAI, Microsoft, Google, Meta, และ DeepSeek.

Alibaba ปล่อยโมเดล AI ใหม่ Qwen และอ้างว่ามีประสิทธิภาพเกิน DeepSeek-V3

We're thrilled you enjoyed our work!