Photo by John Schnobrich on Unsplash

Alibaba lanserar ny Qwen AI-modell och hävdar att den överträffar DeepSeek-V3

Lästid: 2 min

Senast uppdaterad: Jan 31, 2025

Skriven av Andrea Miliani Expert på tekniknyheter
Översatt av Lokaliserings- och översättningsteamet Lokaliserings- och översättningstjänster

Den kinesiska jätten Alibaba släppte den senaste versionen av sin flaggskepps AI-modell, Qwen, denna onsdag. Företaget hävdar att den kan prestera bättre än den populära DeepSeek-V3.

Har bråttom? Här är de snabba fakta!

Alibaba släppte sitt senaste resonemangsmodell Qwen 2.5-Max denna onsdag.
Det kinesiska jätteföretaget hävdar att det överträffar populära modeller som DeepSeek-V3, GPT-4o och Llama-3.1-405B.
Företaget lanserade också Qwen2.5-VL denna vecka, en AI-modell som kan bearbeta bilder och agera som en AI-agent som använder datorer och mobiler för att utföra uppgifter.

Enligt Reuters lanserade Alibaba den nya Qwen 2.5-Max, som man har döpt den nya resonemangsmodellen till, precis under det kinesiska nyåret, för att ansluta till de massiva AI-utvecklingarna under de senaste dagarna och lägga till inhemska tävlingar.

På måndagen, nådde DeepSeek första plats på Apples App Store i USA, överträffande ChatGPT, vilket bekymrade andra företag inom AI-industrin och larmade investerare—Nvidia-aktier föll 17% på bara en dag.

Nu har Alibaba meddelat de senaste versionerna av sin Qwen-modell — den släppte 100 öppen-källkods AI-modeller för Qwen-serien i september förra året— och lovade bättre resultat än populära gränsmodeller.

”Qwen 2.5-Max presterar bättre (…) nästan över hela linjen än GPT-4o, DeepSeek-V3 och Llama-3.1-405B,” skrev företaget på sitt officiella WeChat-konto.

Det nya resonemangsmodellen Qwen 2.5-Max API är tillgänglig genom Alibabas moln och användare kan också testa modellen på dess chat-sida.

”Vi utvecklar Qwen2.5-Max, en storskalig MoE-modell som har förtränats på över 20 biljoner tokens och vidare post-tränats med noggrant utvalda Supervised Fine-Tuning (SFT) och Reinforcement Learning from Human Feedback (RLHF) metoder,” skrev Qwen Team på Github.

Det kinesiska jätteföretaget släppte också Qwen2.5-VL på måndag, en serie multimodala AI-modeller som också kan bearbeta bilder och få tillgång till mobiler och datorer för att utföra uppgifter. OpenAI tillkännagav en liknande funktion, Operator, vilket gör det möjligt för ChatGPT att utföra uppgifter autonomt genom att ta kontroll över användarens dator.

Enligt Alibabas team presterar alla Qwen-modeller bättre än liknande versioner från OpenAI, Microsoft, Google, Meta och DeepSeek.

Alibaba lanserar ny Qwen AI-modell och hävdar att den överträffar DeepSeek-V3

Vad kul att du gillar vårt arbete!

Lämna en kommentar