Qwen2.5-Max a fost prezentat miercuri şi este disponibil pe platforma Alibaba Cloud Bailian, unde dezvoltatorii pot interacţiona direct cu modelul printr-un chat platform dedicat.
Conform Alibaba, noul model depăşeşte DeepSeek-V3 pe mai multe benchmark-uri majore, inclusiv Arena-Hard, LiveBench, LiveCodeBench sau MMLU-Pro.
De asemenea, compania chineză susţine că Qwen2.5-Max este comparabil cu Claude-3.5-Sonnet de la Anthropic şi că „depăşeşte aproape complet” GPT-4o, DeepSeek-V3 şi Llama-3.1-405B.
Lansarea modelului vine într-un moment de intensificare a competiţiei în sectorul AI, după ce, la începutul lunii ianuarie, modelele DeepSeek-V3 şi DeepSeek R1 au ridicat întrebări serioase privind dominaţia SUA în domeniul AI.
DeepSeek a surprins piaţa reuşind să concureze cu rivalii americani folosind hardware mai vechi şi un buget semnificativ mai mic. Lansarea acestuia a avut un impact major pe bursă, ducând la pierderi de aproximativ 1 trilion de dolari pentru companiile din sectorul tech din SUA. Nvidia a fost una dintre cele mai afectate companii.
Succesul modelelor chinezeşti, mai eficiente şi mai accesibile, a generat îngrijorări legate de cererea pentru cipuri avansate, ceea ce ar putea afecta investiţiile masive realizate de giganţii tehnologici americani, precum Microsoft şi Meta.