Gjigandi kinez i teknologjisë, Alibaba, ka publikuar një version të ri të modelit të tij të inteligjencës artificiale, Qwen 2.5, duke pretenduar se ai tejkalon modelin shumë të vlerësuar DeepSeek-V3.
Lançimi i modelit Qwen 2.5-Max në ditën e parë të Vitit të Ri Hënor, një periudhë kur shumica e kinezëve janë në pushim me familjet e tyre, tregon për presionin që rritja e shpejtë e DeepSeek ka krijuar jo vetëm ndaj rivalëve ndërkombëtarë, por edhe ndaj konkurrentëve vendas, sipas Reuters.
Në një njoftim në llogarinë zyrtare në WeChat, njësia cloud e Alibaba-s deklaroi:
“Qwen 2.5-Max tejkalon … pothuajse në të gjitha aspektet GPT-4o, DeepSeek-V3 dhe Llama-3.1-405B.”
Publikimi më 10 janar i asistentit të inteligjencës artificiale të DeepSeek, i bazuar në modelin DeepSeek-V3, dhe më 20 janar i modelit R1, ka tronditur Silicon Valley-n dhe ka shkaktuar rënie të aksioneve të kompanive teknologjike.
Kjo, për shkak të kostove të ulëta të zhvillimit dhe përdorimit të DeepSeek, që ka ngritur pikëpyetje mbi planet e mëdha të investimeve nga gjigantët amerikanë të AI-së.
Suksesi i DeepSeek ka nxitur një garë mes kompanive kineze për të përmirësuar modelet e tyre. Dy ditë pas publikimit të DeepSeek-R1, pronari i TikTok-ut, ByteDance, publikoi një përditësim të modelit të tij kryesor të AI-së, duke pretenduar se ai tejkalon modelin o1 të OpenAI-së në testin AIME, i cili mat aftësinë e modeleve për të kuptuar dhe për t’iu përgjigjur udhëzimeve komplekse.
DeepSeek-V2, paraardhësi i DeepSeek-V3, shkaktoi një luftë çmimesh në industrinë e AI-së në Kinë pas publikimit të tij në maj 2024.
Ky model open-source, me një kosto prej vetëm “1 juan (0.14 dollarë) për 1 milion tokenë”, detyroi Alibaba-n të ulë çmimet e modeleve të saj deri në “97%”.
Konkurrentë të tjerë kinezë, si Baidu – i cili publikoi modelin e parë të ngjashëm me ChatGPT në mars 2023 – dhe kompania më e madhe kineze e internetit, Tencent, po ashtu reaguan me përmirësime dhe ulje çmimesh.
Liang Wenfeng, themeluesi enigmatik i DeepSeek, deklaroi në një intervistë të rrallë në korrik 2024 se startup-i i tij “nuk shqetësohet për luftën e çmimeve” dhe se qëllimi kryesor është arritja e AGI (Artificial General Intelligence) – një formë e avancuar e AI-së që mund të tejkalojë aftësitë njerëzore në shumicën e detyrave ekonomike.
Sipas Liang, “gjigantët e teknologjisë mund të mos jenë të përshtatshëm për të ardhmen e industrisë së AI-së,” duke i kontrastuar kostot e tyre të larta dhe strukturat burokratike me modelin më fleksibël dhe inovativ të DeepSeek.
“Modelet e mëdha të inteligjencës artificiale kërkojnë inovacion të vazhdueshëm, dhe aftësitë e korporatave të mëdha kanë kufizimet e tyre,” theksoi ai.