- Čina vydala prvú verziu svojej generatívnej AI s označením DeepSeek-R1
- Ten zatriasol s celým trhom vďaka neprekonateľnému pomeru ceny prevádzky za výkon
Gemini, Apple Intelligence, ChatGPT. To sú asi najbežnejšie názvy, ktoré pri styku s generatívnou AI stretávate. Už čoskoro sa však pripravte na to, že budete stretávať názov DeepSeek-R1.
Čína totiž vydala prvú generáciu svojho AI modelu a ten experti označujú, že „seizmický otras“ v sektore AI modelov. Mnohí používajú prirovnanie, že ide o „Sputnik“ moment. Čine sa totiž podaril naozaj husársky kúsok. V prvej generácii svojho AI modelu priniesť na trh produkt, ktorý je porovnateľne dobrý a v niektorých prípadoch aj lepší ako v súčasnosti najlepší o1 AI model od OpenAI.
First, the DeepSeek team is incredible and has been putting out absolutely fantastic work since their first model, especially around efficiency. MLA allows for ~10x memory efficiency from the KV cache. They got efficient MoE with >8 experts working with near-perfect…
— Armen Aghajanyan (@ArmenAgha) January 26, 2025
Jeho sila však nespočíva iba vo výkone ale aj v efektivite. DeepSeek-R1 totiž bol totiž vytrénovaný s 1/50 „ceny“ oproti západným AI modelom. A vzhľadom na to, že ide o open source produkt, tak ide o úder pre všetky západné spoločnosti, ktoré v posledných mesiacoch utopili miliardy dolárov v trénovaní vlastných AI modelov. Spoločnosť, ktorá DeepSeek-R1 si za používanie prémiovej služby účtuje iba 3% toho, čo si účtuje OpenAI.
Čína sa plánuje chopiť príležitosti
Čína tak našla nového šampióna a plánuje to využiť. Čínska banka informovala o tom, že plánuje investovať 1 bilión juanov do AI infraštruktúry v priebehu nasledujúcich piatich rokov.
Navyše, toto odhalenie malo masívny vplyv na západné spoločnosti. Napríklad Nvidia, ktorá vystrelila takmer na čelo rebríčka najhodnotnejších spoločností na trhu práve vďaka dopytu po AI čipoch teraz klesla o 11%. Efektívne teda stratila 384 miliárd dolárov zo svojej hodnoty. Cena AMD klesla o 5,3% a o 10,5% klesla cena spoločnosti Broadcom. Straty hlásia aj spoločnosti Arm Ltd., Meta či Microsoft.
Web Techstartups informuje o tom, že panika panuje v spoločnosti Meta, ktorá má vlastný AI model s označením Llama 3.1. „Začalo to s DeepSeek V3, ktorý už v benchmarkoch spôsobil, že Llama 4 zaostávala. K tomu sa pridala „neznáma čínska spoločnosť s rozpočtom 5,5 milióna dolárov na školenia“. Inžinieri sa horúčkovito snažia rozpitvať DeepSeek a skopírovať z neho všetko, čo sa dá. Ani nepreháňam,“ povedal jeden zo zdrojov v spoločnosti.