DeepSeek, čínský AI model, který šokoval technologický průmysl a narušil Wall Street svými výrazně nízkými náklady a dobrým výkonem, má „nějakou skutečnou inovaci“ a je „všechno dobrá zpráva,“ prohlásil Satya Nadella, generální ředitel Microsoftu.
Nadella tento komentář pronesl během čtvrtečního čtvrtletního earnings callu společnosti, kdy uvedl, že AI není v žádném případě odlišná od běžného vývoje výpočetní techniky. Microsoft začal nabízet model DeepSeek-R1 pro dedukci, což je AI model, který odhaluje svůj „myšlenkový proces“, aby si uživatelé mohli zkontrolovat jeho výsledky. Tento model byl k dispozici uživatelům cloudové platformy Microsoftu tentýž den.
Obvinění navzdory využívání
Microsoft, významný investor do amerického konkurenta DeepSeek, společnosti OpenAI, také zkoumá, zda čínský vývojář AI nezískal data výstupů z OpenAI neautorizovaným způsobem.
OpenAI informovala média, že má důkazy o tom, že DeepSeek používal službu OpenAI k trénování svých AI modelů, což je chování, které není v souladu s podmínkami služby OpenAI.
Avšak ani OpenAI, ani Microsoft nepředložily důkazy.
I když vyšetřování pokračuje, nominovaný úředník z Trumpovy administrativy již obvinil DeepSeek z používání „ukradené“ americké technologie.
Howard Lutnick, nominovaný na post ministra obchodu, uvedl ve středu na setkání s americkými senátory, že vláda se tímto problémem bude zabývat.
Mezitím David Sacks, poradce pro AI prezidenta Trumpa, uvedl, že existují „substantivní důkazy“, že DeepSeek „získal znalosti“ z modelů OpenAI.
„Destilace poruší většinu podmínek služby, přesto je ironické – nebo dokonce pokrytecké – že Big Tech to kritizuje,“ řekl technologický investor a lektor na Cornell University Lutz Finger ve středu. „Trénování ChatGPT na obsahu Forbesu nebo New York Times také porušovalo jejich podmínky služby.“
Co je to »destilace«?
Destilace je proces, při němž nový AI model opakovaně dotazuje větší model a učí se z jeho výstupů.
Tento proces je popsán v veřejných výzkumných pracích DeepSeek, ale výzkumníci uvedli, že jej používali jiným způsobem. Podle společnosti se používal model DeepSeek-R1 pro dedukci jako „větší model“, který „učil“ jiné modely, jako je Alibaba Qwen a Meta Llama, aby se také staly schopnými dedukce.
Destilované modely a původní R1 byly vydány k volnému stažení, což umožňuje lidem s méně výkonnými počítači, nebo dokonce chytrými telefony, spouštět modely offline s plnou kontrolou, což je nemožné pro uživatele ChatGPT, protože model za službou OpenAI je skrytý i před platícími uživateli.
Příspěvky na sociálních médiích uvedly, že DeepSeek se někdy identifikuje jako ChatGPT, což by mohlo být důkazem o krádeži dat. Ale stejně jako všechny ostatní AI modely, ani DeepSeek neříká vždy pravdu. Předchozí verze chatbota Google Gemini se při dotazu v čínštině označila za Baidu Ernie bot, ale Baidu nikdy neobvinil Google z krádeže dat.