Co je DeepSeek AI? Je to bezpečné? Zde je vše, co potřebujete vědět
Jsou modely čínských startupů vzrušující, převratné nebo hrozivé? To záleží na úhlu pohledu. Zde je to, co si odborníci myslí, že byste měli vědět.
Jen několik týdnů po své nově nalezené slávě se čínský startup DeepSeek, který se zabývá umělou inteligencí, pohybuje závratnou rychlostí, svrhává konkurenty a vyvolává ostré konverzace o přednostech softwaru s otevřeným zdrojovým kódem.
Ohledně společnosti se však objevily četné bezpečnostní obavy, které přiměly soukromé a vládní organizace k zákazu používání DeepSeek. Zde je to, co potřebujete vědět.
Co je DeepSeek?
Čínský startup, který založil Liang Wenfeng v květnu 2023 (a tedy ani ne dva roky starý), vyzval zavedené společnosti zabývající se umělou inteligencí svým přístupem s otevřeným zdrojovým kódem. Podle Forbes, výhoda DeepSeek může spočívat v tom, že je financována pouze High-Flyer, hedgeovým fondem, který také provozuje Wenfeng, což dává společnosti model financování, který podporuje rychlý růst a výzkum.
Startup v lednu vyvolal vlny, když vydal plnou verzi R1, svého modelu uvažování s otevřeným zdrojovým kódem, který může překonat o1 OpenAI. Krátce poté stažení asistenta umělé inteligence DeepSeek z App Store - který běží na modelu V3, který DeepSeekreleased vydal v prosinci - překonalo ChatGPT, dříve nejstahovanější bezplatnou aplikaci. DeepSeek R1 se dokonce vyšplhal na celkové třetí místo v Chatbot Arena HuggingFace, kde bojoval s několika modely Gemini aChatGPT-4o; ve stejnou dobu DeepSeek vydal slibný nový model image.
Schopnost společnosti vytvářet úspěšné modely strategickou optimalizací starších čipů - což je důsledek zákazu vývozu čipů vyrobených v USA, včetně Nvidie - a rozložením zátěže dotazů mezi modely pro zvýšení efektivity, je podle průmyslových standardů působivá.
Co je DeepSeek R1?
R1, který byl vydán v plném znění 21. ledna, je vlajkovou lodí modelu uvažování DeepSeek, který v několika matematických, kódovacích a logických srovnávacích testech dosahuje stejných nebo lepších výsledků než vychvalovaný model o1 společnosti OpenAI.
R1, postavený na V3 a založený na Qwen společnosti Alibaba a Llama, je zajímavý tím, že na rozdíl od většiny ostatních špičkových modelů od technologických gigantů je open source, což znamená, že si jej může stáhnout a používat kdokoli. To znamená, že DeepSeek nezveřejnil trénovací datovou sadu R1. Zatím jsou všechny ostatní modely, které vydala, také open source.
DeepSeek je levnější než srovnatelné americké modely. Pro srovnání, přístup k R1 API začíná na 0,14 USD za milion tokenů, což je zlomek 7,50 USD, které si OpenAI účtuje za ekvivalentní úroveň.
DeepSeek tvrdí ve firemním výzkumném dokumentuže jeho model V3, který lze přirovnat ke standardnímu modelu chatbota, jako je Claude, stál 5,6 milionu dolarů na trénování, což je číslo, které koluje (a je zpochybňováno) jako celkové náklady na vývoj modelu. Jak uvedla agentura Reuters, někteří laboratorní experti se domnívají, že dokument DeepSeek odkazuje pouze na finální trénink V3, nikoli na celé náklady na vývoj (což by byl zlomek toho, co technologičtí giganti vynaložili na vytvoření konkurenceschopných modelů). Jiní odborníci naznačují, že náklady společnosti DeepSeek nezahrnují dřívější náklady na infrastrukturu, výzkum a vývoj, data a personální náklady.
Jednou z nevýhod, která by mohla mít dopad na dlouhodobou konkurenci modelu s O1 a alternativami vyrobenými v USA, je cenzura. Čínské modely často obsahují bloky na určité téma, což znamená, že i když fungují srovnatelně s jinými modely, nemusí odpovídat na některé dotazy (podívejte se, jak asistent umělé inteligence DeepSeek odpovídá na otázky týkající se náměstí Nebeského klidu a Tchaj-wanu zde). S rostoucím používáním DeepSeek se někteří obávají, že přísné čínské mantinely a systémové předsudky jeho modelů by mohly být zabudovány do všech druhů infrastruktury.
To znamená, že máte přístup k necenzurovaným verzím DeepSeek se sídlem v USA prostřednictvím platforem, jako je Perplexity. Tyto platformy odstranily cenzurní váhy DeepSeek a provozují jej na místních serverech, aby se vyhnuly obavám o bezpečnost.
V prosinci Tiernan RaydR1-Lite z ZDNET porovnal schopnost vysvětlit svůj myšlenkový řetězec s o1 a výsledky byly smíšené. To znamená, že asistent umělé inteligence DeepSeek odhaluje uživateli během dotazů svůj myšlenkový pochod, což je pro mnoho uživatelů chatbotů nová zkušenost vzhledem k tomu, že ChatGPT své uvažování neexternalizuje.
Všechny oblíbené modelky mají samozřejmě červené pozadí, pokyny pro komunitu a ochranné mantinely obsahu. Přinejmenším v této fázi je však nepravděpodobné, že by se chatboti vyrobení v USA zdrželi odpovědí na dotazy týkající se historických událostí.
Jaké jsou obavy o soukromí a bezpečnost?
Obavy o ochranu osobních údajů, které kolují na TikToku - aplikaci sociálních médií vlastněné Číňany, která je nyní v USA poněkud zakázána - se objevují také kolem DeepSeek.
Začátkem tohoto měsíce generální ředitel Feroot Security Ivan Tsarynny řekl ABC, že jeho firma objevila "přímé vazby na servery a společnosti v Číně, které jsou pod kontrolou čínské vlády", což podle něj "nikdy v minulosti neviděli".
Po dešifrování části kódu DeepSeek našel Feroot skryté programování, které může odesílat uživatelská data - včetně identifikačních informací, dotazů a online aktivity - do China Mobile, čínské vládní telekomunikační společnosti, která má od roku 2019 zakázáno působit v USA kvůli obavám o národní bezpečnost.
NowSecure poté doporučil organizacím "zakázat" používání mobilní aplikace DeepSeek poté, co zjistily několik nedostatků včetně nešifrovaných dat (což znamená, že kdokoli monitorující provoz je může zachytit) a špatného úložiště dat.
Minulý týden výzkumná společnost Wiz zjistila, že interní databáze DeepSeek byla veřejně přístupná "během několika minut" po provedení bezpečnostní kontroly. "Zcela otevřená a neautentická" databáze obsahovala historii chatů, uživatelské API klíče a další citlivá data.
"Ještě důležitější je, že odhalení umožnilo plnou kontrolu nad databází a potenciální eskalaci privilegií v prostředí DeepSeek, bez jakéhokoli autentizace nebo obranného mechanismu vůči vnějšímu světu," vysvětluje Wizova zpráva.
Podle Wired, který původně publikoval výzkum, ačkoli Wiz neobdržel odpověď od DeepSeek, se zdálo, že databáze byla odstraněna do 30 minut od okamžiku, kdy Wiz společnost informoval. Není jasné, jak dlouho byla přístupná nebo zda ji objevil nějaký jiný subjekt, než byla odstraněna.
I bez tohoto alarmujícího vývoje zásady ochrany osobních údajů společnosti DeepSeek vyvolávají některé červené vlajky. Uvádí: "Osobní údaje, které od vás shromažďujeme, mohou být uloženy na serveru umístěném mimo zemi, kde žijete. Informace, které shromažďujeme, ukládáme na zabezpečených serverech umístěných v Čínské lidové republice."
Zásady uvádějí, že společnost DeepSeek shromažďuje velké množství informací, mimo jiné včetně:
- IP adresa, jedinečné identifikátory zařízení a soubory cookie
- Datum narození (pokud je to relevantní), uživatelské jméno, e-mailová adresa a/nebo telefonní číslo a heslo
- Váš textový nebo zvukový vstup, výzva, nahrané soubory, zpětná vazba, historie chatu nebo jiný obsah, který poskytujete našemu modelu a službám
- Doklad totožnosti nebo věku, zpětná vazba nebo dotazy týkající se vašeho používání služby [Pokud kontaktujete DeepSeek]
Zásady pokračují: "Pokud přenášíme jakékoli osobní údaje mimo zemi, kde žijete, a to i pro jeden nebo více účelů uvedených v těchto zásadách, učiníme tak v souladu s požadavky platných zákonů o ochraně osobních údajů." Zásady se nezmiňují o souladu s GDPR.
"Uživatelé si musí být vědomi toho, že jakákoli data sdílená s platformou mohou podléhat vládnímu přístupu podle čínských zákonů o kybernetické bezpečnosti, které nařizují, aby společnosti poskytovaly přístup k datům na žádost úřadů," řekl Adrianus Warmenhoven, člen bezpečnostního poradního sboru NordVPN, ZDNET prostřednictvím e-mailu.
Podle některých pozorovatelů znamená skutečnost, že R1 je open source, zvýšenou transparentnost, která uživatelům umožňuje kontrolovat zdrojový kód modelu, zda nevykazuje známky aktivity související s ochranou soukromí.
Společnost DeepSeek však vydala také menší verze R1, které lze stáhnout a spustit lokálně, aby se předešlo obavám z odesílání dat zpět do společnosti (na rozdíl od přístupu k chatbotovi online).
Všichni chatboti, včetně ChatGPT, shromažďují při dotazování prostřednictvím prohlížeče určitý stupeň uživatelských dat.
Je DeepSeek AI bezpečný?
Výzkumníci v oblasti bezpečnosti umělé inteligence se již dlouho obávají, že výkonné modely s otevřeným zdrojovým kódem by mohly být aplikovány nebezpečnými a neregulovanými způsoby, jakmile se dostanou do volné přírody. Testy společnosti Chatterbox, která se zabývá bezpečností umělé inteligence, zjistily, že DeepSeek R1 má "bezpečnostní problémy ve všech oblastech".
Americké společnosti zabývající se umělou inteligencí v různé míře zaměstnávají určitý druh týmu pro dohled nad bezpečností. Společnost DeepSeek nezveřejnila, zda má tým pro výzkum bezpečnosti, a neodpověděla na žádost ZDNET o komentář k této záležitosti.
"Většina společností bude pokračovat v závodech o vytvoření co nejsilnější umělé inteligence, bez ohledu na rizika, a bude považovat zvýšenou algoritmickou efektivitu za způsob, jak rychleji dosáhnout vyššího výkonu," řekl Peter Slattery, výzkumný pracovník týmu FutureTech MIT, který vedl projekt Risk Repository. "To nám ponechává ještě méně času na řešení bezpečnostních, správních a společenských výzev, které přijdou se stále pokročilejšími systémy umělé inteligence."
"Průlom v efektivitě školení DeepSeek také znamená, že bychom měli brzy očekávat velké množství lokálních, specializovaných "obalů" - aplikací postavených na enginu DeepSeek R1 - z nichž každá bude představovat svá vlastní rizika pro ochranu soukromí a které by mohly být zneužity, pokud by se dostaly do nesprávných rukou," dodal Ryan Fedasiuk. ředitel řízení umělé inteligence v USA v The Future Society, neziskové organizaci zabývající se politikou umělé inteligence.
Je DeepSeek energeticky účinnější?
Někteří analytici poznamenávají, že výpočetní model DeepSeek s nižším zdvihem je energeticky účinnější než model gigantů umělé inteligence vyrobených v USA.
"Nový model umělé inteligence společnosti DeepSeek pravděpodobně spotřebovává méně energie na trénink a provoz než modely větších konkurentů," řekl Slattery. "Pochybuji však, že se jedná o začátek dlouhodobého trendu snižování spotřeby energií. Síla umělé inteligence pramení z dat, algoritmů a výpočtů - které se spoléhají na neustále se zlepšující čipy. Když vývojáři dříve hledali způsoby, jak být efektivnější, obvykle tyto zisky reinvestovali do výroby ještě větších a výkonnějších modelů, místo aby snižovali celkovou spotřebu energie."
"DeepSeek není jedinou společností zabývající se umělou inteligencí, která dosáhla mimořádného pokroku ve výpočetní efektivitě. V posledních měsících se podobným zlepšením výkonu pochlubily americké společnosti Anthropic a Google Gemini," řekl Fedasiuk.
"Úspěchy společnosti DeepSeek jsou pozoruhodné v tom, že se zdá, že nezávisle navrhla průlomové objevy, které slibují, že velké jazykové modely budou mnohem efektivnější a levnější, a to dříve, než mnozí profesionálové v oboru očekávali - ale v tak dynamické oblasti, jako je umělá inteligence, je těžké předpovědět, jak dlouho bude společnost schopna vyhřívat se na výsluní."
Jak DeepSeek ovlivní odvětví umělé inteligence?
Úspěch R1 zdůrazňuje obrovskou změnu v oblasti umělé inteligence, která by mohla umožnit menším laboratořím a výzkumníkům vytvářet konkurenceschopné modely a diverzifikovat možnosti. Například organizace bez financování nebo zaměstnanců OpenAI si mohou stáhnout R1 a vyladit jej tak, aby konkuroval modelům, jako je o1. Těsně před vydáním R1 vytvořili výzkumníci z UC Berkeley open-source modelna srovnatelné s o1-preview, ranou verzí o1, za pouhých 19 hodin a za zhruba 450 dolarů.
Vzhledem k tomu, jak přemrštěné se investice do umělé inteligence staly, mnoho odborníků spekuluje, že by tento vývoj mohl prasknout bublinu umělé inteligence (akciový trh určitě zpanikařil). Někteří vidí úspěch DeepSeek jako vyvrácení myšlenky, že špičkový vývoj znamená velké modely a výdaje. Staví také Stargate, infrastrukturní iniciativu v hodnotě 500 miliard dolarů, v jejímž čele stojí několik gigantů v oblasti umělé inteligence, do nového světla, což vyvolává spekulace o tom, zda konkurenční umělá inteligence vyžaduje energii a rozsah navrhovaných datových center této iniciativy.
Vzestup DeepSeek přichází v kritické době pro čínsko-americké technologické vztahy, jen několik dní poté, co dlouho bojovaný zákaz TikToku vstoupil v částečnou platnost. Ironií je, že DeepSeek předkládá srozumitelným jazykem potravu pro bezpečnostní obavy, které se USA snažily dokázat o TikToku ve svém dlouhodobém úsilí o uzákonění zákazu.
Které země zakazují DeepSeek?
Několik amerických agentur, včetně NASA a námořnictva, již zakázalo DeepSeek na vládních technologiích zaměstnanců a zákonodárci se snaží zakázat aplikaci na všech vládních zařízeních, což Austrálie a Tchaj-wan již implementovaly. Jižní Korea zakázala stahování nové aplikace kvůli nedávnému selhání společnosti DeepSeek v dodržování místní ochrany dat. Itálie vyšetřuje společnost kvůli obavám ohledně dodržování GDPR.