
Image generated with DALL·E through ChatGPT
Åsikt: Hur stort hot är den kinesiska AI-modellen DeepSeek mot OpenAI och andra företag i Silicon Valley?
DeepSeek trädde in på den amerikanska marknaden, överträffade OpenAI på App Store, påverkade Nvidias aktier och väckte oro, förvåning och bred acceptans – även bland Silicon Valley-företag. Det kinesiska uppstartsföretaget lyckades skapa en konkurrenskraftig AI-produkt som utmanar den amerikanska AI-branschens framtid
Det finns en ny sheriff i AI-staden och dess ankomst har skakat om teknikindustrin världen över. För bara några dagar sedan släppte DeepSeek, en liten kinesisk uppstart, sin senaste öppenkällkod AI-modell, den kraftfulla R1, och skapade panik bland många teknikjättar, investerare och AI-utvecklare.
Den nya AI-modellen är kraftfullare än många förväntat sig. Mycket snabbt fick DeepSeek’s AI-modell popularitet – möjligen med hjälp av ett kinesiskt nätverk som byggde upp hypen och marknadsförde det som den mest avancerade tekniken i världen – och rankades på första plats på Apples App Store i USA.
Nästan omedelbart började nyhetskanaler överallt rapportera om DeepSeek.
OpenAI, som så självsäkert vann AI-racet 2024, började tappa kraft, och Nvidias stigande aktier föll dramatiskt, och förlorade nästan $600 miljoner på en dag. Det är svårt att ge en exakt mätning av hur stort detta nya hot är mot den amerikanska ekonomin, men det är definitivt inte litet.
Från säkerhetsproblem och potentiella rättsprocesser till en ömtålig teknikmarknad och den explosiva anammandet av den öppna AI-modellen, här är den väsentliga informationen för att förstå det nuvarande dramaet kring DeepSeek:
Vad är DeepSeek, och varför är det så stort just nu?
DeepSeek är ett litet startup grundat 2023 av Liang Wenfeng, en kinesisk ingenjör och entreprenör, och stödd av den kinesiska kvantitativa hedgefonden High-Flyer Capital Management. Sedan företaget skapades har det utvecklat öppen källkods AI-modeller, men började bara få uppmärksamhet för några månader sedan.
På Wizcase rapporterade vi när de släppte förhandstitten på modellen DeepSeek-R1-Lite i november och noterade experternas och användarnas intresse för produkten som redan kunde konkurrera med OpenAI:s o1.
DeepSeek lanserade DeepSeek-L3, R1:s föregångare, i december, och fångade uppmärksamheten från Silicon Valley-experter som Andrej Karpathy—tidigare forskare på OpenAI och nuvarande chef för AI på Tesla som för närvarande bygger en AI-inriktad utbildningsplattform. Karparthy framhöll de reducerade kostnaderna för att bygga modellen bland andra intressanta funktioner.
Det är billigare, mycket billigare
Enligt dess officiella dokument, kostade DeepSeek-L3 $5.576 miljoner att bygga—om man beaktar alla träningskostnader—medan OpenAI spenderade över $100 miljoner på att bygga GPT-4 år 2023.
Det är cirka 94% billigare än GPT-4!
Den 15 januari lanserade de en mobilapp och den 20 januari lanserade det kinesiska uppstartsföretaget sin senaste AI-modell för resonemang, R1. Denna modell verkar ha blivit tänkt under en Daft Punk-besvärjelse av ”hårdare, bättre, snabbare, starkare” eftersom de lyckades leverera en gratis och öppen källkod högkvalitativ produkt som kan konkurrera med gränsmodeller för en bråkdel av kostnaden och på rekordtid. Boom!
🚀 DeepSeek-R1 är här!
⚡ Prestanda i paritet med OpenAI-o1
📖 Helt öppen källkodsmodell & teknisk rapport
🏆 MIT-licensierad: Destillera & kommersialisera fritt!🌐 Webbplats & API är nu live! Testa DeepThink på https://t.co/v1TFy7LHNy idag!
🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) 20 januari, 2025
Kostnaden för den nya R1-modellen har inte avslöjats. Men många antar att den måste förbli lågkostnad eftersom DeepSeek för närvarande erbjuder sitt API för mycket mindre än OpenAI:s o1, och, enligt Nature, tillåter forskare att prova modellen.
Mario Krenn – ledare för Artificial Scientist Lab vid Max Planck-institutet för ljusvetenskap i Erlangen, Tyskland – sa att ett experiment som kostar runt $370 med OpenAI:s o1, inte ens kostar $10 med R1. ”Detta är en dramatisk skillnad som säkerligen kommer att spela en roll för dess framtida acceptans”, sa Krenn till Nature.
Utrymme för förbättringar
Användare över hela världen började ladda ner appen för att testa DeepSeek’s modell och, efter att ha beundrat dess fascinerande resonemangsförmåga, som dess tankekedja, märkte de också några särdrag.
Precis som alla andra AI-modeller kan DeepSeek’s R1 hallucinera, men den kinesiska modellen filtrerar också information, särskilt när den kan påverka den kinesiska regeringen.
Användare delade exempel på R1’s censur. Den undviker ämnen som massakern på Himmelska fridens torg, Taiwan, eller att svara på vem Xi Jinping är.
DeepSeek censurerar sitt eget svar i realtid så snart Xi Jinping nämns pic.twitter.com/Nb2ylRXERG
— Jane Manchun Wong (@wongmjane) 24 januari 2025
En juridisk strid tar sin början
Så en ny kinesisk app väcker amerikanarnas nyfikenhet inom dagar och … vad händer med alla datafrågor som den amerikanska regeringen tidigare hade med den andra populära kinesiska appen som är känd som TikTok—för närvarande i limbo? Kinesisk teknik ser ut att vara ostoppbar, medan den amerikanska regeringen verkar mindre i kontroll.
deepseek’s r1 är en imponerande modell, särskilt med tanke på vad de kan leverera för priset.
vi kommer naturligtvis att leverera mycket bättre modeller och det är också uppfriskande att ha en ny konkurrent! Vi kommer att dra igång några lanseringar.
— Sam Altman (@sama) 28 januari 2025
Trots de offentliga gratulationerna, var alla misstänksamma om hur den kinesiska startupen lyckades bygga denna kraftfulla modell på så kort tid trots alla restriktioner och brist på tillgång till väsentlig information.
USA:s regering har infört strikta regleringar för att förhindra att detta sker. De förbjöd chip-tillverkare att sälja sin avancerade AI-teknologi till Kina, och DeepSeek lyckades ändå skapa banbrytande artificiella intelligensverktyg med mindre avancerade Nvidia-chip—som till exempel H800 GPU som nämndes i artikeln.
Men den amerikanska regeringen är skeptisk, och USA:s handelsdepartement undersöker nu detta eftersom de misstänker att Nvidia’s mest avancerade chipp har smugglats till Kina.
OpenAI mot DeepSeek
Stämningen är spänd. Den amerikanska regeringen är inte den enda med förtroendeproblem. OpenAI, tillsammans med sin partner Microsoft, undersöker också DeepSeek. De tror att det kinesiska företaget har använt data genererad av ChatGPT utan tillåtelse.
OpenAI hävdar att deras modeller kan ha hjälpt till att träna Kinas DeepSeek-modell genom en process som kallas för destillation – när en stor AI-modell överför information till ett mindre och effektivare läge.
“Vi vet att grupper i Folkrepubliken Kina aktivt arbetar med att använda metoder, inklusive det som är känt som destillation, för att replikera avancerade amerikanska AI-modeller,” sa en talesperson från OpenAI till New York Times. “Vi är medvetna om och granskar indikationer på att DeepSeek kanske har destillerat våra modeller på ett olämpligt sätt, och kommer att dela information så snart vi vet mer.”
Och det är allt väldigt ironiskt med tanke på att OpenAI står inför flera anklagelser om brott mot upphovsrätten och databruksbrott, inklusive en stämning inlämnad av New York Times, en böter på 15 miljoner dollar för databrott i Italien, och ett nyligen upphovsrättsärende utfärdat av indiska förlag.
Om du inte kan slå dem, gå med dem?
Det finns ett annat fenomen inom AI-fältet. Alla stora företag adopterar DeepSeek’s öppna teknologi – även de som undersöker det kinesiska uppstartsföretaget.
Istället för att hitta problem med DeepSeeks teknologi, valde Perplexity att snabbt anamma den. Det amerikanska AI sökföretaget integrerade R1 i rekordtid i sin plattform för att erbjuda användarna en utökad och DeepSeek-driven tjänst. Perplexitys initiativ följdes några dagar senare av Microsoft – ja, det som också undersöker DeepSeek – genom att lägga till DeepSeek R1 på Azure AI Foundry och GitHub.
Varje dag verkar fler företag ansluta sig till denna trend. Amazon har precis lagt till DeepSeek-R1 modeller i Amazon Bedrock och Amazon SageMaker AI, och andra företag som Aurora Mobile har också integrerat tekniken och till och med fått en aktieökning.
Är DeepSeek det nya OpenAI 2025?
Konsekvenserna av DeepSeeks påverkan är fortfarande osäkra och Kina verkar ha flera kort i spelet. Alibaba släppte också sin senaste resonemangsmodell Qwen 2.5-Max och hävdade att den är kraftfullare än DeepSeek-V3, men den har ännu inte fått mycket genomslag.
DeepSeeks påverkan har varit enorm och många tror att detta är slutet på OpenAIs överlägsenhet. De amerikanska AI-företagen är inte längre så onåbara som de verkade och vi kommer sannolikt att uppleva en överraskande utgång snart. Experter som forskaren Gary Marcus säger att OpenAI är övervärderat och kan stå inför en nära framtid liknande WeWork. Så vad kommer att hända med $500 miljarder Stargate-projektet som OpenAI, SoftBank och president Donald Trump just tillkännagav? Lägg dina spel!
Allt tyder på att, precis som OpenAI anlände i full fart, sopa allt i dess väg, DeepSeek är här för att stanna. I Kina blir de redan öppet berömda, och deras påverkan och adoption är redan för betydande för att kunna knuffas ut från den amerikanska marknaden—förmodligen med ännu mer kraft än TikTok.
Lämna en kommentar
Avbryt