DeepSeeks AI lär sig att tänka för sig själv

Image by Matheus Bertelli, from Pexels

DeepSeeks AI lär sig att tänka för sig själv

Lästid: 2 min

Kinesiska startup-företaget DeepSeek, i samarbete med Tsinghua University, säger att de har utvecklat ett smartare sätt att hjälpa artificiella intelligensmodeller att tänka bättre och snabbare, utan att behöva enorma datorer eller dyra resurser.

Har bråttom? Här är de snabba fakta:

  • DeepSeek skapade en självförbättrande AI med hjälp av Self-Principled Critique Tuning (SPCT).
  • SPCT lär AI att bedöma sitt eget arbete med hjälp av självgenererade regler.
  • Metoden ökar prestanda utan massiv datorkraft.

Genombrottet kommer från en ny teknik som kallas Själv-Principiell Kritikjustering (SPCT). SPCT skiljer sig från att helt enkelt göra AI-modeller större för att förbättra prestanda – SPCT kräver inte mycket energi och datorkraft för att lära AI att bedöma sitt eget arbete med hjälp av en uppsättning självskapade regler.

Sättet det fungerar på är via en inbyggd ”domare” som verifierar att AI:s svar både följer dess interna resonemangsregler och framstår som lämpligt för mänsklig output. När AI ger ett solidt svar får det positiv feedback, vilket hjälper det att förbättra sin förmåga att svara på liknande frågor i framtida fall.

DeepSeek implementerar denna metod som en del av sitt DeepSeek-GRM system som står för Generative Reward Modeling. GRM fungerar annorlunda än traditionella metoder eftersom det utför parallella kontroller för att förbättra både noggrannhet och konsekvens.

”Vi föreslår Self-Principled Critique Tuning (SPCT) för att främja skalbara belöningsgenererande beteenden”, skrev forskarna i sitt dokument. ”SPCT möjliggör för [modellen] att anpassningsbart formulera principer och kritik baserat på inmatningsfrågan och svaren, vilket leder till bättre belöningsresultat.”

Med detta system hävdar DeepSeek att dess AI nu kan prestera bättre än konkurrenter som Googles Gemini, Metas Llama och OpenAI:s GPT-4o, särskilt när det gäller komplexa uppgifter som resonemang eller beslutsfattande, som noterat av Euronews.

Viktigt är att DeepSeek säger att det planerar att släppa dessa nya verktyg som open-source mjukvara, även om inget släppdatum har delats.

Var den här artikeln hjälpsam?
Betygsätt den!
Riktigt usel Halvdålig Helt ok Riktigt bra! Älskade den!

Vad kul att du gillar vårt arbete!

Skulle du, som vår uppskattade läsare, vilja uppmärksamma oss på Trustpilot? Det går snabbt och betyder jättemycket för oss. Tack för att du är så fantastisk!

Betygsätt oss på Trustpilot
0 Betygsatt av 0 användare
Titel
Kommentera
Tack för din feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lämna en kommentar

Loader
Loader Visa mer...