
Image by TechCrunch, from Flickr
AI som tänker innan den talar? Claude 3.7 Sonnet lanserar hybridresonemang
Anthropic har lanserat Claude 3.7 Sonnet, en ny version av dess AI-modell som inför ett valfritt ”utökat tänkande”-läge, vilket ger användarna mer kontroll över hur modellen bearbetar komplexa uppgifter.
Har bråttom? Här är de snabba fakta!
- Modellen förbättrar resonemang och problemlösning genom att tillåta självreflektion innan svar.
- Utökad tänkande-läge är endast tillgängligt på betalda planer.
- Claude Code, en kodningsassistent, är i begränsad förhandsvisning för utvecklare
Anthropic har släppt Claude 3.7 Sonnet, en uppdaterad AI-modell som introducerar hybrid resonemang, vilket ger användare möjlighet att välja mellan snabba svar och förlängt tänkande.
Detta nya tillvägagångssätt syftar till att förbättra problemlösningen genom att möjliggöra för modellen att ta extra tid att utvärdera och förfinar sina svar vid behov.
I standardläge fungerar Claude 3.7 Sonnet som en iterativ förbättring jämfört med sin föregångare, Claude 3.5 Sonnet. I förlängt tänkande-läge, engagerar sig dock modellen i självreflektion innan den producerar ett svar.
Michael Gerstenhaber, Anthropic’s produktledare för AI, beskrev funktionen som ett sätt för användare att balansera svarstid och resonemangsdjup. ”[Användaren] har mycket kontroll över beteendet – hur länge det tänker, och kan byta resonemang och intelligens mot tid och budget”, sa han, enligt WIRED.
Syftet med denna process är att förbättra noggrannheten inom områden som kräver flerstegsresonemang, såsom matematik, fysik, kodning och instruktionsföljning. Användare som interagerar med modellen via API kan ange en gräns för hur många tokens den använder för att ”tänka”, vilket tillåter kontroll över svarshastighet och kostnad.
WIRED noterar att uppdateringen också inkluderar en ”skissblock”-funktion, som gör modellens resonemangs steg synliga när den behandlar en förfrågan. Detta tillvägagångssätt liknar tekniker som används i andra AI-modeller, såsom DeepSeek’s.
Anthropic anger att Claude 3.7 Sonnet har optimerats för tillämpningar i verkligheten snarare än tävlingsstil-benchmarks. Tidiga tester tyder på att det utökade resonemanget förbättrar prestanda på uppgifter som involverar komplexa kodbasar, avancerad verktygsanvändning och full-stack mjukvaruutveckling.
Modellen har utvärderats på SWE-bänken Verifierad och TAU-bänken, där den enligt uppgift överträffar tidigare versioner, som rapporterats av Anthropic.
CNN Noterar att Anthropic har hållit priset för Claude 3.7 detsamma som tidigare modeller, vilket positionerar den under OpenAI:s senaste erbjudanden. Den kostar $3 per miljon inmatade tokens och $15 per miljon utmatade tokens, jämfört med OpenAI:s $15 och $60 för liknande nivåer.
Lämna en kommentar
Avbryt