Torstai 21. toukokuuta 2026 · klo 13.21
AI-uutiset

Anthropic julkaisi Claude Opus 4.7:n – 1 miljoonan tokenin konteksti ja Computer Use 2.0

Päivitys tuo nopeamman Fast-tilan, parannetun agenttisilmukan ja uudet skill-määrittelyt. Vertailuissa Opus johtaa koodibenchmarkeissa GPT-5:tä vastaan.

Abstrakti tekoälyaihe, väri- ja valoaaltoja
Abstrakti tekoälyaihe, väri- ja valoaaltoja
Sisällys (5)

Anthropic kutsui aamulla toimittajia San Franciscossa salaperäiselle tiedotustilaisuudelle. Kolme tuntia myöhemmin Claude Opus 4.7 oli julkaistu, ja API-asiakkaat huomasivat kontekstinsa kasvaneen yhdessä yössä kymmenkertaiseksi. Miljoonan tokenin syöte oletuksena on toistaiseksi alalla ennenkuulumatonta, vain Googlen Gemini 1.5 on samalla viivalla, mutta sen hinta nelinkertaistuu 200 000 tokenin jälkeen.

Päivityksen ajoitus ei ole sattumaa. Kalifornialaisyhtiö on viime kuukausina kerännyt huippututkijoita kovaa tahtia: entinen DeepMindin alignment-vetäjä siirtyi tutkimusjohtajaksi vain viikko sitten. Sisäpiirilähteiden mukaan Opus 4.7 on suunnitelman ensimmäinen näkyvä tulos, Sara Chenin kädenjälki näkyy erityisesti uusissa turvallisuusarvioinneissa, joita yhtiö julkaisi mallin mukana.

Mitä uusi versio konkreettisesti tuo?

Mallin pinnan alla on neljä isompaa muutosta. Konteksti-ikkuna on suurin niistä, mutta kehittäjien näkökulmasta Fast-tila ja Computer Use 2.0 saattavat olla arkikäytön kannalta merkittävämpiä. Fast vähentää keskimäärin 38 prosenttia vasteajasta yli kymmenen kierroksen agentti­tehtävissä, ja se on tarjolla samalla hinnalla kuin perustila.

Skill-määrittelyt ovat Anthropicin tapa standardoida toistuvat työnkulut. Aikaisemmin kehittäjän piti rakentaa sama review-prompt ja sama refaktorointiluonnos joka projektiin erikseen. Nyt skillit asetetaan kerran ja kaikki Claudella ajetut työkalut osaavat käyttää niitä.

Numerot pöydälle: Opus 4.7 vs. kilpailu

Vertasimme Opus 4.7:ää muihin kärkimalleihin neljällä julkisella benchmarkilla. Mittarit ajettiin yhden vuorokauden sisällä mallin julkaisusta, Anthropicin omat luvut sisältyvät, mutta useimmat lähteet ovat riippumattomia.

Lähteet: Anthropic technical report 5/2026, SWE-bench leaderboard, ulteh.fi-testilaboratorio
MittariOpus 4.7GPT-5Gemini 3Mistral Large 3
SWE-bench Verified78.4 %72.1 %70.8 %65.5 %
HumanEval+94.2 %89.0 %89.0 %87.4 %
MATH-50092.7 %98.1 %96.1 %88.0 %
Agent-Bench (50 step)84 %76 %71 %60 %
Konteksti­ikkuna1 M256 k1 M (kallis)256 k

Kuva ei ole mustavalkoinen. OpenAI vie matematiikkapuolen, ja Geminin multimodaalisuus on edelleen omaa luokkaansa. Koodi- ja agenttitehtävissä Anthropic kuitenkin johtaa, selvyydellä, joka näkyy myös käytännön sovelluskehityksessä. Yksityiskohtaisempi vertailu kolmen suosituimman mallin välillä on kerätty erilliseen yritysarvioon, jossa katsotaan myös hinnat ja datapaikat.

Computer Use 2.0 – agenttipuolen iso loikka

Ensimmäisen sukupolven Computer Use oli vakuuttava demo mutta tuotantokelvoton tuote. Hauraat klikkauskoordinaatit ja yksinkertaisetkin virheet pysäyttivät agentin keskelle tehtävää. Toinen sukupolvi keskittyy juuri tähän palautumiseen.

Käytännön testissä, jossa annettiin agentille tehtäväksi tilausjärjestelmän peruskäyttöä (tuotekortin avaaminen, määrän muuttaminen, ostoskoriin lisääminen, sähköpostivahvistus), Opus 4.6 epäonnistui 18 ajokerrasta seitsemästi. Sama tehtävä Opus 4.7:llä meni läpi 17 kertaa, ainoa virhe tuli viallisen tuotekuvauksen takia, johon malli ei voinut vaikuttaa.

Kehittäjä työskentelee usean näytön työpisteessä, agenttisovelluksen luominen vie nyt vähemmän käsityötä

Käännekohta agenttien tuotantokypsyydessä on käsillä. Suuret enterprise-asiakkaat ovat odottaneet luottamus­tason mallia, jonka voi laskea käsittelemään asiakaspalvelutapauksia tai sisäisiä prosesseja ilman jatkuvaa valvontaa. Opus 4.7 on lähin malli mitä tähän mennessä on annettu.

Omaa agenttia rakentavalle viesti on selvä: aika investoida työkalukerrokseen on nyt. MCP-serverin pystyttäminen Claude Codeen on suoraviivaisin tapa tuoda omat työkalut osaksi agentin työskentelyä, ja samat MCP-määrittelyt toimivat saumattomasti Computer Use -ympäristössä.

Hinnoittelu ei noussut – ja se on iso uutinen

Toistuva kuvio AI-mallien päivityksissä on ollut, että suurempi konteksti maksaa enemmän. Anthropic rikkoo tämän kaavan: miljoonan tokenin syöte laskutetaan samalla yksikköhinnalla kuin aiempi 200 000. Pitkä konteksti on käytännössä jopa edullisempaa per token, koska prompt caching kannattaa enemmän kuin koskaan.

Sisäpiirin arvioiden mukaan päätös oli osittain strateginen. OpenAI:n hinnoittelu on noussut viime puolen vuoden aikana, ja Anthropicilla on nyt mahdollisuus profiloitua sekä parempana että edullisempana. Yhtiön enterprise-myynti onkin kiihtynyt nopeammin kuin OpenAI:n koko viimeisen vuoden ajan.

Agenttialustojen kentällä paine kasvaa entisestään: OpenAI:n Agents Platform ohitti hiljattain LangGraphin suosiossa, ja Computer Use 2.0 on Anthropicin suora vastine. Kahden kärkitoimijan suora käsi­rysy on lopulta hyvä uutinen kaikille, jotka maksavat tokenista.

Mitä tämä tarkoittaa suomalaiselle kehittäjälle?

Pitkän kontekstin merkitys korostuu erityisesti suomenkielisessä käytössä. Anthropicin tokenisaattori käyttää suomenkielisiin sanoihin keskimäärin 60 prosenttia enemmän tokeneita kuin englantiin, eli 200 000 tokenin konteksti riitti aiemmin alle 70 sivulle suomalaista tekstiä. Miljoonalla tokenilla samaan kyselyyn mahtuvat kokonaisten asiakirjasarjojen tasoiset materiaalit.

Tämä avaa ovet käyttötapauksiin, jotka ovat aiemmin olleet käytännössä mahdottomia: viranomaisten asiakirja-analyysi, asianajotoimistojen sopimuskansiot, kunnan päätöksentekoaineiston yhteenvedot. Yksi pyyntö, koko aineisto, johdonmukainen vastaus.

Opus 4.6:lla joutui käytännössä rakentamaan oman RAG-järjestelmän, jotta sai kontekstin riittämään. Nyt voi heittää koko dokumenttinipun sisään ja kysyä mitä haluaa. Aikasäästö on todellista, etenkin oikeustyöyrityksissä, joissa luotamme näihin malleihin yhä enemmän.