Claude Mythos vindt duizenden lekken in veelgebruikte toeps

Vorige maand lanceerde het ki-bedrijf Anthropic het project Glasswing, om belangrijke toepassingen op kwetsbaarheden te controleren om inbraken met concurrente (?) ki-programma’s en de daaruit volgende schade te voorkomen. Sindsdien hebben 50 meewerkende partijen an Anthtopic meer dan tienduizend ernstige of kritieke kwetsbaarheden gevonden in de meest systeemrelevante programmatuur ter wereld, aldus het ki-bedrijf. Voorheen ging beveiliging van sytemen om hoe snel nieuwe kwetsbaarheden konden worden gevonden. Nu wordt die beperkt door hoe snel de grote aantallen die  door ki gevonden kwetsbaarheden worden kunnen worden geverifieerd, openbaargemaakt en verholpen, aldus meldt het bedrijf.De wapenwedloop in volle gang.

Claude Mythos lekzoeker

De door Claude Mythos lekzoeker ontdekte kwetsbaarheden. Ontwikkelasars zullen moeten beseffen dat de spelregels razendsnel veranderen… (afb: anthropic.com)

Na een maand zijn al zo’n tienduizend kwetsbaarheden gevonden. Verschillende partners van Anthropic hebben laten weten dat hun foutvindsnelheid meer dan vertienvoudigd is. Cloudflare, een Amerikaans bedrijf dat webdiensten aanbiedt, heeft bijvoorbeeld 2000 lekken gevonden (waarvan 400 zeer ernstig of kritiek zijn) in hun kritieke systemen, met een vals-positief percentage dat Cloudflare beter acht dan dat van menselijke testers.
Mozilla vond en verhielp 271 kwetsbaarheden in Firefox 150 tijdens het testen met Mythos Preview;  meer dan tien keer zoveel als ze vonden in Firefox 148 met Claude Opus 4.6;

Over het algemeen zien we nu dat gerepareerde toeps veel sneller worden beschikbaargesteld, stelt Anthropic. De nieuwste versie van Palo Alto Networks bevatte meer dan vijf keer zoveel ‘pleisters’ dan normaal. Microsoft heeft aangegeven dat het aantal nieuwe reparaties dat ze uitbrengen nog geruime tijd zal blijven toenemen.  Oracle vindt en verhelpt kwetsbaarheden in zijn producten en ‘wolk’ vele malen sneller dan voorheen. Dat zal natuurlijk ook wel moeten gezien de toegenomen mogelijkheden die lekken te ontdekken. Net als de beveiliging in zijn geheel is ook het ontdekken van kwetsbaarheden een race om de tijd geworden.

Open bron

De afgelopen maanden heeft Anthropic Mythos Preview gebruikt om meer dan 1000 open-bronprojecten door te lichten, die samen een groot deel van internet – en een groot deel van de eigen infrastructuur van het bedrijf – ondersteunen. Tot nu toe heeft Mythos Preview 6202 ernstige of kritieke kwetsbaarheden in deze projecten gevonden (van de 23 019 in totaal, inclusief de kwetsbaarheden die als gemiddeld of weinig ernstig worden ingeschat).
1752 van deze kwetsbaarheden met een hoge of kritieke ernst zijn nu zorgvuldig beoordeeld door een van de zes onafhankelijke beveiligingsonderzoeksbureaus, of in een klein aantal gevallen door Anthropic. Hiervan bleken 90,6% (1587) geldige positieve resultaten te zijn en 62,4% (1094) werd bevestigd als kwetsbaar met een hoge of kritieke ernst. Anthropic is van  plan om nog enige tijd door te gaan met het doorlcihten van open-broncode, dus is de verwachting dat dit aantal zal stijgen.

Het is duidelijk dat modellen die net zo capabel zijn als Mythos Preview binnenkort door veel verschillende ki-bedrijven zullen worden ontwikkeld, stelt Anthropic. Het waarschuwt dat geen enkel bedrijf – ook Anthropic niet geeft het bedrijf toe – voldoende beveiligingsmaatregelen heeft ontwikkeld om misbruik van dergelijke modellen te voorkomen en te voorkomen dat ze ernstige schade aanrichten.
Daarom heeft Anthropic nog geen modellen van het Mythos-niveau openbaar gemaakt. Dat zou ook de reden zijn waarom het project Glasswing is gestart. Als een vergelijkbaar capabel model zonder dergelijke beveiligingsmaatregelen wordt uitgebracht, wordt het voor vrijwel iedereen ter wereld aanzienlijk goedkoper en makkelijker om misbruik te maken van deze programmatuur.

Bron: hackernews.com

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.