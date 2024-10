Eine KI hat gelernt, Captchas zuverlässig zu überwinden. Dazu musste sie mehr liefern als nur Bilder erkennen. Denn die Sicherheitssoftware nutzt auch andere Indizien.

Dieser moderne Witz bezieht sich auf Captchas – jene Aufgaben, die sicherstellen sollen, dass nur Menschen auf die dahinter liegenden Seiten zugreifen und nicht automatisierte Programme. Eines der am häufigsten verwendeten Systeme ist reCAPTCHAv2, das neun zufällige Fotos von Strassenszenen zeigt, aus denen man solche mit bestimmten Objekten heraussuchen soll. Für Menschen ist das fast immer einfach, für Software war das bisher unlösbar. Doch nun hat KI auch diese letzte Bastion der Menschlichkeit gestürmt. In einer Vorabveröffentlichung zeigt eine Arbeitsgruppe um Andreas Plesner von der ETH Zürich, wie ein Maschinenlern-Algorithmus reCAPTCHAv2 zuverlässig überwindet. Dazu muss die Maschine allerdings, wie das Team erläutert, nicht allein Bilder klassifizieren – für KI-Systeme eine lösbare Aufgabe –, denn tatsächlich nutzen Captchas diverse Informationsquellen, um sicherzustellen, dass ein Mensch am Computer sitzt.

Dass Systeme zur Bilderkennung immer besser werden, berücksichtigen auch die Hersteller von Captchas. Zusätzlich haben auch Menschen immer wieder Probleme, die visuellen Captchas zu lösen, und barrierefrei sind sie ohnehin nicht. Deswegen gibt es seit Jahren «Captchas ohne Captcha», also Software, die zwischen Menschen und Bots unterscheidet, ohne dass man eine Aufgabe lösen muss. Dazu analysiert das Captcha zum Beispiel den Browserverlauf und die Bewegungen des Mauszeigers, aber auch, wie oft eine spezifische IP-Adresse bereits auf das Captcha zugegriffen hat. Entsprechende Techniken nutzen auch klassische Captchas wie reCAPTCHAv2, dort ist die Bilderkennung nur der letzte Schritt. Um das Programm zu überlisten, nutzten die Fachleute um Plesner deswegen ein System mit mehreren Komponenten.

Um das Bildrätsel von reCAPTCHAv2 zu lösen, verwendete das Team das Programm YOLO v8, eine weit verbreitete Software, die Objekte erkennt und klassifiziert. Dieses trainierte es mit rund 14 000 Paaren aus Strassenfotos und Objektbezeichnungen analog zu jenen, die reCAPTCHAv2 nutzt. Um die Bedeutung von Cookies und Browserverlauf zu bestimmen, verwendeten die Fachleute die Daten einer realen Person, und mit Hilfe spezieller mathematischer Kurven simulierten sie das unvorhersehbare Zucken der menschlichen Maushand. Schliesslich verwendeten sie ein VPN, um dem Captcha bei jedem Test eine neue IP-Adresse zu präsentieren. Ohne VPN, stellte das Team fest, aktivierte die Captcha-Software nach 20 Zugriffen einen Sicherheitsmechanismus, durch den die Captchas immer schwieriger wurden.

Auch die Mausbewegung scheint eine Rolle zu spielen: bewegte sich der Cursor, bewältigte die KI das Captcha schneller als ohne die Bewegung. Das gleiche gilt für Cookies und Browserverlauf – fehlten diese, präsentierte das System mehr neue Bilder, um sicherzustellen, dass es sich nicht um einen Bot handelt. Das von der Arbeitsgruppe konstruierte System löste in einem kompletten Testlauf dank der verschiedenen Komponenten alle präsentierten Captchas. Ihre Untersuchung zeige, dass heutige Captcha-Technologien keineswegs immun gegen KI-basierte Techniken zu ihrer Überwindung seien, schreiben die Fachleute in ihrer Veröffentlichung. Captchas müssten kontinuierlich weiterentwickelt werden, um der Entwicklung von KI voraus zu sein. Damit geht die jahrtausendealte Suche weiter, nach den Dingen, die – jenseits von Bilderkennung, Browserverlauf und Mausbewegungen – den Mensch zum Menschen machen.

