Une IA a appris à surmonter les captchas de manière fiable. Pour cela, elle a dû fournir plus que la simple reconnaissance d'images. En effet, le logiciel de sécurité utilise également d'autres indices.

Cette blague moderne fait référence aux captchas, ces tâches qui visent à s'assurer que seuls les humains accèdent aux sites sous-jacents et non des programmes automatisés. L'un des systèmes les plus utilisés est reCAPTCHAv2, qui présente neuf photos aléatoires de scènes de rue parmi lesquelles il faut choisir celles qui contiennent des objets spécifiques. Pour les humains, c'est presque toujours facile, mais pour les logiciels, c'était jusqu'à présent insoluble. Mais l'IA a désormais pris d'assaut ce dernier bastion de l'humanité. Dans une prépublication, un groupe de travail dirigé par Andreas Plesner de l'ETH Zurich montre comment un algorithme d'apprentissage automatique peut surmonter reCAPTCHAv2 de manière fiable. Comme l'explique l'équipe, la machine ne doit pas seulement classer les images - une tâche réalisable pour les systèmes d'IA - car les captchas utilisent en fait diverses sources d'information pour s'assurer qu'un humain est assis devant l'ordinateur.

Les fabricants de captchas tiennent compte de l'amélioration des systèmes de reconnaissance d'images. En outre, les humains ont toujours du mal à résoudre les captchas visuels, et ils ne sont de toute façon pas accessibles. C'est pourquoi il existe depuis des années des "captchas sans captcha", c'est-à-dire des logiciels qui font la différence entre les humains et les bots sans que l'on ait à résoudre une tâche. Pour cela, le captcha analyse par exemple l'historique du navigateur et les mouvements du curseur de la souris, mais aussi le nombre de fois qu'une adresse IP spécifique a déjà accédé au captcha. Les captchas classiques comme reCAPTCHAv2 utilisent également des techniques similaires, la reconnaissance d'image n'étant que la dernière étape. Pour déjouer le programme, les experts de Plesner ont donc utilisé un système à plusieurs composants.

Pour résoudre l'énigme de l'image reCAPTCHAv2, l'équipe a utilisé le programme YOLO v8, un logiciel largement utilisé pour reconnaître et classer les objets. Elle l'a entraîné avec environ 14 000 paires de photos de rues et de noms d'objets analogues à ceux utilisés par reCAPTCHAv2. Pour déterminer la signification des cookies et de l'historique de navigation, les spécialistes ont utilisé les données d'une personne réelle et, à l'aide de courbes mathématiques spéciales, ils ont simulé le tressaillement imprévisible de la main humaine de la souris. Enfin, ils ont utilisé un VPN pour présenter une nouvelle adresse IP au captcha à chaque essai. Sans VPN, l'équipe a constaté qu'après 20 accès, le logiciel Captcha activait un mécanisme de sécurité qui rendait les captchas de plus en plus difficiles.

Le mouvement de la souris semble également jouer un rôle : si le curseur bougeait, l'IA gérait le captcha plus rapidement que sans ce mouvement. Il en va de même pour les cookies et l'historique de navigation - s'ils étaient absents, le système présentait davantage de nouvelles images pour s'assurer qu'il ne s'agissait pas d'un bot. Le système conçu par le groupe de travail a résolu tous les captchas présentés lors d'un test complet grâce aux différents composants. Leur étude montre que les technologies de captcha actuelles ne sont en aucun cas immunisées contre les techniques basées sur l'IA pour les surmonter, écrivent les spécialistes dans leur publication. Les captchas doivent être continuellement améliorés pour rester en avance sur le développement de l'IA. Ainsi, la quête millénaire se poursuit, à la recherche de ce qui - au-delà de la reconnaissance d'images, de l'historique du navigateur et des mouvements de la souris - fait de l'homme un être humain.

Spektrum der Wissenschaft

