
Google I/O : "AI" apparaît une fois par minute dans la keynote - ça veut tout dire

De l'aide aux devoirs à la recherche de photos en passant par la planification de votre prochain voyage de vacances, les outils d'IA de Google sont censés vous aider en toutes circonstances. Google a présenté les dernières possibilités lors de la keynote de sa conférence des développeurs I/O de cette année.
Pendant deux heures, l'ouverture de l'I/O, dont le thème était "Making AI helpful for everyone", n'a porté que sur l'IA. Au total, l'acronyme anglais AI a été prononcé 120 fois au cours de la présentation. Google a fait recompter ses IA. Au total, il s'agissait de savoir dans quels produits propres Google l'intègre, comment elle peut aider et quels Large Language Models (LLM) fonctionnent en arrière-plan. Alors que certains outils seront bientôt utilisables sur votre smartphone, vous devrez encore attendre pour d'autres. Certains nécessitent même l'utilisation d'un service payant de Google.
L'IA aide à la recherche
La recherche est toujours le cœur de Google. Le groupe s'efforce donc de la rendre encore plus indispensable grâce à des outils d'IA. Par exemple, avec les "AI Overviews". Il s'agit d'aperçus IA en tant que résultats de recherche, qui fournissent des réponses à des questions très spécifiques en utilisant l'ensemble des données de Google. Cela inclut Google Maps et les avis sur les magasins, les restaurants, etc. Par exemple, si vous cherchez un studio de yoga qui propose également des cours de Pilates, qui est bien noté et qui est à quinze minutes de chez vous. Aux États-Unis, les "AI Overviews" sont disponibles dès aujourd'hui - et devraient être accessibles à un milliard de personnes dans le monde d'ici la fin de l'année. Elles devraient donc également arriver en Europe dans les prochains mois.
Vous pouvez utiliser la recherche Google pour planifier. Par exemple, vous pouvez faire établir un plan alimentaire pour quatre personnes pendant une semaine, en tenant compte de l'une ou l'autre intolérance. L'IA devrait également être capable de créer des plans d'entraînement.
L'extension des LLM de Google, comme Gemini 1.5 Pro, permet d'utiliser le nouvel outil "Ask with Video". Comme pour une recherche d'image, vous pourrez déjà insérer une vidéo dans la fenêtre de recherche dans les prochaines semaines. Google indique que Gemini 1.5 Pro a déjà la plus grande fenêtre contextuelle avec un million de jetons. Cette valeur indique le nombre de données d'entrée que l'IA peut traiter. Selon Google, le million correspond à une heure de vidéo, 30.000 lignes de code, 14.000 pages de texte. Google prévoit de doubler ce cadre cette année pour atteindre deux millions de jetons.

Source : Google
Trouver des photos
Si vous avez téléchargé des photos sur Google Photos, vous pouvez poser des questions à leur sujet et l'IA vous fournira des réponses. Vous n'avez donc plus besoin de parcourir toutes les photos de vacances pour savoir quel était le nom du délicieux restaurant que vous avez visité. Il vous suffit de demander : "Dans quel restaurant sommes-nous allés à Rome ?" Si vous l'avez photographié, vous obtiendrez la bonne réponse. Un exemple de Google est de demander à votre enfant quand il a appris à nager. L'IA recherche alors les photos les plus anciennes de l'enfant nageant.
Des outils pour aider les créatifs
Plusieurs nouveaux outils sont destinés à aider les créatifs dans leur travail - et non à les remplacer. La "Music AI Sandbox", par exemple, suggère aux musiciens ce qu'ils pourraient essayer de faire de plus pendant qu'ils travaillent sur une chanson. Wyclef Jean fait partie des artistes qui ont déjà eu l'occasion de tester l'outil et livre sa première chanson créée avec :
Avec "Veo", Google travaille sur un modèle génératif pour les vidéos. Comme l'outil musical, il n'est pour l'instant disponible que pour une sélection de personnes. Le réalisateur et acteur Donald Glover devrait prochainement publier une vidéo ou un court-métrage créé avec Veo.
En revanche, Google accepte déjà les inscriptions à l'essai pour "Imagen 3". L'outil de création générative d'images devrait, dans sa troisième génération, comprendre des invites plus étendues et générer plus de détails et moins d'artefacts.
Android aura encore plus d'IA intégrée
Sous Android, Google semble lentement remplacer Assistant par Gemini. L'outil d'IA devrait agir comme un meilleur assistant (vocal) moderne. Grâce à la fonction "On Device AI", l'outil peut utiliser des données personnelles qui restent sur l'appareil lors du traitement.

Source : Google
Les fonctions de recherche par IA déjà mentionnées seront également disponibles sous Android. De plus, Google ajoute des contenus d'apprentissage à Circle-to-search avec son nouveau modèle d'IA LearnLM. Vous pouvez par exemple l'utiliser pour entourer des devoirs scolaires et obtenir non pas simplement la réponse, mais une explication ou la solution. Google prévoit d'élargir les domaines thématiques et la complexité des devoirs. Google utilise également LearnLM à d'autres endroits pour créer un tuteur pour les apprenants ou un assistant pour les enseignants.
Gemini peut également faire des références lorsque vous voulez savoir quelque chose sur votre smartphone. Par exemple, l'outil comprend que votre question se rapporte à la vidéo que vous êtes en train de regarder. Vous pouvez également utiliser le clavier ou, plus précisément, la touche Gemini pour générer une image et l'insérer dans la conversation en cours.
Une aide dans de nombreuses situations
Si vous devez traiter différents points pour une tâche, Gemini vous aide à la réaliser. Par exemple, les chaussures que vous avez commandées sont trop petites : envoyez une photo à Gemini en précisant que les chaussures doivent être renvoyées. L'IA identifie le service de livraison responsable de l'enlèvement et vous donne un rendez-vous pour le faire - en utilisant l'e-mail approprié pour le processus de retour.
J'ai été encore plus impressionné par la démonstration de Project Astra. Il s'agit d'une IA parlante qui a accès à la caméra d'un smartphone et qui fonctionne également dans des lunettes de données. Elle peut vous dire si elle reconnaît quelque chose que vous cherchez. Mais elle peut aussi se souvenir de l'endroit où se trouve un objet. Elle reconnaît l'environnement et peut décrire ce qu'elle voit, répondre à des questions à ce sujet ou même expliquer du code.
Un autre outil peut transformer les données en conversation, Google l'appelle "Audio Overwiews". Si les données saisies sont des manuels scolaires, le contenu peut être expliqué sous forme de dialogue. Vous pouvez également poser des questions à tout moment, qui seront ensuite traitées.
Utiliser l'IA de manière responsable
Google s'engage à utiliser l'IA de manière responsable. Il s'agit de trouver des lacunes et des erreurs dans ses propres modèles, mais aussi d'empêcher l'utilisation abusive de l'IA. Les contenus créés par une IA reçoivent un filigrane inamovible via SynthID, qui les identifie clairement comme étant créés artificiellement. Google étend maintenant ce système des photos à la musique et aux vidéos. Pour les textes, un système de filigrane open-source devrait voir le jour dans les prochains mois.


Lorsque j'étais à l'école primaire, je m'asseyais dans le salon d'un ami avec de nombreux camarades de classe pour jouer à la Super NES. Aujourd'hui, je mets directement la main sur les dernières technologies et les teste pour vous. Ces dernières années, j'ai travaillé chez Curved, Computer Bild et Netzwelt, et maintenant chez Digitec et Galaxus.