L’IA Gemini de Google peut désormais écouter des fichiers audio pour vous aider

Par William Zimmer Le 11/04/2024 0 com

Quelques semaines seulement après avoir dévoilé son nouveau modèle d'IA phare, Gemini, destiné à concurrencer le ChatGPT d'OpenAI, Google a déjà donné un coup de fouet à cette technologie en la dotant de capacités de compréhension audio.

Selon un rapport d'Android Headlines, la dernière version 1.5 Pro de Gemini peut désormais ingérer, traiter et comprendre les données audio au-delà du texte et des images. Cette étape importante permet à Gemini de transcrire, de résumer et d'analyser des fichiers audio tels que des podcasts, des conférences, des appels à bénéfices et plus encore, directement à partir de la source audio d'origine.

Dans le contexte actuel, la plupart des outils de transcription et de résumé de l'IA s'appuient sur la conversion de l'audio en texte avant d'analyser le contenu. Mais Gemini 1.5 Pro supprime cette étape intermédiaire en comprenant l'audio à un niveau plus profond, ce qui peut améliorer la précision des réponses.

Lire également – Gemini : après Messages, l’IA de Google débarque dans cette application de la firme

Gemini peut comprendre votre voix, ou d’autres fichiers audio

Les compétences audio améliorées élargissent considérablement l'utilité de Gemini dans toute une série de cas d'utilisation professionnelle et créative. Imaginez que vous puissiez télécharger l'enregistrement d'une réunion d'entreprise de trois heures et recevoir en quelques secondes un résumé concis des points clés et des actions à entreprendre, généré par l'IA.

Les podcasters et les créateurs audio pourraient utiliser Gemini pour l'analyse thématique, les notes de préparation d'émissions et même la création de contenu audio assistée par la compréhension de l'IA. Les possibilités sont pratiquement infinies lorsque l'audio rejoint le texte et les images dans le répertoire de Gemini. Il s'agit d'un élément essentiel de la feuille de route de Google visant à faire de son modèle d'IA phare un véritable assistant multimodal capable de traiter n'importe quel type de données. D’ailleurs, Google a récemment noué un partenariat avec un géant de la publicité, donc cette nouvelle fonctionnalité pourrait bien l’aider à créer de nouvelles annonces.

Google semble adopter une approche prudente et contrôlée dans un premier temps. Pour l'instant, les nouvelles compétences audio de Gemini ne seront disponibles que via la plateforme de développement Vertex AI de Google et ses outils AI Studio, et non via le service disponible pour les consommateurs. Il s'agit d'une mesure prudente qui permettra à Google de valider rigoureusement la qualité et la robustesse des capacités audio de Gemini avant de les proposer à tous.

Gemini

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Bon plan Samsung Galaxy S25 Ultra : le smartphone haut de gamme est à prix cassé avec ce code promo !
Vous avez manqué les offres du Black Friday et attendez une nouvelle promotion pour vous offrir le Galaxy S25 Ultra à prix réduit ? À l’approche de Noël, Samsung brade son smartphone haut de gamme à l’aide d’un code promo….

Smartphone 19/12/2025
Ninja MAX PRO : ce airfryer de 6-en-1 de 6,2 L est à prix mini pour les fêtes, mais il va falloir faire vite !
Les fêtes de fin d’année approchent à grands pas, mais il vous reste encore quelques jours pour profiter des offres Ninja. Vous cherchez un airfryer compact multifonction, mais à petit prix ? Le Ninja MAX PRO de 6,2 L est actuellement à…

Bons plans 19/12/2025
Google Home : ça y est, Gemini quitte enfin les États-Unis et va très bientôt parler français
Gemini est la pierre angulaire de la révolution qui est en train de s’opérer au sein de la maison connectée de Google. Jusqu’à présent, le programme anticipé qui y donne accès était réservé aux utilisateurs États-Uniens, mais désormais l’IA maison…

Domotique 19/12/2025
Avec son iPhone pliant, Apple casse les codes : une fuite dévoile ses dimensions surprenantes
L’iPhone Fold suscite une énorme curiosité. Jusqu’à présent, les spéculations évoquaient son design et certaines caractéristiques sans jamais dévoiler un visuel. C’est désormais chose faite : une fuite vient de dévoiler un premier rendu du futur smartphone pliant d’Apple et ses…

iPhone 19/12/2025
La police arrête deux espions soupçonnés d’avoir implanté un malware capable de contrôler un ferry à distance
La DGSI enquête depuis plusieurs jours sur des soupçons d’ingérence étrangère après qu’un malware a été retrouvé à bord d’un ferry accosté en France. Deux hommes ont été arrêtés. Les malwares sont aujourd’hui considérés comme une menace très sérieuse par…

Sécurité 19/12/2025
La Voie lactée n’aura bientôt plus de secrets : l’ambitieux télescope Roman de la NASA va révolutionner notre vision de la galaxie
La NASA vient de révéler les détails de l’ambitieuse mission du télescope spatial Nancy Grace Roman : cartographier la Voie lactée avec un niveau de détail sans précédent. Cette étude s’apprête à révolutionner la compréhension de notre galaxie. La Voie…

Espace 19/12/2025
Cette voiture électrique va permettre de jouer à ses jeux PS4 et PS5 à distance pendant un trajet
Sony et Honda viennent de révéler un détail clé de la première voiture née de leur alliance en 2022 : l’Afeela 1. Celle-ci aura la particuliratié dêtre directement reliée au service Remote Play de PlayStation, permettant ainsi de streamer ses…

Voiture 19/12/2025
La PS5 Slim est à prix cassé : dernière chance avant Noël !
La PS5 Slim est affichée à son prix du Black Friday sur Amazon. Une offre exclusive qui vous permet d’économiser 100 € sur la console de Sony. La bonne nouvelle, c’est qu’il est toujours possible de vous faire livrer avant…

Jeux vidéo 19/12/2025
Google lance Androidify sur Wear OS : créez un cadran personnalisé que personne d’autre n’aura grâce à l’IA
Les fans d’Android de la première heure risquent d’être ravis de cette annonce. Après avoir ressuscité Androidify – sa plateforme culte de personnalisation de bots Android – en la dopant à l’IA, Google lance officiellement une version Wear OS de…

Montres connectées 19/12/2025
Le Galaxy Z Fold 8 devrait être bien meilleur en photo que son prédécesseur, voici ce qui va changer
Une nouvelle fuite révèle l’intégralité du système photo du Galaxy Z Fold 8. Le prochain smartphone pliant de Samsung devrait conserver le même capteur principal que son prédécesseur, mais tout le reste devrait avoir droit à une nette amélioration. Le…

Samsung 19/12/2025

Newsletter