Microsoft présente un successeur de ChatGPT qui sait résoudre des puzzles et traite les images

Par Andry Nirina Le 02/03/2023

Une équipe de chercheurs de Microsoft a présenté une nouvelle IA encore plus polyvalente que le fameux ChatGPT. Elle est non seulement capable de répondre aux questions textuelles, mais elle peut aussi analyser et traiter des images.

Dans un article titré « Le langage n’est pas tout ce dont vous avez besoin : aligner la perception et les modèles de langage » (Language Is Not All You Need: Aligning Perception with Language Models), des chercheurs de Microsoft ont présenté Kosmos-1. Comme ils le rappellent dans l’introduction de leur papier, « une grande convergence du langage, de la perception multimodale, de l’action et de la modélisation du monde est une étape clé vers l’intelligence artificielle généraliste ».

On le sait, Microsoft apprécie tellement ChatGPT qu’elle a investi plusieurs milliards de dollars dans OpenAI, le concepteurdu chatbot. La firme de Redmond souhaite intégrer cette invention dans plusieurs de ses logiciels. Le moteur de recherche de la compagnie, Bing, utilise GPT 3.5, une évolution du modèle de langage utilisé par ChatGPT. Mais la firme de Redmond ne compte pas s’arrêter là. Une véritable IA généraliste ne pourra pas se contenter de comprendre un texte. Elle devra être en mesure d’interpréter des images et leurs contextes, ou bien de comprendre des signaux sonores. En d’autres termes, elle devra, tout comme l’être humain, exploiter les cinq sens.

Kosmos-1 va succéder à ChatGPT, il comprend les textes et les images

La nouvelle IA présentée par Microsoft, est capable de faire la même chose que ChatGPT, et plus encore. En effet, Kosmos-1 n’est pas qu’un agent conversationnel. Selon ses créateurs, « il atteint des performances impressionnantes en matière de compréhension et de génération de langage, de dialogue multimodal, de sous-titrage d’images, de réponse à des questions visuelles et de tâches de vision (telles que la classification selon des instructions textuelles) ».

Un questionnaire visuel soumis à Kosmos-1 / Crédit : Microsoft

On se rapproche donc encore plus du fameux concept d’Intelligence artificielle généraliste, qui pourra remplacer l’être humain dans toutes les tâches intellectuelles. Faut-il s’en réjouir ou s’en inquiéter ? Une chose est sûre, c’est que l’IA est d’ores et déjà en train de bouleverser notre société.

ChatGPT

Voir les commentaires