Gemini : le nouveau modèle d'IA de Google destiné à défier la domination d'OpenAI

Rédigé le 22/12/2023
Articlophile NL


Google a introduit une nouvelle famille de modèles d'IA appelée Gemini, qui vise à rivaliser avec les capacités des modèles OpenAI. Gemini se compose de trois versions : Gemini Ultra, Gemini Pro et Gemini Nano. Gemini Ultra est la version la plus puissante et devrait concurrencer le GPT4 d'OpenAI, tandis que Gemini Pro est comparable à GPT3.5 et Gemini Nano prend en charge la prise en charge LLM sur l'appareil. Ces modèles ont montré des résultats prometteurs en matière de génération de texte, surpassant les experts humains dans l'ensemble de données MMLU utilisé pour évaluer les modèles de langage. Gemini Pro sera disponible via Google AI Studio et Vertex AI à partir du 13 décembre, tandis que Gemini Ultra devrait sortir tôt l'année prochaine.

Ce qui distingue Gemini des autres modèles, ce sont ses capacités multimodales. Il peut traiter des entrées audio et visuelles en plus du texte et produire des sorties sous forme de texte et d'images. Cela ouvre de nouvelles possibilités d'expériences interactives, comme combiner une photo avec un message vocal pour trouver une recette et recevoir des instructions écrites et une photo expliquant comment disposer le plat. Gemini excelle également dans la compréhension et le raisonnement avec des graphiques, permettant aux entreprises d'extraire rapidement des informations à partir d'ensembles de données complexes.

La capacité de Gemini à traiter différents types de données, notamment le texte, les images et le code, le distingue des modèles comme PaLM 2. Cette capacité multimodale permet des interactions plus intuitives avec les informations. Par exemple, Gemini peut être utilisé avec Multimodal RAG pour améliorer la communication et la compréhension d'ensembles de données complexes.

L'un des avantages de Gemini par rapport à PaLM 2 est sa capacité à apprendre de diverses sources. Comme Gemini est intégré aux outils d'IA existants comme Bard, basé sur PaLM 2, il devrait bénéficier des capacités de Gemini au fil du temps. Cette intégration de différents modèles offre une solution d’IA plus complète et polyvalente.

Bien qu'il existe encore des incertitudes concernant les prix de Gemini, la disponibilité régionale et le calendrier de lancement, Google a sans aucun doute fait des progrès significatifs dans la course à GenAI. ML6, une entreprise collaborant étroitement avec Google, est ravie d'explorer la valeur potentielle que Gemini peut apporter.