o1, le nouveau modèle d’OpenAI capable de « penser » ?

Choses à Savoir TECH - A podcast by Choses à Savoir

Categories:

OpenAI frappe fort avec sa nouvelle série de modèles IA, lancée le 12 septembre : o1-preview et o1-mini. Leur objectif ? Aider à « réfléchir avant de réagir ». Ces modèles, disponibles pour les abonnés payants de ChatGPT, se révèlent impressionnants. Pensés pour traiter des tâches complexes et résoudre des problèmes mathématiques ardus, ils surpassent nettement le modèle GPT-4o dans leur domaine de compétence.Pour démontrer les capacités de o1, OpenAI a soumis ses modèles à l'examen de qualification de l'Olympiade internationale de mathématiques (IMO), une compétition qui rassemble les meilleurs lycéens du monde. Là où GPT-4o n'avait résolu que 13 % des problèmes, le modèle o1 a atteint un score impressionnant de 83 %. En matière de sécurité, o1 s'illustre également, étant quatre fois plus efficace que GPT-4o pour bloquer les contenus potentiellement dangereux. On pourrait presque qualifier le modèle d'IA o1 de « petit génie » de l’intelligence artificielle.Ses compétences en raisonnement sont telles qu'il dépasse la précision humaine à un niveau doctorat sur plusieurs tests. Si ses talents sont particulièrement utiles en mathématiques, ils s'étendent aussi au codage, aux sciences et à d'autres domaines. Par exemple, des physiciens peuvent utiliser o1 pour générer des formules complexes en optique quantique, tandis que des développeurs peuvent l'employer pour créer des workflows multi-étapes, ou encore des chercheurs en santé pour annoter des données de séquençage cellulaire. Toutefois, o1 n’a pas encore toutes les fonctionnalités de ChatGPT, comme l'accès aux fichiers ou aux images. Mais pour les tâches de raisonnement, il est inégalé. Quant à o1-mini, il s’agit d’une version plus légère et abordable. Actuellement réservée aux abonnés de ChatGPT Plus et Team, OpenAI promet que cette technologie sera bientôt accessible à tous. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Visit the podcast's native language site