OpenAI lance GPT-OSS : un modèle d’intelligence artificielle ouvert, gratuit et optimisé pour smartphones et PC

OpenAI a franchi une étape importante dans le domaine de l’intelligence artificielle en dévoilant GPT-OSS, un modèle de langage ouvert (open-weight) accessible gratuitement, conçu spécifiquement pour fonctionner efficacement sur des appareils grand public tels que les smartphones et les PC. Cette initiative marque un tournant majeur vers une démocratisation plus large des technologies IA, en proposant un modèle puissant, flexible et local, qui s’oppose à la dépendance exclusive aux services cloud.

Un modèle open-weight inédit depuis GPT-2

GPT-OSS est la première version « open-weight » d’OpenAI depuis la sortie de GPT-2 en 2019. Contrairement aux modèles fermés et propriétaires utilisés jusqu’à présent, GPT-OSS est distribué avec ses poids complets sous licence Apache 2.0, ce qui permet aux développeurs et entreprises de l’exploiter, modifier et déployer librement, y compris pour des usages commerciaux.

Deux versions principales ont été lancées :

GPT-OSS 120B : un modèle de 120 milliards de paramètres utilisant une architecture « Mixture-of-Experts » (MoE) innovante. Ce système active un petit nombre d’experts spécialisés par requête, ce qui réduit drastiquement la charge computationnelle. Il offre des performances comparables aux modèles les plus puissants d’OpenAI tout en restant exécutable sur une seule carte graphique haut de gamme (Nvidia 80 Go).
GPT-OSS 20B : un modèle plus léger, avec environ 20 milliards de paramètres, optimisé pour tourner sur des machines grand public dotées d’au moins 16 Go de RAM. Il vise à permettre l’exécution locale sur PC portables, smartphones Android ou iOS, offrant ainsi un accès autonome à l’intelligence artificielle avancée.

Architecture et innovations techniques

La technologie MoE est la clé de cette innovation. Chaque couche du modèle comprend plusieurs centaines d’experts, mais seuls quelques-uns sont activés par token, rendant possible la combinaison de puissance et d’efficacité. Cette approche permet à GPT-OSS de rivaliser avec des modèles plus lourds tout en réduisant la consommation mémoire et énergétique.

Cette architecture innovante facilite également la personnalisation et le fine-tuning, ouvrant la porte à des applications très variées allant des assistants vocaux, outils de codage, agents conversationnels, jusqu’aux applications de recherche.

Performances et usages pratiques

Les tests montrent que GPT-OSS 120B égalise les capacités de GPT-4 Mini (o4-mini), notamment dans le raisonnement, la compréhension contextuelle et la génération de code. Le modèle 20B, quant à lui, est particulièrement performant pour les usages sur appareils mobiles, où il permet une interaction fluide sans dépendance au cloud.

Cette autonomie garantit une meilleure confidentialité des données, une réduction des coûts liés à la connexion internet, et une plus grande rapidité d’exécution.

Sécurité et responsabilité

OpenAI assure que GPT-OSS a été soumis à des tests rigoureux pour limiter les risques d’utilisation malveillante, y compris pour la génération de contenus sensibles ou dangereux. Le modèle intègre des filtres et mécanismes d’auto-surveillance alignés sur la politique de sécurité d’OpenAI.

Accessibilité et écosystème

GPT-OSS est d’ores et déjà disponible sur des plateformes majeures telles que Hugging Face, Azure AI Foundry, AWS Bedrock et Amazon SageMaker, facilitant ainsi son adoption par les développeurs, startups et grandes entreprises.

Ce lancement intervient alors que la concurrence s’intensifie, avec d’autres acteurs développant des modèles ouverts ou hybrides. OpenAI affirme ainsi sa volonté d’encourager l’innovation ouverte tout en gardant un rôle de leader.

OpenAI lance GPT-OSS : un modèle d’intelligence artificielle ouvert, gratuit et optimisé pour smartphones et PC

Un modèle open-weight inédit depuis GPT-2

Architecture et innovations techniques

Performances et usages pratiques

Sécurité et responsabilité

Accessibilité et écosystème

J’aime ça :

carle

Google I/O 2026 : Google veut réinventer Internet autour de l’intelligence artificielle

Sony Xperia 1 VIII : Sony mise sur l’IA photo, mais les internautes ne sont pas convaincus

Mythos, l’IA d’Anthropic, aide des chercheurs à découvrir une faille critique dans macOS

Instagram Instants : la nouvelle fonction de photos éphémères qui veut concurrencer BeReal

Samsung déploie One UI 8.5 sur d’anciens Galaxy : Android 16 arrive enfin sur plusieurs modèles

Linux sous pression : gaming, anniversaire de Tux et nouvelles failles critiques secouent l’écosystème

Netflix augmente encore ses prix pendant que Google prépare une nouvelle génération d’IA remy autonome

Google prépare la plus grande révolution Android de son histoire : Android 17 sera dévoilé le 12 mai

Chrome installe un modèle d’IA de 4 Go sur votre disque sans prévenir ? La réalité est plus nuancée

iOS 26.5 : Apple corrige enfin la faiblesse des messages entre iPhone et Android

Un modèle open-weight inédit depuis GPT-2

Architecture et innovations techniques

Performances et usages pratiques

Sécurité et responsabilité

Accessibilité et écosystème

J’aime ça :

carle

🔥Recommandations