AccueilActualitésAlibaba lance Qwen3, une nouvelle génération de modèles IA open source à raisonnement hybride

#Intelligence Artificielle (IA)

Alibaba lance Qwen3, une nouvelle génération de modèles IA open source à raisonnement hybride

  • Publié le 29/04/2025
  • 4min. de temps de lecture
  • Hangzhou, Chine – Le 29 avril 2025 – Alibaba lance Qwen3, la dernière génération de sa famille de grands modèles de langage (LLM) open-source, marquant une nouvelle étape pour l’innovation en intelligence artificielle.

    La série Qwen3 comprend six modèles denses et deux modèles Mixture-of-Experts (MoE), offrant aux développeurs une flexibilité pour créer des applications de nouvelle génération sur des appareils mobiles, des lunettes intelligentes, des véhicules autonomes, des robots et plus encore. Tous les modèles Qwen3 – y compris les modèles denses (0,6B, 1,7B, 4B, 8B, 14B et 32B paramètres) et les modèles MoE (30B avec 3B actifs et 235B avec 22B actifs) – sont désormais open source et disponibles à l’échelle mondiale.
     

    Un raisonnement hybride combinant modes de réflexion et non-réflexion

    Qwen3 marque le lancement par Alibaba de modèles de raisonnement hybride, combinant les capacités traditionnelles des LLM avec un raisonnement dynamique et avancé. Les modèles Qwen3 peuvent passer de manière fluide entre un mode “thinking” pour les tâches complexes et multi-étapes telles que les mathématiques, la programmation et la déduction logique, et un mode “non-thinking” pour des réponses rapides et générales.

    Pour les développeurs accédant à Qwen3 via API, le modèle offre un contrôle granulaire sur la durée de réflexion (jusqu’à 38 000 tokens), permettant un équilibre optimisé entre performance intelligente et efficacité de calcul. Le modèle MoE Qwen3-235B-A22B réduit considérablement les coûts de déploiement par rapport à d’autres modèles de pointe, renforçant l’engagement d’Alibaba pour une IA haute performance et accessible.
     

    Des avancées dans les compétences multilingues, les capacités des agents, le raisonnement et l’alignement humain

    Entraîné sur un vaste jeu de données de 36 trillions de tokens (le double de son prédécesseur Qwen2.5), Qwen3 apporte des avancées significatives :

    • Une maîtrise multilingue : prend en charge 119 langues et dialectes, avec une performance avancée en traduction et suivi d’instructions multilingues.
    • Une intégration avancée des agents : prend en charge nativement le Model Context Protocol (MCP) et un appel de fonctions robuste, ce qui place les modèles open source en tête dans les tâches complexes basées sur des agents.
    • Un raisonnement supérieur : surpasse les modèles précédents de Qwen (QwQ en mode réflexion et Qwen2.5 en mode non-réflexion) dans les repères de mathématiques, programmation et raisonnement logique.
    • Un alignement humain amélioré : offre une écriture créative plus naturelle, des jeux de rôle et des dialogues multi-tours pour des conversations plus naturelles et engageantes.


    Des performances supérieures dans les benchmarks de l’industrie

    Grâce aux avancées dans l’architecture des modèles, à l’augmentation des données d’entraînement et à des méthodes d’entraînement plus efficaces, les modèles Qwen3 obtiennent des résultats supérieurs dans des benchmarks industriels tels que AIME25 (raisonnement mathématique), LiveCodeBench (compétence en programmation), BFCL (capacité d’utilisation d’outils et d’appels de fonctions) et Arena-Hard (benchmark pour les LLM ajustés aux instructions). Pour développer le modèle de raisonnement hybride, un processus d’entraînement en quatre étapes a également été mis en place, comprenant un démarrage à froid de chaîne de pensée longue (CoT), un apprentissage par renforcement basé sur le raisonnement (RL), la fusion des modes de réflexion et RL général.
     

    Un accès libre pour stimuler l’innovation

    Les modèles Qwen3 sont désormais disponibles en téléchargement gratuit sur Hugging Face, Github et ModelScope, et peuvent être explorés sur chat.qwen.ai. L’accès à l’API sera bientôt disponible via Model Studio, la plateforme de développement de modèles IA d’Alibaba. Qwen3 alimente également Quark, l’application d’assistant IA d’Alibaba,.

    Depuis ses débuts, la famille de modèles Qwen a attiré plus de 300 millions de téléchargements dans le monde. Les développeurs ont créé plus de 100 000 modèles dérivés basés sur Qwen sur Hugging Face, faisant de Qwen l’une des séries de modèles d’IA open-source les plus largement adoptées au monde.


    À propos de la société / marque :