Ai2 dévoile Tülu 3, modèle open-source surpassant DeepSeek v3 et GPT-4o grâce à une nouvelle approche

notifications

Cet article reflète l'opinion personnelle du journaliste qui l’a rédigé. La note attribuée est subjective et n’engage que son auteur.

Publié par Clara Moreau | Publié le 6 février 2025

AI2 lance le modèle Tulu-3 en open source, surpassant DeepSeek V3 et GPT-4o, avec accès complet aux données et méthodes, encourageant transparence et collaboration en IA. Contrairement à DeepSeek-R1, dont les données de formation restent secrètes, AI2 promeut une recherche ouverte et un partage améliorant l’innovation.

L’univers de l’intelligence artificielle connaît une nouvelle étape avec la publication du modèle DeepSeek-R1, suivant l’initiative d’Allen Institute for AI (AI2). Bien que le modèle et ses poids pré-entraînés soient désormais accessibles, les données de formation qui ont permis son développement ne sont pas partagées. Cette approche diffère nettement de la tendance croissante pour plus de transparence observée chez d’autres acteurs du secteur.

AI2, en particulier, démontre son engagement vers une ouverture totale avec le lancement du modèle Tulu-3. Ce dernier ne se contente pas d’être open source, il surpasse aussi technologiquement le modèle DeepSeek V3 et GPT-4o, grâce à une stratégie unique de post-entraîne. En mettant Tulu-3 à la disposition de tous, incluant le code complet, les poids et les données de formation, AI2 souhaite encourager la collaboration et l’innovation au sein de la communauté IA.

La démarche d’AI2 se veut un appel à l’industrie afin d’adopter plus de transparence dans la recherche en IA. Cela revêt une importance cruciale, car la disponibilité des données de formation et des algorithmes permettrait de reproduire, de vérifier et d’améliorer les modèles d’IA existants. Bien que DeepSeek-R1 représente une avancée intéressante, l’absence des données de formation pourrait limiter l’impact et la possibilité de collaboration.

Ainsi, AI2 se positionne en leader d’un mouvement vers une IA plus ouverte et collaborative. En fournissant un accès complet à ses méthodologies et données, Tulu-3 pourrait non seulement redéfinir les pratiques actuelles mais aussi inspirer d’autres acteurs à repenser leur approche de la recherche en IA. L’engagement sans réserve d’AI2 pour une ouverture totale pourrait renforcer significativement la communauté IA mondiale, en encourageant la transparence et l’innovation partagée.

Note de la rédaction

L’initiative d’AI2 avec le modèle Tulu-3 est une bouffée d’air frais dans le paysage de l’intelligence artificielle. Tandis que certains acteurs préfèrent garder secrètes leurs données de formation, la transparence d’AI2 ouvre la voie à une collaboration plus robuste et enrichissante. Cette approche pourrait catalyser une vague d’innovation et encourager un écosystème où le partage d’informations devient la norme. Pour le lecteur, cela souligne l’importance d’un élan collectif vers l’ouverture en IA, essentiel pour des avancées durables et vérifiables. En bref, la stratégie d’AI2 pourrait bien inspirer l’ensemble de l’industrie à reconsidérer ses pratiques de partage.

Clara Moreau

Formé à l’Université de Genève, Clara enquête sur les questions éthiques liées à l’intelligence artificielle et les pratiques des grandes entreprises technologiques.

Derniers articles

Les drones autonomes ukrainiens déployés pour neutraliser des soldats russes dans un test inédit

En Ukraine, l'intégration de l'IA dans les drones et robots autonomes pour renforcer la défense militaire face à la R...

130 milliards de projets de data centers bloqués par des manifestations cette année

En 2023, des projets de centres de données d'intelligence artificielle, évalués à 130 milliards de dollars, ont été b...

Google attaque un réseau chinois de cybercriminalité utilisant Gemini pour automatiser des arnaques

Google poursuit un réseau de cybercriminels, basé en Chine, utilisant le logiciel Gemini pour tromper des centaines d...

Les joueurs de Pokémon Go influencent sans le savoir la technologie des drones militaires

L'utilisation des données de Pokémon Go pour entraîner des IA inquiète, car ces informations, collectées à l'insu des...

Google DeepMind dévoile DiffusionGemma, un modèle accélérant l’IA locale par quatre fois

L'intelligence artificielle, notamment via le modèle DiffusionGemma de Google, révolutionne la création de contenu en...