Ai2 dévoile Tülu 3, modèle open-source surpassant DeepSeek v3 et GPT-4o grâce à une nouvelle approche
Cet article reflète l'opinion personnelle du journaliste qui l’a rédigé. La note attribuée est subjective et n’engage que son auteur.
AI2 lance le modèle Tulu-3 en open source, surpassant DeepSeek V3 et GPT-4o, avec accès complet aux données et méthodes, encourageant transparence et collaboration en IA. Contrairement à DeepSeek-R1, dont les données de formation restent secrètes, AI2 promeut une recherche ouverte et un partage améliorant l’innovation.
L’univers de l’intelligence artificielle connaît une nouvelle étape avec la publication du modèle DeepSeek-R1, suivant l’initiative d’Allen Institute for AI (AI2). Bien que le modèle et ses poids pré-entraînés soient désormais accessibles, les données de formation qui ont permis son développement ne sont pas partagées. Cette approche diffère nettement de la tendance croissante pour plus de transparence observée chez d’autres acteurs du secteur.
AI2, en particulier, démontre son engagement vers une ouverture totale avec le lancement du modèle Tulu-3. Ce dernier ne se contente pas d’être open source, il surpasse aussi technologiquement le modèle DeepSeek V3 et GPT-4o, grâce à une stratégie unique de post-entraîne. En mettant Tulu-3 à la disposition de tous, incluant le code complet, les poids et les données de formation, AI2 souhaite encourager la collaboration et l’innovation au sein de la communauté IA.
La démarche d’AI2 se veut un appel à l’industrie afin d’adopter plus de transparence dans la recherche en IA. Cela revêt une importance cruciale, car la disponibilité des données de formation et des algorithmes permettrait de reproduire, de vérifier et d’améliorer les modèles d’IA existants. Bien que DeepSeek-R1 représente une avancée intéressante, l’absence des données de formation pourrait limiter l’impact et la possibilité de collaboration.
Ainsi, AI2 se positionne en leader d’un mouvement vers une IA plus ouverte et collaborative. En fournissant un accès complet à ses méthodologies et données, Tulu-3 pourrait non seulement redéfinir les pratiques actuelles mais aussi inspirer d’autres acteurs à repenser leur approche de la recherche en IA. L’engagement sans réserve d’AI2 pour une ouverture totale pourrait renforcer significativement la communauté IA mondiale, en encourageant la transparence et l’innovation partagée.
L’initiative d’AI2 avec le modèle Tulu-3 est une bouffée d’air frais dans le paysage de l’intelligence artificielle. Tandis que certains acteurs préfèrent garder secrètes leurs données de formation, la transparence d’AI2 ouvre la voie à une collaboration plus robuste et enrichissante. Cette approche pourrait catalyser une vague d’innovation et encourager un écosystème où le partage d’informations devient la norme. Pour le lecteur, cela souligne l’importance d’un élan collectif vers l’ouverture en IA, essentiel pour des avancées durables et vérifiables. En bref, la stratégie d’AI2 pourrait bien inspirer l’ensemble de l’industrie à reconsidérer ses pratiques de partage.


