OpenAI dévoile GPT-4, des mois après que ChatGPT a stupéfié la Silicon Valley

Il y a quatre mois, une petite entreprise de San Francisco est devenue le sujet de conversation de l’industrie technologique lorsqu’elle a introduit un nouveau chatbot en ligne capable de répondre à des questions complexes, d’écrire de la poésie et même d’imiter les émotions humaines.
Aujourd’hui, l’entreprise est de retour avec une nouvelle version de la technologie qui alimente ses chatbots. Le système fera monter les enchères dans la course de la Silicon Valley pour adopter l’intelligence artificielle et décider qui sera la prochaine génération de leaders de l’industrie technologique.
OpenAI, qui compte environ 375 employés mais a été soutenu par des milliards de dollars d’investissements de Microsoft et de célébrités de l’industrie, a déclaré mardi qu’il avait publié une technologie qu’il appelle GPT-4. Il a été conçu pour être le moteur sous-jacent qui alimente les chatbots et toutes sortes d’autres systèmes, des moteurs de recherche aux tuteurs personnels en ligne.
La plupart des gens utiliseront cette technologie via une nouvelle version du chatbot ChatGPT de l’entreprise, tandis que les entreprises l’intégreront dans une grande variété de systèmes, y compris des logiciels d’entreprise et des sites Web de commerce électronique. La technologie pilote déjà le chatbot disponible pour un nombre limité de personnes utilisant le moteur de recherche Bing de Microsoft.
Les progrès d’OpenAI ont, en quelques mois seulement, propulsé l’industrie technologique dans l’un de ses moments les plus imprévisibles depuis des décennies. De nombreux leaders de l’industrie pensent que les développements de l’IA représentent un changement technologique fondamental, aussi important que la création des navigateurs Web au début des années 1990. L’amélioration rapide a stupéfié les informaticiens.
GPT-4, qui apprend ses compétences en analysant d’énormes quantités de données extraites d’Internet, améliore de plusieurs manières ce qui a alimenté le ChatGPT d’origine. C’est plus précis. Il peut, par exemple, réussir l’examen du barreau uniforme, calculer instantanément la dette fiscale d’une personne et fournir des descriptions détaillées des images.
Mais la nouvelle technologie d’OpenAI présente encore certaines des lacunes étrangement humaines qui ont vexé les initiés de l’industrie et énervé les personnes qui ont travaillé avec les derniers chatbots. C’est un expert sur certains sujets et un dilettante sur d’autres. Il peut faire mieux sur les tests standardisés que la plupart des gens et offrir des conseils médicaux précis aux médecins, mais il peut aussi gâcher l’arithmétique de base.
Les entreprises qui parient leur avenir sur la technologie peuvent – du moins pour le moment – devoir accepter l’imprécision, qui a longtemps été taboue dans une industrie construite à partir de zéro sur l’idée que les ordinateurs sont plus exigeants que leurs créateurs humains.
« Je ne veux pas donner l’impression que nous avons résolu le raisonnement ou l’intelligence, ce que nous n’avons certainement pas », a déclaré Sam Altman, directeur général d’OpenAI, dans une interview. « Mais c’est un grand pas en avant par rapport à ce qui existe déjà. »
D’autres entreprises technologiques sont susceptibles d’inclure les fonctionnalités de GPT-4 dans une gamme de produits et services, y compris les logiciels de Microsoft pour effectuer des tâches commerciales et des sites de commerce électronique qui souhaitent offrir aux clients de nouvelles façons d’essayer virtuellement leurs produits. Un certain nombre de géants de l’industrie comme Google et la société mère de Facebook, Meta, travaillent également sur leurs propres chatbots et leur technologie d’intelligence artificielle.
ChatGPT et des technologies similaires modifient déjà le comportement des étudiants et des enseignants qui tentent de comprendre si les outils doivent être adoptés ou interdits. Parce que les systèmes peuvent écrire des programmes informatiques et effectuer d’autres tâches commerciales, ils sont également sur le point de changer la nature du travail.
Même les systèmes les plus impressionnants ont tendance à compléter les travailleurs qualifiés plutôt qu’à les remplacer. Les systèmes ne peuvent pas être utilisés à la place des médecins, des avocats ou des comptables. Des experts sont encore nécessaires pour repérer leurs erreurs. Mais ils pourraient bientôt remplacer certains parajuristes (dont le travail est revu et édité par des avocats formés), et de nombreux experts en IA pensent qu’ils remplaceront les travailleurs qui modèrent le contenu sur Internet.
« Il y a certainement des perturbations, ce qui signifie que certains emplois disparaissent et que de nouveaux emplois sont créés », a déclaré Greg Brockman, président d’OpenAI. « Mais je pense que l’effet net est que les barrières à l’entrée diminuent et que la productivité des experts augmente. »
Mardi, OpenAI a commencé à vendre l’accès à GPT-4 afin que les entreprises et autres développeurs de logiciels puissent créer leurs propres applications dessus. La société a également utilisé la technologie pour créer une nouvelle version de son chatbot populaire, qui est disponible pour tous ceux qui achètent l’accès à ChatGPT Plus – un service d’abonnement au prix de 20 $ par mois.
Une poignée d’entreprises travaillent déjà avec GPT-4. Morgan Stanley Wealth Management met en place un système qui récupère instantanément les informations des documents de l’entreprise et d’autres enregistrements, et les transmet aux conseillers financiers dans une prose conversationnelle. Khan Academy, une entreprise d’éducation en ligne, utilise la technologie pour créer un tuteur automatisé.
« Cette nouvelle technologie peut agir davantage comme un tuteur », a déclaré le directeur général et fondateur de la Khan Academy, Sal Khan. « Nous voulons qu’il enseigne de nouvelles techniques à l’étudiant pendant que l’étudiant fait la majeure partie du travail. »
Comme des technologies similaires, le nouveau système « hallucine » parfois. Il génère des informations complètement fausses sans avertissement. Interrogé sur les sites Web qui présentent les dernières recherches sur le cancer, il pourrait donner plusieurs adresses Internet qui n’existent pas.
GPT-4 est un réseau de neurones, un type de système mathématique qui acquiert des compétences en analysant des données. Il s’agit de la même technologie que les assistants numériques comme Siri utilisent pour reconnaître les commandes vocales et que les voitures autonomes utilisent pour identifier les piétons.
Vers 2018, des entreprises comme Google et OpenAI ont commencé à construire des réseaux de neurones qui ont appris d’énormes quantités de texte numérique, y compris des livres, des articles de Wikipédia, des journaux de discussion et d’autres informations publiées sur Internet. Ils sont appelés grands modèles de langage ou LLM.
En identifiant des milliards de modèles dans tout ce texte, les LLM apprennent à générer eux-mêmes du texte, y compris des tweets, des poèmes et des programmes informatiques. OpenAI a jeté de plus en plus de données dans son LLM. Plus de données, espérait la société, signifieraient de meilleures réponses.
OpenAI a également affiné cette technologie en utilisant les commentaires des testeurs humains. Au fur et à mesure que les gens testaient ChatGPT, ils évaluaient les réponses du chatbot, en séparant celles qui étaient utiles et véridiques de celles qui ne l’étaient pas. Ensuite, en utilisant une technique appelée apprentissage par renforcement, le système a passé des mois à analyser ces notes et à mieux comprendre ce qu’il devrait et ne devrait pas faire.
« Les humains évaluent les choses qu’ils aiment voir et celles qu’ils n’aiment pas voir », a déclaré Luke Metz, chercheur à OpenAI.
Le ChatGPT d’origine était basé sur un grand modèle de langage appelé GPT-3.5. Le GPT-4 d’OpenAI a appris à partir de quantités de données beaucoup plus importantes.
Les dirigeants d’OpenAI ont refusé de divulguer la quantité de données à partir desquelles le nouveau chatbot avait appris, mais M. Brockman a déclaré que l’ensemble de données était « à l’échelle d’Internet », ce qui signifie qu’il couvrait suffisamment de sites Web pour fournir un échantillon représentatif de tous les anglophones sur Internet.
Les nouvelles capacités de GPT-4 peuvent ne pas être évidentes pour la personne moyenne qui utilise la technologie pour la première fois. Mais ils sont susceptibles d’être rapidement mis au point à mesure que les profanes et les experts continueront d’utiliser le service.
Étant donné un long article du New York Times et invité à le résumer, le bot donnera un résumé précis presque à chaque fois. Ajoutez quelques phrases aléatoires à ce résumé et demandez au chatbot si le résumé révisé est exact, et il indiquera les phrases ajoutées comme les seules inexactitudes.
M. Altman a décrit le comportement comme un « raisonnement ». Mais la technologie ne peut pas dupliquer le raisonnement humain. Il est bon pour analyser, résumer et répondre à des questions complexes sur un livre ou un article de presse. Il est beaucoup moins habile si on l’interroge sur des événements qui ne se sont pas encore produits.
Il peut écrire une blague, mais il ne montre pas qu’il comprend ce qui fera réellement rire quelqu’un. « Il ne saisit pas la nuance de ce qui est drôle », a déclaré Oren Etzioni, directeur général fondateur de l’Allen Institute for AI, un laboratoire de premier plan à Seattle.
Comme avec des technologies similaires, les utilisateurs peuvent trouver des moyens d’amener le système à un comportement étrange et effrayant. Invité à imiter une autre personne ou à jouer, ce type de bot vire parfois dans des zones pour lesquelles il a été conçu pour rester à l’écart.
GPT-4 peut également répondre aux images. À partir d’une photographie, d’un graphique ou d’un diagramme, la technologie peut fournir une description détaillée de l’image en plusieurs paragraphes et répondre aux questions sur son contenu. Cela pourrait être une technologie utile pour les personnes malvoyantes.
Un après-midi récent, M. Brockman a montré comment le système réagissait aux images. Il a donné au nouveau chatbot une image du télescope spatial Hubble et lui a demandé de décrire la photo « dans les moindres détails ». Il a répondu par une description en quatre paragraphes, qui comprenait une explication de la ligne blanche éthérée qui s’étendait sur la photo. Une « piste d’un satellite ou d’une étoile filante », a écrit le chatbot.
Les dirigeants d’OpenAI ont déclaré que la société ne publiait pas immédiatement la partie description de l’image de la technologie car ils ne savaient pas comment elle pourrait être utilisée à mauvais escient.
Construire et servir des chatbots coûte extrêmement cher. Parce qu’il est formé sur des quantités de données encore plus importantes, le nouveau chatbot d’OpenAI augmentera les coûts de l’entreprise. Mira Murati, directrice de la technologie d’OpenAI, a déclaré que l’entreprise pourrait restreindre l’accès au service s’il générait trop de trafic.
Mais à long terme, OpenAI prévoit de construire et de déployer des systèmes capables de jongler avec plusieurs types de médias, y compris le son et la vidéo ainsi que le texte et les images.
«Nous pouvons prendre toutes ces compétences de connaissances à usage général et les répartir dans toutes sortes de domaines différents», a déclaré M. Brockman. « Cela amène la technologie dans un tout nouveau domaine. »