Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
Technologie

ChatGPT peut désormais répondre avec des mots parlés


ChatGPT a appris à parler.

OpenAI, la start-up d’intelligence artificielle de San Francisco, a publié lundi une version de son chatbot populaire qui peut interagir avec les gens à l’aide de paroles. Comme avec Alexa d’Amazon, Siri d’Apple et d’autres assistants numériques, les utilisateurs peuvent parler à ChatGPT et celui-ci répondra.

Pour la première fois, ChatGPT peut également répondre aux images. Les gens peuvent, par exemple, télécharger une photo de l’intérieur de leur réfrigérateur et le chatbot peut leur donner une liste de plats qu’ils pourraient cuisiner avec les ingrédients dont ils disposent.

« Nous cherchons à rendre ChatGPT plus facile à utiliser et plus utile », a déclaré Peter Deng, vice-président des produits grand public et d’entreprise d’OpenAI.

OpenAI a accéléré la sortie de ses outils d’IA ces dernières semaines. Ce mois-ci, il a dévoilé une version de son générateur d’images DALL-E et a intégré l’outil dans ChatGPT.

ChatGPT a attiré des centaines de millions d’utilisateurs après son introduction en novembre, et plusieurs autres sociétés ont rapidement lancé des services similaires. Avec la nouvelle version du bot, OpenAI va au-delà des chatbots concurrents comme Google Bard, tout en rivalisant avec des technologies plus anciennes comme Alexa et Siri.

Alexa et Siri proposent depuis longtemps des moyens d’interagir avec les smartphones, les ordinateurs portables et d’autres appareils par le biais de paroles. Mais les chatbots comme ChatGPT et Google Bard ont des compétences linguistiques plus puissantes et sont capables d’écrire instantanément des e-mails, de la poésie et des dissertations, et d’aborder presque tous les sujets qui leur sont proposés.

OpenAI a essentiellement combiné les deux méthodes de communication.

L’entreprise considère la conversation comme un moyen plus naturel d’interagir avec son chatbot. Il affirme que les voix synthétiques de ChatGPT (les utilisateurs peuvent choisir parmi cinq options différentes, y compris les voix masculines et féminines) sont plus convaincantes que les autres voix utilisées avec les assistants numériques populaires.

Au cours des deux prochaines semaines, a indiqué la société, la nouvelle version du chatbot commencerait à être déployée auprès de tous les abonnés à ChatGPT Plus, un service qui coûte 20 dollars par mois. Mais le robot ne peut répondre vocalement que lorsqu’il est utilisé sur des iPhones, iPads et appareils Android.

Les voix synthétiques du robot sont plus naturelles que celles de beaucoup d’autres sur le marché, même si elles peuvent toujours paraître robotiques. Comme les autres assistants numériques, il peut avoir du mal avec les homonymes. Lorsque le New York Times a demandé au nouveau ChatGPT comment épeler « gym », il a répondu : « JIM ».

Mais l’un des avantages d’un chatbot comme ChatGPT est qu’il peut se corriger tout seul. Lorsqu’on lui a répondu « Non, l’autre type de salle de sport », le robot a répondu : « Ah, je vois à quoi vous faites référence maintenant. L’endroit où les gens font de l’exercice et s’entraînent s’écrit GYM.

Bien que l’interface vocale de ChatGPT rappelle celle des assistants précédents, la technologie sous-jacente est fondamentalement différente. ChatGPT est principalement piloté par un grand modèle de langage, ou LLM, qui a appris à générer du langage à la volée en analysant d’énormes quantités de texte extraites d’Internet.

Les assistants numériques plus anciens, comme Alexa et Siri, agissaient comme des centres de commande et de contrôle capables d’effectuer un nombre défini de tâches ou de donner des réponses à une liste limitée de questions programmées dans leurs bases de données, telles que « Alexa, allume les lumières » ou « Quel temps fait-il à Cupertino ? » L’ajout de nouvelles commandes aux anciens assistants pourrait prendre des semaines. ChatGPT peut répondre avec autorité à pratiquement toutes les questions qui lui sont posées en quelques secondes, même si ce n’est pas toujours correct.

Alors qu’OpenAI transforme ChatGPT en quelque chose qui ressemble davantage à Alexa ou Siri, des entreprises comme Amazon et Apple transforment leurs assistants numériques en quelque chose qui ressemble davantage à ChatGPT.

La semaine dernière, Amazon a présenté en avant-première un système mis à jour pour Alexa qui vise une conversation plus fluide sur « n’importe quel sujet ». Il est piloté en partie par un nouveau LLM et comporte d’autres améliorations du rythme et de l’intonation pour le rendre plus naturel, a indiqué la société.

Apple, qui n’a pas publiquement partagé ses projets sur la façon dont il concurrencera ChatGPT, a testé un prototype de son grand modèle de langage pour les futurs produits, selon deux personnes informées du projet.

Lorsqu’il est utilisé via le Web ainsi que sur les appareils iPhone, iPad et Android, le nouveau ChatGPT peut également répondre aux images. À partir d’une photographie, d’un graphique ou d’un diagramme, il peut fournir une description détaillée de l’image et répondre à des questions sur son contenu. Cela pourrait être un outil utile pour les personnes malvoyantes.

OpenAI a présenté pour la première fois l’outil d’image au printemps, mais la société a déclaré qu’il ne serait pas partagé avec le public tant que les chercheurs n’auraient pas mieux compris comment la technologie pourrait être utilisée à mauvais escient. Entre autres préoccupations, ils craignaient que l’outil ne devienne de facto un service de reconnaissance faciale utilisé pour identifier rapidement les personnes sur les photos.

Microsoft introduit ce genre d’outil de recherche visuelle, basé sur la technologie OpenAI, dans son chatbot Bing au cours de l’été.

Sandhini Agarwal, un chercheur d’OpenAI qui se concentre sur la sécurité et la politique, a déclaré que la nouvelle version du robot refuserait désormais les efforts d’identification des visages. Mais il est conçu pour fournir des descriptions extrêmement détaillées d’autres photos. Étant donné une image du télescope spatial Hubble, par exemple, il peut répondre par des paragraphes détaillant le contenu de la photo.

Le bot peut également être un outil pour les étudiants. À partir d’une image d’un problème de mathématiques au lycée comprenant des mots, des chiffres et des diagrammes, le robot peut instantanément lire le problème et le résoudre. Cela pourrait être un moyen efficace d’apprendre – ou de tricher.

Tech smsm

francaisenouvelles

The website manager responsible for technical and software work, the electronic newspaper, responsible for coordinating journalists, correspondents and administrative work at the company's headquarters.
Bouton retour en haut de la page