ChatGPT vient de rendre l'IA plus humaine, et cela devrait rendre ses rivaux nerveux

Le PDG d'OpenAI, Sam Altman, a déclaré que la nouvelle mise à jour de ChatGPT « ressemble à de la magie » – et il n'avait pas tort.

La société d’IA a essentiellement planté un drapeau dans le sable arborant deux mots destinés à ses rivaux Big Tech : votre mouvement.

Mira Murati, CTO d'OpenAI, a présenté lundi la « Spring Update » sur ChatGPT avec une série de démos en direct. La dernière version du chatbot IA, alimentée par le nouveau modèle d'IA phare d'OpenAI, GPT-4o, peut raisonner à travers l'audio, la vision et le texte en temps réel.

Et c'est étonnamment humain.

On se rapproche du film « Her »

Pour commencer, les capacités vocales et conversationnelles de ChatGPT ont fait un énorme pas en avant grâce à GPT-4o, semblant capable d'exprimer des émotions et de varier son ton.

La nouvelle IA a ce qui ressemble à la voix d'une Américaine dans la démo – pensez à Scarlett Johansson dans le film « Her » de Spike Jonze – bien que les chercheurs d'OpenAI l'aient fait passer à une voix de robot à un moment donné. Un porte-parole d'OpenAI a déclaré que la sortie audio sera limitée à une sélection de voix prédéfinies au lancement.

La voix ne ressemblait pas seulement à une voix humaine. Il a également montré une étrange capacité à imiter la dictée humaine. Le nouveau ChatGPT rigole, ajoute de l'humour et modère l'inflexion de la voix en fonction des invites.

Il semble également être capable de capter certains signaux humains. Lorsqu'un chercheur faisait de l'hyperventilation alors qu'il pratiquait la respiration profonde, le chatbot lui a dit : « Mark, tu n'es pas un aspirateur. »

Vous pouvez également interrompre le chatbot, ce qui rend les conversations plus naturelles. Vous n'avez pas besoin d'attendre que l'IA ait terminé sa réponse avant de poser une question de clarification ou de changer de sujet.

Le temps de réponse a également été ultra-rapide. Un porte-parole d'OpenAI a déclaré que le chatbot peut répondre aux entrées audio avec un taux de réponse similaire à celui des humains, prenant en moyenne 320 millisecondes.

Après l'événement, Sam Altman, PDG d'OpenAI, a publié sur X, anciennement Twitter, le titre du film qui préoccupait de nombreuses personnes après avoir vu les démos.

son

– Sam Altman (@sama) 13 mai 2024

Les yeux de ChatGPT ont également été améliorés

Le chatbot a démontré des capacités élevées pour interpréter un graphique, aider au codage, interpréter les émotions et essentiellement enseigner aux utilisateurs les équations mathématiques en visionnant des vidéos ou des images présentées sur la caméra d'un téléphone.

Pendant tout ce temps, l’assistant vocal a maintenu un ton léger et joyeux.

Dans une démo distincte partagée en ligne, GPT-4o a même pu analyser la vidéo de l'espace autour d'un utilisateur, en prenant en compte le fait que la personne portait un sweat à capuche OpenAI et entourée d'un équipement d'enregistrement, pour deviner qu'elle pourrait être en train d'en assembler. Annonce relative à OpenAI.

Dites bonjour à GPT-4o, notre nouveau modèle phare qui peut raisonner sur l'audio, la vision et le texte en temps réel : https://t.co/MYHZB79UqN

La saisie de texte et d'images sera déployée aujourd'hui dans l'API et ChatGPT avec voix et vidéo dans les semaines à venir. pic.twitter.com/uuthKZyzYx

-OpenAI (@OpenAI) 13 mai 2024

Même si le chatbot semblait avoir quelques ratés, par exemple lorsqu'il interprétait mal une invite d'image ou commençait à répondre de manière inexacte avant que la question ne soit terminée, ces moments ont presque donné au chatbot une apparence plus humaine.

Tout semble plus humain – et en avance sur ce que nous avons vu chez nos rivaux

Dans un cas, ChatGPT a commencé à répondre à une invite avant que le chercheur ne montre l'équation sur la caméra, et le chercheur a arrêté le chatbot dans son élan.

« Oups, j'étais trop excité », a répondu le chatbot. « Je suis prêt quand tu l'es. »

Il semblait également répondre avec des réponses qui semblaient imiter des sentiments d'appréciation. Lorsque le chercheur a montré au chatbot une image d'écriture qui disait « J'aime ChatGPT », il a répondu « aw » et a dit « c'est si gentil de votre part ».

Dans un autre cas, ChatGPT a déclaré que le chercheur le faisait rougir lorsqu'il disait qu'il parlait de l'utilité et de l'incroyable de ChatGPT.

OpenAI a fait ces annonces la veille de la grande conférence estivale de Google, Google IO, qui devrait révéler les progrès de l'entreprise sur ses différents produits d'IA, comme Gemini.

Mais le timing de l'événement OpenAI – et ses démonstrations impressionnantes – laissera les observateurs de l'IA curieux de voir si ChatGPT est en avance sur Gemini de Google, ou si Google a quelque chose dans sa manche.

Mais pour l’instant, la mise à jour printanière d’OpenAI démontre une fois de plus à quel point ChatGPT peut être impressionnant, surtout si l’on le compare à l’espace d’assistant vocal existant.

Alexa d'Amazon, Siri d'Apple et Google sont tous prévenus. Leurs assistants vocaux sont connus pour donner des réponses robotiques et directes aux questions, loin d'être véritablement conversationnelles. Le nouveau ChatGPT alimenté par GPT-4o les fait sortir de l'eau avec ses réponses semblables à celles des humains.

Apple, pour sa part, semble conscient du fossé entre les versions encore plus anciennes de ChatGPT et Siri, avec un rapport récent indiquant que la décision a été prise de remanier l'assistant vocal de l'iPhone après que les dirigeants d'Apple ont passé des semaines à jouer avec ChatGPT et que la société a réalisé à quel point elle était en retard. c'était. Il y a aussi des rumeurs selon lesquelles les deux sociétés auraient parlé, et Apple pourrait finir par accorder une licence au modèle d'OpenAI pour certaines fonctionnalités de l'iPhone qui n'ont pas encore été annoncées.

Les fans d'Apple ne devraient pas avoir à attendre longtemps pour plus d'informations. La société devrait dévoiler ses mises à jour en matière d'IA lors du congrès annuel d'Apple. Conférence mondiale des développeurs le 10 juin.

Pendant ce temps, Amazon envisageait de publier une version payante « Alexa Plus » de l'assistant vocal, alimentée par une IA générative, a rapporté pour la première fois Eugene Kim de Trading Insider. L'assistant est censé offrir des réponses plus conversationnelles et personnalisées, mais la date de sortie n'est pas claire.

Mais, tout comme il l’a fait avec la première version de Chat GPT, OpenAI a une fois de plus souligné à quel point sa technologie peut être impressionnante – et laisse le reste de l’industrie technologique prouver qu’il peut rattraper son retard.

ChatGPT vient de rendre l'IA plus humaine, et cela devrait rendre ses rivaux nerveux

On se rapproche du film « Her »

Les yeux de ChatGPT ont également été améliorés

Tout semble plus humain – et en avance sur ce que nous avons vu chez nos rivaux

L’investisseur chevronné d’Apple, Alan Patricof, déclare que l’IA est la « saveur du mois »

Jack Dorsey se débarrasse des revues annuelles et des PIP chez Block. J’ai demandé à notre correspondant du lieu de travail si c’était une tendance.

Les fans d'Apple sont impatients de connaître le moindre signe de ses intentions en matière d'IA après une année difficile

Le Brésil propose des garanties sur le yuan dans ses échanges commerciaux avec l’Argentine face à une pénurie de dollars

Comment Bill Gates dépense sa fortune de 153 milliards de dollars, depuis une collection de voitures de luxe jusqu'à l'engagement de la majeure partie de sa fortune à sa fondation caritative

PayPal licencie 2 500 employés une semaine après que le PDG a annoncé un « nouveau chapitre »

On se rapproche du film « Her »

Les yeux de ChatGPT ont également été améliorés

Tout semble plus humain – et en avance sur ce que nous avons vu chez nos rivaux

A lire également