Comment la génération AI réinvente la technologie vocale dans le voyage

L’intelligence artificielle générative (gen AI) insuffle une nouvelle vie à la technologie vocale, suscitant une exploration frénétique des cas d’utilisation et des applications dans l’industrie du voyage.

Des assistants vocaux à Amazon Alexa remanié, ils varient énormément, couvrant le service client et les opérations commerciales jusqu'à la traduction en temps réel et la réservation conversationnelle.

Bret Taylor, président du conseil d'administration d'OpenAI, la société derrière ChatGPT, pense même que la voix pourrait devenir plus importante que le chat textuel à long terme. De nombreuses entreprises de technologie du voyage semblent être d'accord, avec une série de nouveaux outils en cours de développement, expérimentant des fonctionnalités telles que l'intelligence émotionnelle ou les nuances culturelles.

Mais les experts affirment que leur succès dépendra en fin de compte de la demande des clients. Par exemple, les voyageurs de la génération Z dictent de nombreuses tendances marketing que nous observons aujourd'hui. Avec l’utilisation croissante d’applications comme WhatsApp, les jeunes voyageurs sont-ils susceptibles de préférer parler plutôt que d’envoyer des messages ?

Contexte émotionnel

La plupart des entreprises, quel que soit leur secteur d’activité, cherchent à utiliser l’IA pour devenir plus efficaces et augmenter leurs revenus. Ciblant le secteur de l'hôtellerie, la startup allemande Onsai a développé l'année dernière une solution vocale pour les hôtels, leur promettant un « service 24 heures sur 24 ».

La société affirme que sa fonction vocale parle nativement 25 langues et peut s'adapter au contexte et aux nuances culturelles lorsque des clients potentiels ou existants appellent. Il répond à l'un des plus grands défis de l'hôtellerie : une base de clients mondiale répondant aux limites du personnel local. Par exemple, un hôtel berlinois recevant des appels en espagnol, mandarin ou arabe peut servir ses clients dans leur langue préférée à tout moment, sans personnel multilingue sur différents fuseaux horaires.

Aujourd'hui, Tobias Koehler, CCO d'Onsai, étudie comment les systèmes seront capables de détecter les états émotionnels, d'identifier les invités frustrés avant qu'ils ne se plaignent, de reconnaître les invités VIP par la voix et d'adapter le ton en fonction du contexte émotionnel de la conversation.

« Nous reconnaissons déjà si les invités sont pressés ou détendus et ajustons nos réponses en conséquence », a-t-il déclaré.

Les données d'Onsai montrent que la plupart des réservations téléphoniques effectuées via des assistants vocaux basés sur l'IA sont pour le même jour ou dans un délai de trois jours.

« Les clients veulent une confirmation instantanée et ne sont pas sensibles au prix. Nous avons vu des clients atteindre un tarif journalier moyen (ADR) 30 % ou plus supérieur sur les canaux vocaux par rapport aux autres canaux de réservation », a ajouté Koehler.

Le marché des technologies de voyage, HBX Group, a quant à lui récemment lancé un canal vocal basé sur l'IA pour le service client en collaboration avec Ayesa.

RateGain, qui vient d'annoncer l'achat de Sojern pour 250 millions de dollars, propose UNO VIVA, qui, selon lui, est le premier agent vocal IA intégré au système de réservation centrale pour les hôtels. L'entreprise affirme avoir résolu un problème majeur car 40 % des réservations vocales restent sans réponse. De plus, il gère les réservations, les modifications, les annulations et les ventes incitatives dans 30 langues.

Fritz Müller, responsable Europe chez RateGain, a déclaré à PhocusWire que l'IA vocale a le potentiel de devenir l'interface la plus transformatrice en matière de voyage, car elle rend l'expérience conversationnelle et immédiate.

« Pour les hôtels, cela signifie qu'un client peut appeler à minuit dans sa propre langue et obtenir des réponses précises sur les surclassements de chambre, les avantages de fidélité ou les départs tardifs, sans attendre. »

Dans le monde des voyages d'affaires, TravelPerk propose des enregistrements plus fluides dans les hôtels grâce à des « appels d'agent vocal IA » qui contactent les hôtels 48 heures avant l'arrivée pour confirmer les paiements par carte de crédit virtuelle, tandis que les nouveaux agents vocaux IA de Derbysoft appellent également à l'avance pour confirmer le paiement, les détails de la réservation et demander des factures après le paiement.

La prochaine étape

Alors que la voix ouvre la voie à des opérations plus fluides, les détaillants de voyages en ligne renouvellent leurs efforts pour tirer parti de la technologie, une technologie qui a considérablement progressé depuis que Skyscanner a pris le devant de la scène il y a dix ans.

Le site de métarecherche a été l'une des premières marques du secteur du voyage à introduire des interfaces de recherche conversationnelles lorsqu'il a lancé une compétence vocale pour Alexa d'Amazon en 2016. L'adoption a ensuite été lente car le marché n'était pas prêt à l'époque, selon Piero Sierra, directeur des produits de Skyscanner. « Ce qui est différent maintenant, c'est qu'avec la génération IA, la voix peut enfin tenir ses promesses : de véritables conversations avec mémoire, contexte et dialogue à plusieurs tours. Cela change la donne », a-t-il déclaré.

Skyscanner déploie désormais la recherche en langage naturel dans son application, qui peut être saisie ou parlée. « La voix est la prochaine étape logique », a déclaré Sierra.

Priceline vise également à rendre la réservation de voyages aussi « simple qu'avoir une conversation » suite à un partenariat avec OpenAI, et les sociétés ont collaboré à la mise à jour du chatbot gen AI de l'agence de voyages en ligne, Penny.

La plateforme de réservation d'hôtels HotelPlanner dispose également d'un outil vocal parlant 15 langues. La société a déclaré avoir utilisé les données de plus de 8 millions d’appels de réservation pour former les assistants vocaux.

Démocratiseur des expériences

Dans le secteur des visites et des activités, l’application de la technologie vocale émergente est plus facile à imaginer.

« La traduction en temps réel lors des visites en direct sera un puissant levier de démocratisation », a déclaré Arturo Moreno, directeur des données chez Civitatis, une plateforme en ligne de réservation d'activités, d'excursions d'une journée et de visites guidées. « Imaginez un voyageur japonais écoutant en espagnol un guide local ou vice versa. Cela ouvre l'accès à des expériences qui étaient autrefois limitées par la langue. »

La traduction en temps réel dans les tournées live sera un puissant levier de démocratisation.
Arturo Moreno, Civitatis

Plus loin, Civitatis explore des audioguides personnalisés en temps réel qui adaptent la voix, le ton et le style narratif à chaque voyageur.

Des plateformes comme Vox Solutions aident également les guides touristiques à proposer des traductions en temps réel.

Le potentiel augmente lorsque les expériences vocales interactives sont combinées à des appareils tels que des lunettes intelligentes, mélangeant les entrées audio et visuelles.

« Un voyageur pourrait se promener dans Barcelone, poser des questions sur l'architecture de Gaudí dans sa propre langue et demander à un guide IA non seulement de l'expliquer, mais aussi de réserver des visites sur place », a déclaré Brennen Bliss, PDG et fondateur de l'agence de marketing de voyages et de tourisme Propellic.

Potentiel de séjour

Un problème courant avec les plateformes émergentes d’IA de génération est que les entreprises veulent voir le retour sur investissement. Ce n'est pas différent avec les assistants vocaux, et les hôtels, en particulier, tentent depuis longtemps de résoudre ce problème, probablement depuis que les hôtels ont commencé à installer des appareils Alexa dans leurs chambres. Marriott était l'un des clients de lancement d'Alexa for Hospitality en 2018.

Beaucoup de choses ont changé depuis, selon John Campbell, responsable de l'innovation et de l'IA à l'agence numérique Roast. Il fait valoir que si la synthèse vocale et la synthèse vocale sont possibles depuis plusieurs années, c'est le fait que les « conversations » sont désormais possibles, car la génération AI aide les plateformes vocales à répondre et à disposer d'une mémoire pour se souvenir des conversations et préférences passées.

« Dans le passé, les expériences conversationnelles devaient être programmées une par une par les développeurs, en réfléchissant au type de conversations qu'un utilisateur pouvait avoir avec un bot », a-t-il déclaré. « Désormais, la technologie LLM peut s'adapter au client à mesure que la conversation se développe. De plus, l'utilisation de RAG (génération augmentée par récupération) permet de développer l'expérience où le site Web d'un hôtel, les FAQ, les menus, etc. peuvent tous être ingérés dans l'IA, et l'IA trouve la réponse. « 

Au Royaume-Uni, Roast travaille avec Warner Hotels, où Campbell a déclaré que les appareils Alexa dans les chambres avaient connu beaucoup de succès. « La première chose que les gens veulent savoir, c'est combien ils ont dépensé et quelle est leur activité ou leur itinéraire pour la journée », a-t-il déclaré lors du récent Urban Living Festival à Londres.

Warner Hotels a tendance à attirer des clients plus âgés qui sont plus habitués à utiliser des assistants vocaux comme Alexa, a déclaré Campbell, après avoir sauté la phase de messagerie et avoir directement utilisé la voix comme entrée. « Vous obtiendrez des exemples où vous pourrez voir dans les journaux, sur une période de trois jours, qu'ils l'utiliseront 50, 60 fois par jour », a-t-il déclaré.

En termes de preuve du retour sur investissement, Campbell a déclaré que les hôtels peuvent promouvoir une offre de spa de dernière minute sur l'écran de l'appareil s'il y a des espaces disponibles que l'établissement souhaite occuper.

« Vous pouvez réserver une séance au spa, vous pouvez réserver une excursion en bateau sur la Tamise, vous pouvez réserver du tir à l'arc, du tir. Ce que nous constatons, ce sont ces revenus supplémentaires, parfois il s'agit simplement de faire connaître ces services supplémentaires en voyant l'écran et en les faisant savoir », a-t-il déclaré.

« J'aime l'idée que l'IA puisse s'appuyer sur des guides locaux pour recommander des choses à faire, en fonction de la météo et de l'heure de la journée. Se faire suggérer de visiter un jardin botanique quand il pleut n'est pas une bonne suggestion. »

Pendant ce temps, il a déclaré que Roast participait à un projet pilote avec une marque hôtelière bien connue en Italie pour envoyer des notifications pour demander aux clients s'ils étaient heureux de ne pas faire le ménage, ce qui permettrait à l'hôtel d'économiser 20 € à chaque fois. « L'ADR a un plafond. Vous ne pouvez aller que jusqu'à un certain point. Je m'attends donc à ce que l'adoption se produise. Cela pourrait se produire assez rapidement », a-t-il déclaré.

Cependant, pour que tout cela fonctionne, il a déclaré que les systèmes hôteliers doivent être suffisamment modernisés pour les intégrations de plateformes, y compris avec des services tels qu'Alexa. Les systèmes de demande de salle ne peuvent pas s’appuyer sur des notes autocollantes ou des groupes WhatsApp désorganisés.

« Le défi est que l'IA vocale n'est aussi puissante que les données auxquelles elle peut accéder », convient Müller de RateGain. « Un agent vocal lié uniquement à un PMS peut confirmer une réservation, mais il ne peut pas combiner cela avec les données du point de vente pour les offres de vente incitative ou les données CRM pour les avantages de fidélité personnalisés. »

Envoyer des SMS ou appeler

Pour Michiel de Vor, co-fondateur et PDG de Runnr.ai, le texte reste la clé, pour le moment.

« Nous suivons la demande du client », a-t-il déclaré. « Et nous constatons que contacter les clients via WhatsApp est extrêmement efficace en examinant la portée et l'engagement des clients. Les commentaires des hôtels indiquent que cela réduit réellement les appels téléphoniques et les e-mails. »

Cependant, l'année prochaine, il a déclaré que la société basée aux Pays-Bas, qui avait levé 1 million d'euros l'année dernière, souhaitait proposer des alternatives, notamment la voix.

Citation

Certains hôtels nous font également savoir que la qualité des conversations de notre part est supérieure à celle de leurs employés, car nous ne commettons pas d'erreurs.
Michiel de Vor, Runnr.ai

« Nous partons du principe que nous aurons toutes sortes de demandes de renseignements lorsque les invités nous appelleront. Donc, lorsqu'ils appellent, c'est assez urgent. Sinon, ils ne vous appelleront pas vraiment. »

Effectuer des réservations vocalement signifie que l'assistant IA doit accéder aux tarifs et à l'inventaire, ce qui peut être complexe. Par conséquent, les appels peuvent principalement porter sur la modification ou l’annulation d’une réservation, ou sur une demande d’ajout d’un lit supplémentaire ou d’un lit d’appoint.

De Vor affirme que la technologie de Runnr.ai fonctionne si bien que les clients ignorent souvent qu'elle est alimentée par l'IA. « Parfois, les invités demandent : 'Comment pouvez-vous répondre aussi vite ?' Ou bien ils se présenteront à la réception et diront : « Je viens de parler avec quelqu'un de votre équipe ». Certains hôtels nous font également savoir que la qualité des conversations de notre part est supérieure à celle de leurs employés, car nous ne commettons pas d'erreurs.

La renaissance de la technologie vocale va probablement se développer parallèlement au déploiement de la génération AI, tandis que les capacités agentiques semblent être un autre thème qui sous-tend la croissance.

Les experts soulignent également que le déploiement de protocoles de contexte de modèle est essentiel, permettant aux agents d'IA d'accéder aux informations nécessaires et d'exécuter directement les tâches. Au cours des dernières semaines, des mises à jour de Sabre et Apaleo ont été publiées, qui devraient accélérer encore le développement de la communication vocale ainsi que du commerce.

« La voix crée ce moment où les clients pensent : cet hôtel me connaît vraiment », a déclaré Koehler d'Onsai.