VocalNews

Keyword - langage naturel

Mercedes améliore sa reconnaissance vocale

Mercedes passe son syst§me de navigation embarquée en langage naturel.

Parce qu'ils sont fastidieux à utiliser, en faisant épeler le nom du pays, puis la ville, la rue et confirmer à chaque étape, Mercedes a mis au point un algorithme de reconnaissance vocale capable de comprendre une adresse entière.

Cette évolution du système Linguatronic permet de meilleurs résultats et un usage nettement plus naturel. Il fonctionne dans six langues, concerne 15 pays européens et sera proposé dans un premier temps sur la nouvelle Classe S.

C'est la solution One-Shot Destination Entry de Nuance qui a été choisie pour cette nouvelle version. 73 % des personnes interrogées dans le cadre de son étude sur la simplicité d'utilisation des interfaces à commandes vocales ont déclaré être extrêmement satisfaites des systèmes de navigation embarqués à commandes vocales. En tête des principales améliorations qu’elles souhaiteraient voir développer figurent l’optimisation du langage naturel et de la concision des échanges, ainsi que la réduction du nombre de confirmations.

A noter, selon de récentes enquêtes commanditées par Nuance, les commandes vocales des systèmes de navigation embarqués figurent en tête des fonctions les plus efficaces à réduire la distraction des conducteurs et à simplifier l’utilisation de ces dispositifs.

Et voici les comédiens qui ont prété leurs voix à Mercedes : linguatronic

TellMe sur mobile

Windows Mobile 6.5 devrait embarquer la technologie de TellMe, déjà disponible sur Blackberry. La recherche vocale, la dictée de SMS et la gestion de l'annuaire seront alors possible vocalement.

tellme-thm.jpg

Et comme les interfaces vocales sont plus agréables en langage naturel, c'est la voie suivie par TellMe. Dariusz Packzuski, explique que le service "est si intuitif que ce sera sans doute l'interface majeure sur les mobiles dans les années à venir" D'ailleurs il donne comme exemple un service de bourse enn ligne où il est possible de demander "d'acheter 5000 actions de Coca-Cola". Dans ce type de transactions, si un élément manque, seul ce dernier sera réclamé par le service.

La reconnaissance vocale ne se fait pas sur le processeur, mais sur les serveurs de TellMe, transmis en VoIP.

Disponible à l'automne, sur le portail de Microsoft, il est déjà testable sur certains Blackberry ou sur le numéro : 1-800-555-TELL.

Conversive : le nouveau langage naturel

Conversive, bien connu pour son automate de discussion en langage naturel veut étendre son expertise à la reconnaissance vocale.

Conversive Speech Recognition se donne comme premier objectif l'élimination des reformulations, sans doute un des principaux motifs de rejet de la part des utilisateurs. L'expérience accumulée par la gestion de chat online leur permet de penser que beaucoup de périphrases amènent à la même réponse, il suffit de bien les repérer.

L'offre n'est pas encore détaillée mais on a vu apparaître deux nouveaux partenaires, Cepstral et Nuance ...

Robert Williams, président de Conversive, pense que seule la satisfaction prime, quand bien même les entreprises cherchent à réaliser des économies, et que son offre apporte les deux. On attend de voir les premières réalisations !

Etude automobile

Nuance avait annoncé une étude sur l'usage des appareils embarqués par les automobilistes, elle confirme le succès des fonctionnalités de reconnaissance et de synthèse vocales. En effet, huit automobilistes sur neuf déclarent utiliser régulièrement les systèmes à reconnaissance vocale embarqués dans leur véhicule.

Menée par Maix Research and Consulting cette enquête révèle également que 73 % des utilisateurs se disent satisfaits par ces technologies, les réclameront à l’achat de leur prochain véhicule et les recommanderont à leurs amis.

Voici les principaux résultats de cette enquête :

  • La téléphonie et la navigation à commande vocale sont les applications privilégiées des automobilistes : 83 % téléphonent, 80 % répondent aux appels et 76 % saisissent leurs destinations à la voix de manière systématique ou fréquente.
  • Les commandes vocales se prêtent à davantage de scénarios de conduite que les commandes manuelles : la majorité des personnes interrogées (environ 75 %) déclarent préférer les commandes vocales lors de leurs déplacements, en particulier dans certaines situations. En effet, 50 % des utilisateurs apprécient d’utiliser les commandes vocales lorsqu’ils sont accompagnés. Ils sont 18 % de plus (68 %) à préférer les utiliser lorsqu’ils sont seuls. 58 % d’entre eux se servent des commandes vocales dans des lieux qu’ils connaissent et 69 % dans des lieux inconnus. 63 % des sondés ont déclaré utiliser les commandes vocales lorsque la circulation est calme ou normale, contre 71 % lorsque le trafic est intense et particulièrement stressant.
  • L’âge joue un rôle dans l’adoption des commandes vocales : l’utilisation de systèmes embarqués à reconnaissance vocale est généralement plus fréquente chez les jeunes conducteurs (entre 18 et 29 ans) que chez les automobilistes plus âgés (40 ans et plus), qui se contentent de les utiliser uniquement dans les lieux qu’ils connaissent mal ou lorsque le trafic est intense.
  • Les utilisateurs de systèmes embarqués à reconnaissance vocale disposeraient volontiers de davantage de fonctionnalités « connectées » : cette étude indique en effet que les personnes interrogées préféreraient disposer de davantage de services vocaux « connectés ». Ils sont 43 % à affirmer qu’ils utiliseraient volontiers des services d’information continue sur la circulation routière, 40 % des services de prévisions météorologiques et 37 % des fonctions de recherche d’entreprises locales.
  • Les utilisateurs attendent un dialogue plus naturel : les personnes interrogées dans le cadre de cette étude ont été invitées à citer les améliorations qui, selon elles, les encourageraient à utiliser davantage les systèmes embarqués à reconnaissance vocale dans la voiture. Elles ont ainsi majoritairement évoqué l’optimisation du naturel des dialogues, qui accélèrerait les échanges avec les systèmes et en simplifierait donc l’utilisation.

Moteur de recherche en langage naturel

Le traitement du langage naturel est un champ important des recherches informatiques, que ce soit en technologie vocale ou textuelle. Voilà que Stephen Wolfram annonce, sur son blog, qu'il ouvrira en mai un moteur de recherche totalement naturel : Wolfram Alpha !

Et Stephen Wolfram n’est pas un fantaisiste. Mathématicien doué, il a créé le logiciel Mathematica et participé à de nombreuses recherches en calcul formel. Aussi il ne propose pas de remplacer Google, ni de faire un simple ajout au web sémantique, mais d'apporter un véritable outil de compréhension.

Nova Spivack a pu le tester et en donne un compte rendu intéressant sur son blog, il nous faudra nous en satisfaire, en attendant, le site WolframAlpha d'ici le mois de mai ...

Source : Futura Science

Saynergy

Derrière ce nom se cache une initiative de Vocalcom, Umanify et Loquendo pour créer un assistant.

Basé sur le langage naturel, Saynergy permet aux centres de contact de mieux automatiser les questions ouvertes et décharger le centre d'appel. Commercialisé par Vocalcom, cette offre s'appuie sur les technologies vocales de Loquendo et les avatars d'Umanify. Ces derniers sont compatibles avec le web et les mobiles du type iPhone ou Gphone.

On attends avec intérêt une démonstration ...

Le vocal pour trouver son produit

Fabrice Lacroix, président d'Antidot, donne sa vision des axes de performance du moteur de recherche dans le e-commerce à Neteco. Et il est intéressant de constater qu'il pense que le langage naturel en fait partie, car cela permet enfin à "l'internaute de s'exprimer dans son propre vocabulaire, sans avoir à se soucier des données du site et de leurs modélisations." Mais aussi de le justifier parce que " Ce type de module est une aide à la recherche qui réduit considérablement la notion de multicritère lorsque le modèle de données est très détaillé et précis."

A lire intégralement sur Neteco

La fin des centres d'appels ?

Un titre provocateur ... tiré d'un compte rendu de Jean Michel Billaut !

Ce dernier est en Californie, visite de nombreuses start-up, et nous en fait profiter. Ainsi des hollandais de Q-Go et leur moteur de recherche en langage naturel, qui pourrait remplacer partie des centres d'appels, selon son président, Marcel Smit. Voilà dont un nouvel acteur qui se propose d'aider au fonctionnement des centres d'appels en filtrant, aiguillant, comprenant les motifs d'appels et en cherchant à y répondre, avec une démarche non hiérarchique.

Ce qui est sûr, c'est que les technologies de langage naturel commencent à se répandre, avec de vrais succès, et peuvent apporter des services aux clients. Surtout depuis que l'ergonomie est mieux prise en compte dans ces applications. A ce sujet, on vous conseille le dernier billet du blog SoNear.

Pour en savoir plus :

Internet en main libre

Alors que certains pays comme le Canada interdisent le téléphone au volant, le constructeur texan ATX propose à ses clients Ford, Peugeot, BMW, de laisser les conducteurs piloter le web à la voix tout en conduisant.

Browse By Voice est donc un système permettant la consultation d'un moteur de recherche par la voix, en langage naturel, capable d'appréhender les termes spécifiques de la conduite dans un véhicule. L'équipementier pense même bientôt proposer des commandes en langage naturel pour la composition de messages texte et l'envoi de courriels, ou la gestion des réseaux sociaux ...

Pour en savoir plus :

AT&T veut changer notre vision de la TV

Depuis des années, AT&T travaille sur un projet nommé Watson, qui avait pour premier objectif de rendre vocales les oreillettes. Maintenant, ils finalisent U-Verse, pour transcender nos télécommandes.

Il sera alors possible de dialoguer, en langage naturel, avec son téléviseur et lui demander de chercher quelle chaine diffuse un western, ou s'il y a un film avec Louis de Funes ...

Le seul ennui, c'est que AT&T ne donne aucune indication sur la disponibilité de cette offre ! Mais on peut rêver !

Pour en savoir plus sur Watson et sur U-Verse

Excellente analyse

NewsFactor publie une étude qui démontre que la reconnaissance vocale a de l'avenir car elle n'impacte pas que les SVI, elle a aussi un rôle à jouer dans le CRM ...

Ainsi, grâce au langage naturel qui offre une meilleure ergonomie des applications, mais aussi une vraie personnalisation, les nouvelles applications vocales ont des avantages indéniables.

Illustré d'exemples chiffrés, cet article clair mérite le détour.

A lire en anglais et en intégral !

Les nouveautés à VocalExpo

A 15 jours de l'événement, quelques informations sur les nouveautés qui y seront présentées !

  • APP-LINE présentera sa vision du Vocal 2.0, ou comment le langage naturel change tout.
  • ATOS Worldline : un concept innovant le softphone multimédia que l’internaute utilise depuis son navigateur web, sans installation.
  • DB SCAPE : VocaBase 2.3 et son module de statistiques renforcé. Qui appelle ? Quand ? Combien de temps ? À quel sujet ? Avec ou sans erreurs ? Si oui, lesquelles ? Telles sont les questions essentielles que posent l'exploitation d’un serveur vocal interactif. Avec la nouvelle version 2.3, VocaBase s’enrichit de nouveaux outils facilitant considérablement la configuration et l’exploitation de rapports statistiques sur l’utilisation des services.
  • HOTLINE : Naturalvoice Designer ou comment enrichir graphiquement ses applications sans générer des kilomètres de scripts, et My-Naturalvoice, la fin des mots de passe grâce à l'empreinte vocale.
  • LOQUENDO : une nouvelle version de Loquendo TTS Director, l’environnement complet qui permet une mise au point précise pour obtenir des performances TTS encore meilleures.
  • NMS COMMUNICATIONS & VOICEWAY : Video Access Mobile est l’environnement de développement idéal. Flexible, évolutif et économique il répond aux besoins des solutions de téléphonie mobile vidéo et IP - La Vision CX Video Gateway est conçue pour « relier » les applications multimédia entre le traditionnel réseau PSTN et les plateformes applicatives SIP. Les Cartes CG6565 : La plateforme idéale pour l’optimisation des coûts, l’évolutivité et la fiabilité des solutions vocales et vidéo dans un environnement de télécommunications.
  • NUANCE COMMUNICATIONS : Nuance Mobile lance Voicemail to Text : nouveau service de conversion des messages vocaux en texte Nuance® Voicemail to Text, un service pour téléphones portables de transcription des messages vocaux en texte.
  • PROSODIE : la solution Voice search en reconnaissance vocale permet d’exploiter des fonctionnalités de « push-to-talk »
  • TLM COM ANNONCE: l’arrivée d’une passerelle vers les applications de gestion hospitalière.
  • VOICE CORP : ReadSpeaker, solution Saas (software as a service) qui vocalise un site Internet pour tous ceux qui veulent écouter son contenu, avec les version Enterprise et proReader. VoiceCorp présentera aussi SpeechMachine, un service web on-demand de synthèse vocale qui créé une version audio à partir du texte envoyé.
  • VOICE TRUST : PIN2GO - Basé sur une technologie brevetée, PIN2GO fonctionne comme un coffre-fort pour mot de passes et PINs. Un utilisateur peut stocker sur Internet ses PINs, mot de passes et autres informations confidentielles. Si l’utilisateur oublie un de ses PINs, il peut envoyer un SMS mentionnant l’information désirée depuis son téléphone portable au numéro PIN2GO. Le système l’appelle, contrôle son identité en vérifiant sa voix et délivre l’information souhaitée.
  • VOXPILOT : l’application «OMP Flash Gateway» combinant la communication audio et la diffusion commandée d’un contenu vidéo suite à un appel sur une page web et Voxpilot Open Media Platform (OMP) qui assure la distribution de traitement d’appels et des multimédias basée sur les standards VoiceXML, CCXML, MRCP définis par le W3C et l’IETF.

On en a rêvé ...

L’Atelier, à l’occasion de l’IFA, présente les innovations les plus marquantes.

Ainsi une interface de reconnaissance vocale pour contrôler des appareils multimédia comme la télévision, développé par IBM dans le cadre du projet européen Dicit.

Cela n'a rien de très neuf ... sauf que c'est en langage naturel !

Pour découvrir DICIT

Source : L'Atelier

Evolution du 3635 de la SNCF

Tous les experts vous le diront, plus le dictionnaire est grand, moins il est facile de mettre en oeuvre un service en reconnaissance vocale. Avec quand même 4 500 noms de gares, il est vrai que le challenge était difficile à relever.

Le mois dernier, cependant, Prosodie a mis en ligne la nouvelle version du portail de la SNCF. Avec quelques améliorations notables !

Tout d'abord une ergonomie revue, beaucoup plus proche du langage naturel et qui a l'élégance de ne pas reformuler à chaque étape (ce qui, avouons-le, est souvent horripilant).

Ainsi pour trouver l'horaire d'un voyage, il suffit de répondre aux questions posées pour se voir reformuler en une seule fois la demande puis la réponse possible. On appréciera au passage que si le système vous demande si vous souhaitez partir demain, par défaut, semblant attendre une réponse par OUI ou NON, l'on peut répondre dimanche, lundi ... et être compris !

Enfin il est possible de couper la parole aux messages, pour anticiper les réponses. Les techniciens appellent cela le "barge-in", c'est barbare, impoli entre humains, mais fort pratique là, et sera sans doute apprécié des grands voyageurs habitués au scénario.

Car le service a été pensé à deux niveaux : avec guidage et menu d'aide pour les novices, et ouvrant la porte aux experts « la prochaine fois que vous appelez dites directement … » ...




A vous de le tester (et n'hésitez pas à me faire part de vos remarques).

Troubles du langage

Grâce au partenaire de Nuance, Médialexie, les enfants et adultes rencontrant des problèmes de communication peuvent désormais pour la première fois dicter des équations, et prochainement chatter sur des forums sans faire de fautes

En France, les troubles spécifiques du langage et des apprentissages concernent environ 6 % à 8 % de la population, soit plus de 4 millions de personnes.

Depuis 2005, la société française Médialexie propose une solution informatique, basée sur le moteur de reconnaissance vocale Dragon NaturallySpeaking de Nuance, pour remédier aux troubles du langage (dyslexie, dysorthographie ou dysphasie).

Le logiciel développé se présente sous la forme d’une barre d’outils constituée de plusieurs fonctions pour éditer, corriger, dicter, lire, visualiser du texte ainsi que de le transcrire à partir d’un enregistrement audio.

Grâce à son savoir-faire, Médialexie vient de développer une nouvelle application pour reproduire des formules mathématiques complexes que l’on soit un élève de CM2 ou un étudiant en Math Sup. En outre, la société travaille au développement d’un WebEcriveur pour que les messages échangés sur la Toile soient correctement orthographiés, indépendamment de la façon dont ils ont été initialement écrits.

Basée sur le campus universitaire de Clermont-Ferrand au sein de la plate-forme technologique de l’ISIMA (Institut Supérieur d'Informatique de Modélisation et de leurs Applications), Medialexie conçoit et développe des applications dans le domaine du Traitement Automatique du Langage Naturel (TALN). Sa vocation est d’aider les personnes ayant des troubles de la communication dans leur vie quotidienne.

Pour en savoir plus :

CallGenie et Vlingo

CallGenie améliore son offre avec l'aide de Vlingo.

Le souhait commun est de proposer une véritable approche de la recherche en langage naturel. Ainsi l'utilisateur d'un service 411 devrait pouvoir dire "je cherche un café à Seattle, près de l'université de Washington".

Cette nouvelle approche est intégrée dans CG Product Suite, l'offre de CallGenie.

Yahoo! serait parmi les premiers à tester la solution pour son service OneSearch.

Conférence à l'ATelieR

Jeudi dernier, Activeo, Genesys et Telisma organisaient un atelier sur les solutions de portail vocal et de self-service.

Frédéric Jurain, Directeur Associé - Activeo, a commencé en rappelant que les technologies vocales existent depuis 25 ans ... avec des perceptions variables. L'important est de chercher l'optimisation de la satisfaction client tout en cherchant à réduire les coûts, ce qui est souvent la motivation première de l'automatisation, tout est donc une question d'équilibre. Equilibre entre satisfaction et qualité de service, personnalisation et mécanisation, disponibilité et relation humaine. Les taux de réussite se sont accrus, grâce à une meilleure ergonomie et à une bonne réflexion sur le projet et les attentes client.

Il est donc nécessaire de statuer sur la "stratégie vocale" du projet.

Rémy Claret, Responsable avant-vente de Genesys, a pris le relais pour présenter iCfd, une approche intelligente de olutions pour centres de contact.

L'enjeu c'est de maximiser la qualité de service et accompagnant le client. Trouver l’équilibre entre self-service et service assisté n’est pas une tâche aisée pour les entreprises. C'est l'objet donc de l'offre iCFD (intelligent Customer Front Door), le service vocal d’accueil unifié de l’entreprise.

Il y a 15 ans, on attendait d'un SVI qu'il réponde à la charge, il y a 10 ans qu'il soit transactionnel, puis pertinent. Aujourd'hui on en exige une expérience client maximale. Aussi cette nouvelle approche se propose de collecter les motifs d'appels pour les router au mieux en fonction des disponibilités, mais aussi de l'historique client, des offres du moment ... Un exemple intéressant de mise en oeuvre, c'est le 3654 d'Air France.

Vincent Philbert, Directeur commercial de Telisma, a alors expliqué que le langage naturel est sans doute la réponse aux besoins actuels des SVI. En apportant simplicité et souplesse, c'est le meilleur levier de performance pour les centres d'appels. A cela quelques exemples, de Fidelia, qui améliore de 20% la prise en charge des incidents en reconnaissant vocalement le numéro d'immatriculation à Generali qui a vu ses taux de raccrochés baisser de 30% et la satisfaction client augmenter.

Parler est naturel, aussi le langage naturel fait partie des piliers technologiques qui répondent aux enjeux forts de la relation client.

Et pour finir avec une touche d'humour, Vincent Philbert a passé une vidéo que nous affectionnons aussi ... merci Brenda !

langage naturel

Bruce Pollock publie, dans CRM Buyer un article qui fait un tour d'horizon sur le langage naturel dans les applications de relation client.

Il pense que cela est la solution pour les situations complexes, que cela simplifie le parcours des clients et propose quelques autres pistes de réflexion ...

A lire en V.O. ici :

Nuance signe avec Samsung ... et pense aux francophones !

Samsung Electronics à signé un contrat pluriannuel portant sur l’ensemble des applications de la gamme Nuance Mobile.

En optant pour les solutions vocales mobiles de Nuance, Samsung simplifie et optimise l’utilisation de ses téléphones portables, applications et services. Ce nouveau contrat prévoit entre autres l’exploitation des solutions de synthèse vocale de Nuance permettant notamment la lecture audio des messages texte. VSuite, la solution universelle de commande vocale de Nuance, garantit le mode mains-libres, l’accès d’une seule pression d’un bouton aux fonctions du téléphone et la commande vocale. Quant à la solution de reconnaissance vocale VoiceMode de Nuance, elle simplifie et accélère la saisie de texte dans les applications embarquées. Une simple pression sur un bouton permet de dicter du texte en langage naturel, au rythme d’élocution habituel.

Nuance annonce aussi l'adaptation française de son service de recherche et de communication pour terminaux mobiles.

Les clients canadiens de Rogers Wireless seront les premiers à bénéficier de la version francophone de Nuance Voice Control, service simple et rapide de numérotation vocale, de consultation de contenus Web et de dictée d’e-mails. Les commandes en langage naturel de Nuance Voice Control confèrent une interface vocale aux terminaux mobiles et à leurs applications, rendant ainsi possible la saisie de données dans l’agenda, la dictée des contacts, la lecture de fichiers musicaux, l’obtention d’itinéraire ou encore la recherche d’informations sur le Web (coordonnées d’entreprises, actualités, prévisions météorologiques, cours de la bourse, résultats sportifs, etc.). Le service permet également de dicter aux smartphones des e-mails et messages texte, lesquels sont retranscrits instantanément, prêts à être envoyés. Dans un premier temps, la version francophone du service sera limitée à certains modèles BlackBerry, dont les modèles 8800, 8310 et 8110, puis étendue aux périphériques Windows Mobile, quelques semaines plus tard.

Atelier de développement chez App-Line

A l'occasion du SECA, App-line lance Sibilo Studio, atelier de développement de scénario vocal.

Pour simplifier le développement, Sibilo Studio présente une interface non technique, adaptée aux superviseurs de plateaux des centres d'appels. Ces derniers pourront donc aussi bien modifier que créer un scénario de service vocal, sans toucher une ligne de code, l'application se charge de générer le VXML correspondant.

A découvrir donc lors du SeCA dans le cadre d'un Atelier, le Jeudi 3 avril de 10h30 à 11h15 avec la démonstration d'une solution complète intégrant un centre de contacts multicanal, un serveur vocal interactif VoiceXML, associé à un moteur de reconnaissance vocale en langage naturel.

- page 1 de 2