VocalNews

Prizmo, l'OCR pour iPhone

Creaceed nous a déjà surpris avec Vocalia et recommence avec Prizmo solution de scanning et d'OCR.

Que vous ayez besoin de conserver et transmettre un document, un tableau blanc de réunion ou tout simplement envie de vous simplifier la saisie des cartes de visite, cette application est faite pour vous.

Mais ne vous attendez pas à une application simpliste comme il en traîne sur l'AppStore, celle là est soignée, avec même des commandes vocales pour prendre la photo, la synthèse vocale Acapela pour lire ce que l'OCR en 10 langues a reconnu, des liens vers Dropbox, google translate, l'optimisation pour l'écran Retina (iPhone 4) ...

Voici une vidéo de présentation

La qualité à un prix, €7,99 (ajouter €2,39 pour une voix de synthèse) et se trouve sur l'Appstore ICI.

Impressionnante vidéo de Google Voice Action

Si Google s'intéresse aux technologies vocales depuis quelques années et a déjà réussi quelques prouesses, en voilà une nouvelle qui laisse rêveur.
La dernière mouture de la reconnaissance vocale embarquée sur les téléphones Android semble remarquablement efficace, il nous tarde de la tester.
En attendant la vidéo ( cliquez sur le lien si vous ne voyez pas la vidéo ci-dessous) :

Nuance sort Dragon NaturallySpeaking 11

Présentée en juillet, la version 11 de la solution de dictée vocale de Nuance apporte puissance et souplesse. Ainsi qu'une nouvelle politique commerciale agressive, mettant la version de base à 49 euros seulement, la Home à 99 € et la Premium à 199 €.

L'interface a été nettement simplifiée, des aides contextuelles apparaissent pour aider l'utilisateur. Il est aussi possible de créer ses propres commandes personnalisées. Mais si ces novations sont intéressantes pour ceux qui exploiteront les fonctions plus avancées de l'outil, le moteur de reconnaissance de la parole a lui aussi beaucoup progressé. La phase d'apprentissage n'est pas vraiment nécessaire, la barrière d'usage s'estompe donc.

Nuance annonce une amélioration de précision de 15% par rapport à la version 10 ... Les premières démonstrations sont bluffantes ... on attend avec impatience de pouvoir tester complètement cette version.

Nous vous feront part de nos premiers tests dans un prochain billet.

La fin des virus pour les aveugles ...

AVAST Software, l'éditeur du célèbre logiciel anti-virus gratuit avast!, poursuit son désir d’universalité en proposant une nouvelle mise à jour de son anti-virus à destination des aveugles et déficients visuels.

Une nouvelle version rendue possible grâce à de jeunes aveugles passionnés d’informatique. C'est en effet un groupe de déficients visuels passionnés d’informatique issus du Centre TEREZA en République Tchèque, qui a contacté AVAST SOFTWARE pour l’informer de l’absence d’une version accessible aux aveugles et déficients visuels.

Ondrej Vlcek, Directeur Technique d’AVAST Software se souvient : "Ils se sont plaints que la version d’avast! 5.0 n’était pas compatible avec les lecteurs d'écran. Je leur ai dit que nous allions la corriger. Ce à quoi ils ont immédiatement répondu : donnez nous la version bêta pour que nous la testions !“

Grâce au lecteur d'écran JAWS (produit par la société Freedom Scientific en partenariat avec Microsoft) le texte affiché sur écran est transformé en texte oral et braille, et permet d'interagir avec le système d'exploitation et les logiciels. Pour un aveugle, l’affichage simple d’avertissements de sécurité sur l’écran de son ordinateur n’a guère d’utilité.

L’abondance des visuels dans de nombreux programmes complique le fonctionnement du lecteur d'écran. "Les graphismes sont un problème. Le mieux est lorsqu’un programme a des paramètres communs simples, sans javascripts ou objets en mouvement", déclare Radek Seifert avant d’ajouter: "Un lecteur d'écran est un programme complexe pour tous, pas seulement pour les non-voyants. Il est parfois difficile à régler car il y a de très minces différences dans les réglages de lecture et ceux des distinctions entre les fenêtres. Cela dépend aussi souvent des connaissances informatiques de chaque utilisateur".

Une forme de collaboration constructive que l'on aimerait voir se répandre ...

Ecouter ses SMS en conduisant

mytouch-ford-top.jpgFord vient d'ajouter une fonction remarquable par sa simplicité et sa valeur d'usage à son offre SYNC : la lecture vocale des SMS.

Les conducteurs pourront donc appuyer sur le bouton “Do Not Disturb” et le système lira les messages via Bluetooth. Cette nouvelle fonction sera d'abord disponible sur les Blackberry, qui ont un protocole MAP (Message Access Profile) maintenant inclut dans SYNC. Et, bien sûr, les discussions ont commencé avec d'autres constructeurs de mobiles.

Pour en savoir plus sur SYNC et MyFord Touch, l'article de Mashable

La voix en mode Service

Allons-nous parler de VaaS (Voice As A Service) ou de Cloud Voice ? Sans doute. Car le secteur évolue lui aussi vers une virtualisation des services.

La téléphonie a quasi complétement basculé en IP, les services pure web sont nombreux (Skype, Fring, Nimbuzz, Gizmo, Truphone ...) et concernant les services vocaux, voici quelques démarches innovantes.

IfByPhone, qui propose de construire ses services comme on joue au Lego, Voxeo, avec sa constellation de services, Twillio, qui propose des outils pour fabriquer ses services ou vocaliser son site web et, enfin, VoiceSage, qui assure la logistique des services vocaux.

Si ces services sont très orientés cloud, leurs concepteurs n'ont pas la tête dans les nuages ...

Qui vient à Londres fin mai ?

SpeechTek organise à Londres une intéressante série de conférences ... et il est possible d'obtenir des invitations privilégiées. Pour vous en convaincre lisez le programme complet, en pdf.

Si vous souhaitez en bénéficier, écrivez à philippe sur vocalnews.info

Et rassurez-vous vous aurez le comte rendu des meilleurs moments !

Un Dragon dans votre Blackberry

Et voilà un peu de concurrence pour les claviers !

Nuance sort la version Blackberry de son outil de dictée vocale Dictate, déjà proposé sur iPhone et Android. On pourrait s'en étonner, vu que la plupart des possesseurs de ces appareils jugent que son principal atout est le clavier ... mais il suffit de constater la rapidité de l'outil pour comprendre que l'avantage est à la voix. Sans oublier les aspects sécurité et praticité.

A découvrir, ainsi que d'autres applications vocales, sur l'AppWorld de RIM

La biométrie progresse dans les banques

Alors que dans quelques jours se tiendra la Conférence Biométrie à New York, voilà que 3 banques israéliennes annoncent avoir déployé ces solutions.

Ce sont les banques Leumi, HaPoalim et Discount Bank qui viennent de sécuriser leurs transactions avec la solution Persay. De l'authentification multi-facteurs au téléphone à l'accès simplifié à la banque en ligne, ces banques s'appuyent maintenant sur l'empreinte vocale de leurs clients pour les identifier et sécuriser les transactions.

Oren Hertz, responsable des centres de contacts de la banque HaPoalim, explique que la qualité de service est nettement améliorée depuis qu'ils n'ont plus à identifier les clients lors de leurs appels.

Almog Aley-Raz, président de Persay, pense d'ailleurs que le fait que ces technologies puissent s'utiliser sur de multiples canaux sans investissement massif en fait une alternative très importante.

Ordonnez et vous recevrez

Ce doit être le mot d'ordre chez Ocado (ils n'ont pas dû se rendre compte du jeu de mot en français ...), le eMarchand anglais.

Voilà qu'ils continuent d'innover en proposant la commande vocale de leurs quelques 21 000 produits. Et ceci sur une version Android, présentées sur une page dédiée. Pour une fois, la version iPhone déjà sortie, n'a pas encore profité de la fonction.

Selon Jason Gissing, co-fondateur d'Ocado, il faut tout faire pour simplifier l'expérience client.

Attention à votre timbre !

La biométrie vocale est efficace, très efficace ! Ce sera d'ailleurs un des sujets de l'excellente conférence qui se tiendra les 4 et 5 mai à New York (il est encore possible de s'inscrire).

Ce qui est intéressant, c'est que voilà la Police qui s'y met ... deux ans après la gendarmerie. Car ces derniers ont déjà expérimenté la fiabilité de ces outils pour identifier des délinquants. Pour s'en convaincre, la police a demandé à son personnel lyonnais de prêter leur voix à des tests ... surtout lorsqu'ils étaient enrhumés. Des tests ont aussi été menés avec des imitateurs de personnalités.

Et voilà que notre police s'équipe de BatVox, le système d'Agnitio, spécialiste espagnol de la biométrie vocale.

A quand dans les services de relation client pour optimiser l'identification et augmenter la qualité de service ?

Le Corriere à haute voix

Le Corriere della Sera, grand quotidien italien, passe à la synthèse vocale, aussi bien pour son site internet que son application iPhone. C'est VoiceCorp, avec son application bien connue ReadSpeaker, qui enrichit vocalement l'actualité italienne.

Roy Lindemann, le co-fondateur de VoiceCorp a déclaré : "VoiceCorp est très heureux d'ajouter la fonctionnalité vocale au site Web et aux applications iPhone du Corriere. En faisant parler le site Web et les applications iPhone du Corriere, nous fournissons un nouveau canal facile à utiliser pour que les lecteurs du Corriere puissent accéder à l'information"

Laissez-vous charmer par cette belle voix ...

Innovation

AskWiby.png

Avec la profusion des outils, l'unification des canaux est souhait difficile à satisfaire.

Deux entreprises se sont liées pour tenter une approche innovante. WIT Software et ReusableIT proposent de mixer recherche, langage naturel et intelligence artificielle pour simplifier l'accès à l'information. Ils ont baptisé leur offre AskWiby.

Un client peut ainsi trouver une réponse, quelque soit le mode (SMS, email, web ...) et dialoguer dans un langage structuré, en anglais et portugais, bientôt en espagnol, français et allemand.

C'est la Faculté de Sciences et Technologie de Coimbra qui a donné naissance à cette approche, ReusableIT étant une de ses spin-off.

Pour en savoir plus : AskWiby

La Cantoche

La Cantoche sort sa version Saas ... la voici en scoop avec un petit message :

SpeechTek à Londres

Connaissez-vous SpeechTek ?

Voici l'événement américain dédié aux technologies vocales, issu du magazine américain eponyme, qui débarque à Londres. Il aura lieu les 26 et 27 mai dans un hôtel et nous vous ferons part des débats ... à moins que nous nous y croisions !

A découvrir ici : Le programme et les informations pratiques

Rogers Navigator pour iPhones canadiens

shaketogo.jpg Les abonnés canadiens de Rogers vont pouvoir se diriger grâce à une application nommée Shake-to-go.

Les destinations sont entrées vocalement, les instructions lues à haute voix, comme dans nombre de GPS. L'outil exploite aussi le carnet d'adresse pour identifier les adresses de destination (attention à les avoir bien entrées ...) et met en oeuvre une connexion avec les informations de trafic.

Shake-to-go permet de se faire diriger vers chez soi, une autre fonction nommée Last Origin vers la dernière adresse de départ.

Si l'application est gratuite, elle nécessite un abonnement de 4,99 $ par mois.

Première application vocale pour iPad

Nuance vient de sortir la première application de dictée vocale pour l'iPad qui vient à peine de commencer sa commercialisation.

Proposé avec un clavier en option, l'iPad ouvre évidemment la voie à de nombreuses innovations d'interface. Aussi Nuance, vu les bons résultats de son outil de dictée sur iPhone s'est empressé d'en faire une version adaptée.

A tester ici

Apprentis dentistes

Hanako Showa est une femme robot qui a pour objectif d'aider les apprentis dentistes.

C'est un professeur de l'Université Showa à Tokyo, Kotaro Maki et l'entreprise de robotique Tmsuk qui ont créé cet outil basé sur la synthèse vocale et des modules sensitifs pour réagir à la douleur.

"Le nombre d'incidents recensés lors des actes dentaires est plus de deux fois plus important la première année d'exercice que la deuxième, ce qui prouve que la formation initiale des dentistes ne permet pas d'acquérir les compétences réellement requises en cabinet. Avec ce robot, les apprentis peuvent répéter les exercices et multiplier les échecs, de ce fait, ils acquièrent de l'expérience."

Source Generation NT

Vlingo lit les emails

Afin d'aider les automobilistes à rester bien concentrés, Vlingo propose SafeReader, qui let les emails à haute voix. Sur la version Blackberry pour commencer.

Rien de très exceptionnel, mais encore un outil qui démontre que le vocal est l'avenir du mobile !

D'ailleurs une nouvelle startup, Voice on the Go propose aussi depuis peu une interaction vocale avec ses emails pour les smartphones. Les versions iPhone, Android ou Blackberry sont sur leur site.

A découvrir avec une animation sympa :

Audi passe au vocal

Audi a choisi d’intégrer les applications vocales de Nuance dans ses nouveaux modèles A8.

Alliant navigation, multimédia et téléphonie, les commandes vocales du nouveau système d’info-divertissement d’Audi offrent une interface intuitive conçue pour limiter les distractions visuelles et manuelles des automobilistes.

Les fonctionnalités vocales des modèles 2010 de l’Audi A8 J’énonce ma destination en une seule fois : Grâce à l’application One-Shot Destination Entry de Nuance, les conducteurs dictent leur adresse de destination en une seule commande vocale, c’est extrêmement simple. Il suffit par exemple de dire « Boulogne Billancourt, 47 avenue Edouard Vaillant » pour que le GPS du système MMI Touch calcule l’itinéraire. A moyen terme, l’accès au répertoire de contacts accélérera encore la procédure. En effet, le conducteur pourra dire « Aller au domicile de John Smith », ce qui déclenchera la recherche d’itinéraire.

Je sélectionne une chanson : Music Search permet la sélection vocale des morceaux de musique par simple dictée de la source audio, du genre, de l’artiste, de l’album ou de la chanson. Avec les commandes vocales en langage naturel intégrées au système d’info-divertissement des Audi A8, les utilisateurs ont simplement à prononcer « Lire l’artiste Lady Gaga » ou « Lire le titre Bad Romance », par exemple. Grâce à la reconnaissance vocale multilingue, Music Search sait gérer les commandes en différentes langues. Le système propose également la sélection vocale de stations de radio par nom ou fréquence et le contrôle vocal des lecteurs de CD, DVD et MP3.

Les commandes vocales intégrées permettent aussi la numérotation vocale. Le répertoire peut inclure jusqu’à 2 000 contacts, dont 50 entièrement personnalisables. L’utilisateur peut énoncer « Maman » ou « Bureau » par exemple, pour accélérer l’accès aux contacts les plus fréquents.

- page 1 de 48