Reconnaissance et synthèse vocale
#1
Bonjour à tous,
je "joue" depuis quelques temps avec SARAH http://encausse.wordpress.com/s-a-r-a-h/ pour faire de la reconnaissance et synthèse vocale chez moi.
Je suis assez étonné des performances, surtout avec un kinect, et j'ai donc commencé à l'intégrer dans lifedomus via un connecteur http.
Seulement, il faut configurer chaque variable à la main, et quand la base grammaticale de SARAH comporte quelques centaines de variables, ça commence à être rébarbatif de tout rentrer une à une dans LD.

A tout hasard, serait-il envisageable d'imaginer un connecteur spécifique pour mâcher le boulot ? Par exemple un import des XML ou autre ?
Ou alors encore mieux, intégrer directement SARAH dans Lifedomus :)
Répondre
#2
Bonjour Joffrey,

La reconnaissance et la synthèse vocale sont bien prévues dans les fonctionnalités qui seront fournies dans les prochains mois dans Lifedomus.
Répondre
#3
Merci Olivier :)
Est-ce que j'abuse si je vous demande quelle techno vous comptez employer côté PC ? Dans la roadmap, c'est d'abord les ibidules (avec SIRI) puis les DS sur PC, ou d'emblée une techno multiplateformes ?
Car sur la reconnaissance vocale sur PC, il n'y a pas grand chose sur le marché qui fonctionne vraiment, à part les API Microsoft (que SARAH utilise).
Ça me permettrait de savoir si ça vaut la peine pour moi de continuer à bosser sur SARAH, ou si vous allez utiliser un truc complètement différent.
Répondre
#4
Sujet qui nous intéresse tous les 2. De mon coté, laisser 1 PC supplémentaire (windows) tourner 24/24 ne m'attire pas dans une solution finale.

@Olivier, peut on en parler en aparté avec Goeffrey afin que nous avancions dans le même sens ?

Arnaud
Répondre
#5
Domo-TIC a écrit :@Olivier, peut on en parler en aparté avec Goeffrey afin que nous avancions dans le même sens ?
Arnaud

Pourquoi en aparté? D'autre sont peut-être intéressés, dont moi par exemple ;)

A+

Christophe
Répondre
#6
Domo-TIC a écrit :De mon coté, laisser 1 PC supplémentaire (windows) tourner 24/24 ne m'attire pas dans une solution finale.
Arnaud
C'est pourquoi SARAH m'intéresse, elle est décomposée en une partie serveur (nodeJS) qui peut tourner sur à peu près n'importe quoi, et un client sous Windows (pour le Kinect et les API Microsoft).
Un exemple de ce qu'elle peut faire, sur la vidéo d'origine on entend clairement la gache s'ouvrir, mais le rééchantillonage de Youtube le rend quasi inaudible, il faut monter le son :(
http://www.youtube.com/watch?v=lMu9iuZQm4U
Répondre
#7
Bonjour, moi aussi je suis intéressé, on fait tourner sarah au bureau sur un raspberry et on veut le lier sur du knx :-) je suis donc aussi intéressé par ces ameliorations synthèse et reconnaissance vocale :-)
Répondre
#8
Bonjour,

Des infos sur la future reconnaissance vocale dans LD ? des nouveautés en vue avec l'annonce du "home kit" d'Apple ?

seb
Répondre
#9
Salut Chrisophe, dsl, je viens seulement de voir ta réaction.
Ocelek a écrit :Pourquoi en aparté? D'autre sont peut-être intéressés, dont moi par exemple ;)
A+
Christophe
L’intérêt est que ici le matériel (micro) joue un rôle très important et étant donné que Joeffrey et moi sommes très proches géographiquement de LD peut être intéressant pour tout le monde. Et je ne souhaitais pas polluer ce fil :). Par contre, pas de retour de LD sur le sujet.

Pour ma part, je continue avec Sarah + Karotz, et ça marche très bien, même avec du knx.

@+
Arnaud
Répondre
#10
bonjour,
je relance la demande de Joffrey. Peut on avoir de la visibilité sur ce point ? Merci.
Arnaud
Répondre


Sujets apparemment similaires...
Sujet Auteur Réponses Affichages Dernier message
  reconnaissance d'équipement dans alexa (commutateur virtuel) sud-domotique-expert 7 13,063 12-27-2019, 01:14 PM
Dernier message: Ives
  Reconnaissance vocale Lassina 7 13,277 06-07-2018, 10:24 PM
Dernier message: ngm47
  Reconnaissance et synthèse vocale Joffrey 41 63,523 08-18-2017, 10:50 PM
Dernier message: aureOhwo



Utilisateur(s) parcourant ce sujet : 1 visiteur(s)