EXalli

dragon01El software para reconocimiento de voz no es algo Nuevo, al contrario, este tipo de aplicaciones tienen cerca de dos décadas de haber sido llevadas al mercado, primero como soluciones verticales demasiado especializadas y luego para uso del público en general.

Uno de los nombres que se ha mantenido a lo largo de todo ese tiempo es el de Dragon, que llega en su versión 10 ofreciendo mejoras interesantes. Algunos usuarios, de los que usualmente se llaman “early adopters”, es decir, que adquieren la tecnología cuando recién llega al mercado, se sintieron desilusionados con las primeras aplicaciones de reconocimiento de voz y dictado pues para tener una precisión apenas aceptable eran necesarias muchas horas de entrenamiento del sistema para que éste pudiera reconocer la voz de una sola persona. Además los primeros programas de este tipo solían consumir una cantidad impresionante de recursos de la PC, por lo que muchos usuarios que intentaron adoptar esta tecnología terminaron por abandonarla.

Exalli.com decidió probar la versión 10 de Dragon Naturally Speaking para verificar sus capacidades y ventajas.

Despertando al dragón

EL proceso de instalación duró alrededor de 15 minutos en una computadora con procesador de doble núcleo a 1.6GHz y 2GB en RAM. Durante este proceso fue necesario instalar el tiempo de ejecución de Visual C++, requerido para la ejecución de Dragon Naturally Speaking, el cual se instaló automáticamente.

En seguida notamos que al ejecutar el programa por primera vez se pide al usuario que active el producto, aunque es posible indicar que esta labor se realice más adelante. En seguida es necesario crear un usuario y elegir la variante de español que se desea usar (España o América Latina). También se debe elegir el tipo de micrófono a usar así como la conexión que éste usa. Es importante destacar que para este programa funcione correctamente es necesario utilizar el micrófono, afortunadamente el software incluye uno tipo diadema. Finalmente hay que elegir el tipo de entrenamiento que se desea seguir, teniendo como opciones: ninguno, corto o especial. Para la prueba elegimos “ninguno”. Unos segundos después apareció un cuadro de diálogo donde se pide al usuario que conecte el micrófono, en seguida será necesario realizar un par de pruebas para comprobar el volumen y la relación voz-ruido, para lo cual el usuario deberá leer un párrafo en voz alta. Cabe señalar que cuando se realiza la prueba de calidad de sonido es importante evitar otros ruidos ambientales, como ventiladores, motores o, incluso, la funte de poder de la PC si es que es muy ruidosa. Es posible que lograr una lectura correcta tome 4 o 5 intentos. Lo siguiente es que el sistema se adapte a la manera en que el usuario escribe, para ello analiza la carpeta Mis Documentos y los mensajes de correo de Outlook con el fin de “aprender la manera en que el usuario se expresa por escrito”. Todo el proceso de preparación puede durar alrededor de 30 o 35 minutos.

Una vez completado el proceso de preparación es posible utilizar la DragonBar, una barra de herramientas localizada en la parte superior de la pantalla desde la cual es posible iniciar el dictado o activar desactivar el micrófono. También aquí es posible elegir el usuario con lo cual se desea trabajar.

dragon1

Otra de las herramientas que encuentra en la DragonBar es el Visualizador de comandos, una ventana donde se muestran todas las órdenes verbales que se pueden dar programa, incluyendo aquellas para controlar las opciones de Word o del mismo Dragon NaturallySpeaking. Además incluye las herramientas Ventana de dictado y Drago Pad, ambas son espacios intermedios donde se puede depositar el texto sin que llegue directamente al documento que se está editando o, bien como sustituto de otro procesador de textos.

Una de las cosas que notamos al utilizar esta aplicación es que las palabras van apareciendo gradualmente al ser dictadas especialmente cuando se trata de oraciones demasiado largas ya que en pantalla aparecerá la frase completa y no palabra por palabra, a menos, que se use una computadora con mucha capacidad de procesamiento. Como par,te de las pruebas que realizamos se procedió a leer un texto sin pausas para verificar la cantidad de texto que fuese transferida sin que el usuario deba de detenerse constantemente. Durante esta prueba se descubrió el reconocimiento de voz es mucho más preciso cuando se hacen pausas de vez en vez, por ejemplo hablar como si se estuviera dictando a una persona; es decir alrededor de cuatro o cinco palabras consecutivas.

dragon2

Se puede decir que para la mayor parte del público usuario este programa puede servir para aumentar su velocidad en forma notable al escribir, sin embargo para un mecanógrafo experto la velocidad podría ser muy relativa pues, al utilizar una computadora de características medias y dictar más de seis o siete palabras en un solo bloque el equipo necesitará de algunos segundos para procesarlas y mostrarlas en pantalla. Una posible desventaja de este producto es que resulta complicado emplearlo cuando el usuario se encuentra acompañado ya que sería normal que éste dirija algunas palabras a su interlocutor, lo cual será interpretado como dictado o alguna orden hablada. Lo mismo cuando el usuario padece alguna enfermedad de las vías respiratorias.

Por otra parte, resulta muy conveniente para personas con discapacidad, especialmente aquellas que sufren de alguna afectación en las manos o en las especulaciones o que, incluso, han perdido las extremidades superiores. Cabe destacar que en esta versión de Dragon NaturallySpeaking se puede controlar algunas de las opciones más utilizadas de Windows sin embargo en la versión más hasta más compleja se puede operar prácticamente todo el sistema operativo incluso cuenta con opciones para realizar búsquedas en Internet.

Conclusión

Es notable el nivel de control que este programa puede dar, sin embargo para lograrlo es necesario invertir bastante tiempo. Sin embargo una vez que se consigue es posible controla casi todos los aspectos de Windows únicamente con la voz.

Facilidad de instalación: ****

Facilidad de uso: ****

Funciones: *****

Consumo de recursos: **

Pros: Tanto el software como la documentación del mismo se encuentran completamente en Español, incluye diadema con micrófono. Sin entrenamiento es más preciso que el reconocimiento nativo de Windows

Contras: Es recomendable una PC que exceda ampliamente los requerimientos mínimos, la diadema especialmente incómoda. Windows Vista y Windows 7 ya cuentan con reconocimiento de voz integrado