martes, 26 de marzo de 2013

Zoe, la nueva Terminator



También puede cambiar el tono de voz de acuerdo al sentimiento.

Zoe, es una cabeza digital parlante, capaz de expresar emociones humanas con un realismo nunca antes visto, lo que puede significar una nueva era en la interacción computadora - humano.

Esta cabeza virtual fue desarrollada por investigadores del Laboratorio de Investigaciones de Cambridge de la compañía Toshiba y el Departamento de Ingeniería de la Universidad de Cambridge, y puede ser utilizada como un asistente personal digital o remplazar textos por mensajes “cara a cara”.

La similitud que guarda con la realidad es impresionante y puede emitir una gama de emociones muy amplia o cambiar de voz de acuerdo al sentimiento. Los usuarios teclean cualquier mensaje especificando una emoción particular y la cara recita el texto. De acuerdo con sus diseñadores, es el “avatar” más expresivo y real que jamás se haya visto.

Según los estudiantes, la cabeza sin cuerpo guarda un curioso parecido con Holly, la computadora del buque que aparece en la comedia británica de ciencia ficción, Red Dwarf. De hecho, la cara utilizada fue la de Zoe Lister, actriz mejor conocida como Zoe Carpenter, de la serie Hollyoaks. Para recrear sus rasgos y su voz, los investigadores pasaron varios días grabando a la actriz.


El resultado es un sistema lo suficientemente ligero como para emplearse en la tecnología móvil y puede ser utilizado como asistente personal en celulares o en chats con cámara.

El marco detrás de Zoe ya se había empleado para que las personas pudieran subir a la red sus propias caras y voces, en cuestión de segundos, no en días.

Esto quiere decir que, en el futuro, los usuarios podrán elegir y personalizar su propio asistente digital. De esta manera, cualquier persona podrá teclear un mensaje como “voy a llegar tarde”, establecer una emoción de tristeza y su amigo recibirá una “mensaje de rostro” tal cual como lo quiere el mandatario.

El equipo detrás de Zoe actualmente trabaja en una escuela de niños sordos y autistas, para quienes la tecnología puede ser una gran herramienta de enseñanza y les permitirá interpretar emociones y aprender a leer los labios.

Últimamente, al sistema se le pueden dar varios usos, desde video juegos, hasta libros visuales, incluyendo diversos tipos de interfaces para los usuarios.

Esta tecnología puede ser el inicio de toda una generación de interfaces que permitirán la interacción con la computadora más que la charla entre seres humanos”, destacó Roberto Cipolla, profesor del Departamento de Ingeniería de la Universidad de Cambridge.

Asimismo, agregó que el reto de crear a Zoe fue empezar con bocetos y enseñarle al sistema a entender un lenguaje y una serie de expresiones. Ahora, que ya es una realidad, no será tan difícil hacer con otra cara y otra voz.

Además de ser más expresiva que cualquier otro sistema virtual previo, el programa empleado para que Zoe trabaje utiliza sólo decenas de megabytes en tamaño, lo que significa que puede incorporarse a la computadora más pequeña, incluyendo tabletas o teléfonos celulares inteligentes.

Trabaja con una serie de emociones básicas y su voz, por ejemplo, tiene un varias programaciones como feliz, triste, tierna, enojada, asustada o neutral. El usuario puede ajustar estos parámetros en diferentes niveles y puede alterar la velocidad o profundidad de la voz.

Con la combinación de estos niveles, es posible pre-programar o crear infinitas combinaciones emocionales. Por ejemplo, si combinamos felicidad con ternura e incrementamos la velocidad y profundidad de la voz, el resultado es una expresión amistosa y de bienvenida. Por el contrario, una combinación de velocidad, enojo, y miedo hace que Zoe parezca aterrada. Esto proporciona un nivel de sutileza emocional jamás creado en avatares similares.

Para que el sistema sea lo más realista posible, el equipo de investigadores recolectó un set de datos de miles de oraciones empleadas para entrenar el habla, con la ayuda de la actriz Zoe Lister. También siguieron su cara mientras ella hablaba y emplearon un software de visión por computadora. La voz fue creada a través de algoritmos matemáticos, así como las expresiones faciales.

La efectividad del sistema fue comprobada con 20 voluntarios a través de un portal de internet. A los participantes se les dio un video o un clip de audio de Zoe replicando 10 oraciones diferentes y se les pidió a los participantes que identificaran el tipo de emoción de cada una.

A los usuarios que se les dio video sin sonido sólo fueron capaces de reconocer 52% de las emociones. Cuando sólo tenían audio, pudieron clasificar 68%. Pero cuando tenía ambos elementos, tuvieron un reconocimiento de 77%, ligeramente más arriba que aquellos que reconocieron las emociones de la actriz real, que fue de 73%.

Además de buscar diferentes aplicaciones para la “cabeza que habla” los investigadores ya están trabajando en una versión del sistema que pueda ser personalizado por los propios usuarios.

No hay comentarios: