jueves, 16 de junio de 2011

Respuesta ASORCALDAS

Buenas noches Juan Camilo

Nos alegra que la universidad de Caldas este apoyando la investigación a través de la tecnología para personas con discapacidad.

Queremos conocer el desarrollo de dicha interfaz, también compartir experiencias relativas a la investigación.

Con gusto los atenderé el dia miércoles 29 de junio a las 2 pm en nuestra sede, ubicada en la carrera 17 No 26 - 53 , Casa de la Cultura de San Jose.

Espero nueva comunicación por este medio.

--
José Fernando Duque G.
Presidente
Móvil: 3008771049
ASOCIACION DE SORDOS DE CALDAS

lunes, 6 de junio de 2011

Documento Ejecutivo.

MiVoz

Que es?

Mivoz es una interfaz visual que dispone al usuario diferentes opciones para escribir frases mediante la opción de “Eyetracking” que controlará mediante el movimiento del ojo los diferentes tipos de teclados y opciones dispuestos en la aplicación.
La funcionalidad de Mivoz consiste en facilitar la comunicación entre varias personas, para eso se dispones dos opciones para escribir frases y otra de configuración, además de mostrar en tiempo real las palabras que se van formando y la opción de convertirlas en sonido.

La primer opción para generar las palabras se llama “Teclado”, este consiste en una ubicación de un teclado en forma radial, donde las letras mas utilizadas se disponen en las zonas externas y el usuario deberá activar las zonas de las letras al dejar el puntero medio segundo sobre la zona.
Para facilitar la escritura de las frases esta la otra opción para crearlas llamada “Tecla rápida”. Esta consiste en un menú desplegable que se divide en categorías de diferentes grupos de Palabras y activa un submenu con varias opciones de la categoría seleccionada.

Con la intención de personalizar el uso de MiVoz, las opciones de configuración ayudan al usuario a dar un concepto mas personal por medio de diferentes opciones que permiten escoger el tipo de voz, entre adulto o niño, hombre o mujer, así como la velocidad que exporta los sonidos.


Para que sirve?

Mivoz esta pensada para personas discapacitadas de la voz que facilita la escritura y formación de frases para convertirlas en sonido. Las personas discapacitadas pueden entablar conversaciones con personas que no sufren de problemas.
Pensado en situaciones cotidianas, para salir de compras o para educación de niños y adultos.
El uso de Mivoz ayudará a a los usuario a romper barreras de comunicación, creando un puente entre sus necesidades y un lenguaje claro y sencillo para las personas que no entiendan el lenguaje de señas.

Como se hizo?

Se identificó como un problema de diseño a solucionar la falta de comunicación
presentada por la discapacidad de la voz. Teniendo en cuenta el contexto de la Ciudad
de Manizales se trataron de encontrar soluciones de planificación y de tecnología de
fácil acceso para la comunidad afectada.

Entre una de las referencias que se encontraron sobre programas para personas
discapacitadas de la voz, se encontró uno llamado “Hablando con Julis” que consistía
en una aplicación que por medio de menús y categorías con imágenes de las palabras
formaban una frase que después se traducía en sonido. Este también ayudaba al
usuario a aprender el lenguaje de señas. Este programa especialmente fue un punto de partida para Mivoz, ya que mostraba una solución tecnológica y funcional pero no tenia ningún tipo de diseño y planificación en su interfaz.

Otra referencia importante es la de Grafitti Lab research que utilizaron el eye
tracking para una persona con parálisis Total y lograron que hiciera gráficos por
medio del movimiento de la pupila del ojo.

Teniendo en cuenta estos hallazgos, se quiso generar un teclado que fuera manejado
por “eyetracking”. Como la persona debía apuntar con su ojo en la pantalla, se dispuso el teclado en una forma radial, dejando las teclas mas utilizadas al extremo de del circulo para facilitar su uso. Esta primera opción es muy directa pero necesitaba un complemento para facilitar la escritura digital. Se pensó entonces en una opción que dividiera grupos de trabajos por categorías fáciles de entender y que fueran pensadas en conversaciones cotidianas.
Este menú es con figurable con anticipación y es pensado para que el usuario fabrique palabras a su gusto. Esto mejorara la experiencia ya que el usuario estará descubriendo que categorías puede crear que sean funcionales y efectivas.
Se definió que la interfaz Mivoz podría se utilizada no solo por una sola persona, si no que se le dieron características de creación de perfiles, pensando en que pueda ser utilizado en fundaciones o instituciones que congreguen un grupo de personas que podrían utilizar Mivoz.

Debido a esto el perfil permite configurar y personalizar a diferentes gustos y necesidades, teniendo en cuenta la edad y el genero de la persona.

Para generar todo lo planeado se escogió el software de programación “VVV”, que por medio de módulos con diferentes opciones se pueden crear aplicaciones para Computador que faciliten la interacción tanto digital como física o en conjunto.

Este programa facilito la utilización del video tracking por medio de una cámara web que reconoció la forma circular de la pupila y dio control sobre un puntero por medio del ojo.

Mivoz. Analisis escrito.

PRESENTACION FINAL TALLER DE PROFUNDIZACION
INTERFAZ MiVoz



ALUMNOS:
SEBASTIAN GONZALES
JUAN CAMILO VALENCIA





TRABAJO PRESENTADO A
MARIO VALENCIA


TALLER DE PROFUNDIZACION II



PROGRAMA DE DISEÑO VISUAL
FACULTAD DE ARTES Y HUMANIDADES
UNIVERSIDAD DE CALDAS
7/6/2011



Mivoz:



Interfaz interactiva pensada para personas discapacitadas de la voz que facilita la escritura y
formación de frases para convertirlas en sonido. Las personas discapacitadas pueden entablar
conversaciones con personas que no sufren de problemas. Pensado en situaciones cotidianas,
para salir de compras o para educación de niños y adultos. Cada interfaz de mi voz se
personaliza dependiendo de las necesidades del usuario.


OBJETIVOS


General

Diseñar un interfaz adecuada para la creación de frases que facilite la forma de escribirlas y
con la utilización de gráficos y símbolos que enseñen y capaciten al usuario para generar audio
atendible para las demás personas.


Específicos.

· Obtener e investigar información sobre la creación de interfaces interactivas
audiovisuales.
· Encontrar funcionalidad comunicativa en las interfaces sonoras.
· · Crear soluciones de comunicación para discapacitados.
. Generar un interfaz teniendo en cuenta conceptos de simplicidad.
. Crear un puente entre los usuarios de MiVoz y las personas que no tienen problemas de
la voz y mejorar la comunicación.


JUSTIFICACION Y REFERENCIAS


El proyecto pretende abrir un campo de conocimiento sobre las interfaces funcionales, que
tengan en cuenta el contexto de la ciudad de Manizales y Colombia en general, para disponer
de nuevas herramientas de comunicación adecuadas para personas con discapacidad que
mejoren su vida diaria y aporten elementos de mejora de las relaciones interpersonales y con
las demás personas.

En la actualidad encontramos muchos software que sirve para escribir frases y convertilas en
sonido, pero ninguna de estas piensa en personas con discapacidades y sus necesidades de
comunicación en su vida diaria y cotidiana. El software “hablando con Julis” ayuda a las
personas con discapacidad de la voz, pero con un alto grado de desarrollo de ingeniería mas no
de diseño.


Marco teórico.

La interfaz Mivoz, pretende ser un puente de comunicación entre personas discapacitadas de
la voz con personas que no tienen problemas al hablar. Para lograrlo debemos crear un proceso
que facilite la creación de frases y una retro-alimentación.

Según Donald A Norman, la comunicación debe seguir una sola dirección, se necesita
construir una vía coordinando nuestras actividades, cooperando con maquinas autónomas.
Teniendo en cuenta esto, se tuvieron en cuenta diferentes disposiciones en un espacio virtual
de teclados, menús y símbolos adecuados para la escritura digital. En un principio sin éxito y
después encontrando metáforas adecuadas que facilitaran tanto el entendimiento si no
también la usabilidad y funcionalidad de la interfaz.

Con Mivoz se dará control a la interfaz por medio de un sistema mediador con una reacción
puntual, simple y de dependencia a los procesos binarios.

En el proceso de comunicación encontramos una cadena de elementos que nos ayudan a
definirlo y a entenderlo, según el profesor Laswell, 1948, hay que tener en cuenta la pregunta
¿quién dice qué por cuál canal a quién con qué efecto?, en nuestro caso, las personas
discapacitadas necesitan de elementos externos para decir el que, estos elementos pueden ser
lenguaje de señas o escritura, pero es posible que a quien se dirige no comprenda al desconocer
las señas que no necesita ni le hacen falta en la comunicación normal. Es el momento donde
entran los beneficios de la tecnología, en una época donde tener un computador personal es
casi una obligación, o al menos existen instituciones que acercan estos elementos a quien lo
necesite.

Mivoz ademas de ser el canal, construirá el código y lo interpretará en sonido claro para las
demás personas. La manera de lograrlo es atravez del video tracking, que es una técnica de
reconocimiento de imágenes de video mediante una cámara, la cual convierte en datos
algorítmicos que pueden ser editados y manipulados, mediante programación.
Al tener estos datos digitales podemos manejar los valores adecuados para nuestra finalidad. En este casoel Tracking se realizara a la pupila del ojo el cual dará la capacidad al usuario de desplazar un puntero por la pantalla y activar zonas y botones por disposición de tiempo en un punto.

Con mi voz se dará control a la interfaz por medio de un sistema mediador con una reacción
puntual. Este tipo de interacción se da por el movimiento de la pupila y que se activaran las
funciones deseadas dejando el puntero (Pupila) un tiempo determinado sobre el botón o tecla
elegida.

Identificamos también una interacción externa debido a que el usuario debe manipular la
interfaz y el sistema para lograr escribir las frases, pero para que esto se logre debe existir
una interacción interna, dada por el ordenador, al recibir la señal escrita y convertirla en
sonido, estos procesos son internos y digitales y no están a la vista del usuario.


Interfaz Teclado principal.


Debido a que nuestra interfaz dependerá de la posición de un punto en el espacio y de apuntar
sobre los elementos para activarlos, se utilizo la forma de un tiro al blanco, donde se dispuso
las letras del alfabeto mas utilizado en los bordes externos del circulo para facilitar su acierto
y activación.

Teniendo en cuenta las investigaciones realizadas por Jacob Nielsen en su pagina
www.useit.com sobre Eyetracking, las personas tienen la tendencia de mirar mas sobre los
elementos dispuestos al lado izquierdo. También los elementos que se encuentran alejados e
individuales en el espacio llaman la atención de las personas, por lo cual se dispuso de manera
individual los botones de las funciones adicionales de la interfaz.

En la parte superior esta el “cajón de texto” donde se visualizan las letras que se van
agregando desde el teclado. Al lado de este cajón esta el Botón de “salida del audio”, este esta
representado por el logo de mi voz y en rojo para alertar su uso e importancia.

Al lado derecho de la pantalla se ubican 3 botones desplegables. El primero indica que se
encuentra en la pantalla del teclado principal El segundo botón activa la “tecla rápida” y el
tercero sirve para la configuración de los tipos de voz que se pueden escoger.


Interfaz “tecla Rápida”

En la pantalla principal, al activar la “tecla rápida” se extiende otro menú con varios botones
que facilitan la escritura con frases predeterminadas con anticipación.
Esta nueva pestaña se divide en dos grupos. El primer grupo esta en la parte superior, estos
son un menú de diferentes categorías que agrupan diferentes elementos en conjuntos acordes
y que tengan unidad en contenido.


Estas categorías son:

Animales, trabajos, emociones, sonidos, iconos, alimentos, actividades.

Al elegir cualquiera de estas categorías, se activa en la parte inferior todo el grupo con sus
símbolos, los cuales al ser elegidos suben la palabra automáticamente al “cajón de texto” sin
necesidad de escribir letra por letra.

La tecla rápida permite con anticipación y de manera predeterminada formar palabras o
frases de saludos o situaciones cotidianas que se utilicen con mas frecuencia. En la parte
inferior de este menú hay otro botón que permite pasar a una siguiente pantalla de otros
botones dejando un número indefinido de botones para utilizar.


Configuración del tipo de Voz.

Al activar esta opción, se desplazan las configuraciones de Voz y se dividen en las siguientes
características:

Tipo de voz.
Se da la opción de elegir entre voz de niño o niña, Hombre o mujer adultos.

Velocidad de la voz:
Se puede elegir entre varias opciones la velocidad en que se pronuncian los
sonidos de las palabras dejando al usuario la opción que mas le guste permitiendo personalizar
la voz en búsqueda de una que lo identifique.

Análisis cromático.


Se utilizo la escala de grises en la mayor parte de la interfaz en búsqueda de neutralidad, ya
que son colores que no cansan la vista al ser utilizados en un largo periodo de tiempo,
pensando en que las personas pasaran lapsos extendidos al usarlos y por el contraste que
genera el gris, el blanco y el negro que resaltan las estructuras visuales de la interfaz. El
puntero es de color rojo, generando el mayor contraste sobre el fondo y los botones, para que
resalte sobre estos y el usuario siempre sepa a donde esta mirando, el tamaño es disminuido
para que el color no produzca fatiga.


El rojo también se utilizo sobre el botón de “salida de audio” al lado del “cajón de texto” para
llamar la atención y darle importancia a su función que es de gran importancia para el
funcionamiento adecuado de la interfaz.




Como se realizó.

En el mes de Agosto de 2010 y como Trabajo final a futuro para la Profundización de Diseño
Visual se comienza a pensar un proyecto que tuviera en cuenta avances tecnológicos, ayuda a
la comunidad y el contexto de la Ciudad de Manizales y el eje cafetero. Para esto se decidió
trabajar sobre el problema de las personas discapacitadas de la voz, conocidos comúnmente
como mudos.

Como primer paso se empezó a investigar sobre interfaces, para este paso se tomaron las
metodologías para realizar un proyecto otorgadas por los Profesores Juliana Castaño y Alex
Cano, donde se tomo como prioridad el encontrar una pregunta de proyecto. En este caso se
presentaron preguntas sobre interfaces, instalaciones interactivas o musicales.

Para ampliar la información se obtuvo una lista de autores que podrían acercar al tema y
brindar mas posibilidades de un acercamiento al problema que se buscaba.
Estas lecturas brindan ejemplos de instalaciones sonoras desde la visión del arte pero que han logrado resultados interesantes a la hora de generar sonidos de forma no convencional y a través de los ordenadores.

Se hace un acercamiento a diferentes autores y algunas de sus obras,
analizando los montajes y los resultados obtenidos.
En estas lecturas también encontramos
información sobre la importancia del sonido en la interacción rescatando el valor que se puede
obtener como sistema de información y en el valor terapéutico que se logra con los sonidos,
importantes en este proyecto que tiene como funcionalidad el ayudar a personas con
discapacidades y como aprovechar este tipo de bondades del sonido.


Sound Art. Beyond Music between categories
Alan Licht
Foreword by Jim O'rourke

The art and science of interface and interaction design.
Christa Sommerer - Lakhmi C. Jain - Laurent Mignonneau.

Inaudible Computing: An Extension of
Physical Computing using Audio
Signals
Kazuhiro Jo
PhD Music in interfaces review

The uses of audio in interface design: in particular the
use of music
Sue Grice

Our sonic environment and the soundscape the tunning of the world.
R. Murray Schafer.


Con una mínima idea sobre interfaces e instalaciones interactivas se realiza un plan mental
del proyecto que ayudaría a indicar un camino que se tomaría de aquí en adelante. A partir de
esto se pensaron diferentes posibilidades para comenzar el proyecto.

Ya tomando el problema de la discapacidad de la voz, se comienza a pensar en soluciones que
tienen que ver con el proceso de comunicación y como las interfaces ayudan a este proceso. En
primera instancia se buscaba la forma de generar frases escritas que se convirtieran en
sonido.


Se investigaron diferentes programas que pudieran hacer esta acción, entre ellos se encontró
el “Talk it” que es un software que modula una voz que reproduce todo lo que en el se escriba,
este permite generar diferentes tipos de voz, entre ellos de mujer, hombre, niño o de robot,
también permite cambios en la velocidad de reproducción.

Este programa aunque útil, no solucionaba los problemas para escribir de una manera
adecuada, lo que dio una dirección al proyecto sobre el tipo de interacción que se debería
generar para ayudar a las personas y que fuera fácil de utilizar en la vida diaria.

A través de Ernesto Cesar Galeano. y su libro "Modelos de Comunicación" se tuvo un
acercamiento al tema de la comunicación para aplicarlos a la instalación interactiva para
resolver problemas comunicativos entre personas con discapacidad de la voz. Debido a la
similitud que hay entre los interficios y los procesos de comunicación, se abre un estudio sobre
estas teorías, para adecuarlo a la creación de interficies, entender y solucionar problemas de la
comunicación y adecuarlos al proyecto de interacción con personas discapacitadas, a las cuales
se les quiere brindar soluciones en la codificación del mensaje entre emisor y receptor, sin
olvidar el feedback que se debe realizar entre ellos.

Con estas primeras lecturas se empezaron a sugerir posibles soluciones
para la interfaz. Una de estas era adecuar la tecnología del Control
mental, un dispositivo de electroencefalograma adecuado como un
control en una di adema que se coloca sobre la cabeza que puede
utilizar esta señales como un dispositivo de control sobre actividades
de un ordenador.

Este control era muy llamativo por no tener que
utilizar las manos para la interacción y por medio de pensamientos se
podrían crear frases.
Debido al desconocimiento de la tecnología y a sus costos, se tuvo que rechazar y seguir en la
búsqueda de otros dispositivos de control.
Para la finalización del año 2010 se tenia una idea
sobre la interfaz a utilizar y se seguía buscando una
solución para controlarla.

A principio del año 2011, entra al grupo de trabajo Sebastian Gonzales. A partir de este
momento se empieza a buscar mas fuertemente la solución al control de la interfaz.

Como
posibles propuestas están la de utilizar los dispositivos móviles, un software de código libre
llamado Voice me, y el Eye Tracking
EN acuerdo con las asesorías realizadas con Mario Valencia, el grupo de trabajo se da cuenta
que el eye Tracking puede ser la solución mas adecuada y se comienza a desarrollar la interfaz
pensando en estos dispositivos y como facilitar la escritura.

Es así que por medio de la pagina “useit” de Nielsen, se encuentran diferentes investigaciones
sobre el eye Tracking, elementos para su utilización, investigaciones sobre composición, color.
Con estas ideas se ponen manos a la obra sobre la interfaz visual.

Hasta este momento, el proyecto no tenia un nombre que lo identificara, así que en una de las
reuniones semanales sobre el trabajo, Sebastian Gonzales propone el nombre de Mivoz, que
abarca todo el concepto de la idea de interfaz, y ofreciendo un camino a seguir sobre las
futuras decisiones a tomar sobre esta interfaz sonora. Con este nombre se pretende apersonar
al usuario a la aplicación, la idea es que sea parte de cada persona, esto se logra por medio de
un perfil personalizado, que guardara todas las configuraciones y cambios que se realicen,
otorgándole la personalidad de cada uno, por medio de configuración predeterminada de la
voz, de las frases y de los botones rápidos


Para lograr esto, se dividió el trabajo, Sebastian Gonzales se apropiaría de la programación y
Juan Camilo Valencia sobre el diseño de interfaz.

La interfaz se dio teniendo en cuenta conceptos de Nielsen sobre eye Tracking, también
teniendo en cuenta que la persona debe apuntar con su ojo a la pantalla, teniendo en cuenta
una diana de tiro donde se disponen las teclas mas utilizadas al lado izquierdo y lo mas lejos
del centro, donde es mas fácil atinar.

Esta pantalla esta dividida en zonas calientes que se
activan por cierto tiempo de estar el puntero en esta zona.
La intención es generar una
pantalla donde se facilite el movimiento de un puntero y se contrastes los botones y menús


Para la programación se tuvieron en cuenta programas como Pure Data, que gracias a su
programación modular y un gran numero de posibilidades que ofrece facilitarían el montaje de
la interfaz en su interacción interna. Pero este programa complico lo que estábamos buscando
y Se facilito todo al empezar a programar en “VVV” otro programa modular que facilitaba las
cosas en cuanto a video trackin, generando interacción y resultados mas favorables para lo que
se buscaba.


En VVV se logro activar una cámara web, que reconociera una forma redonda en este caso la
pupila del ojo, y que distribuyera su movimiento sobre la pantalla de la interfaz. Al disponer
con la mirada sobre una sola caliente esta se activara ya sea activando una letra del teclado,
abriendo los diferentes menús o exportando el sonido.

El eye Tracking fue inspirado por “grafitti Lab Research”, los cuales crearon una interfaz para
un amigo que sufrió parálisis total y que pudiera seguir haciendo grafittis por medio de sus
ojos. Este método fue reutilizado y modificado para ser utilizados sobre un teclado virtual.

Para lograrlo, se desbarato una cámara web normal y se le quito un filtro para dejarla
captando señales infrarojas, pero debió adaptarse le led infrarrojos para ayudar a captar la
información que necesitábamos, esta se adecuo a una gafa y disponerla frente al ojo.