Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012. Si continúa navegando consideramos que acepta el uso de cookies. OK | Más información

Entrevista a Eduardo Basterrechea (Molino de Ideas)

Lo confieso, tengo un cariño especial a Molino de Ideas, una empresa joven e innovadora que persigue convertir en realidad la idea de que los ordenadores procesen el lenguaje natural que usamos los humanos. Y, también, vuelvo a confesar, siento predilección por los productos que están elaborando. El jueves pasado dediqué una entrada a su última novedad, Palabrear, y, hoy, os traigo la jugosísima conversación que he mantenido con Eduardo Basterrechea durante este fin de semana:

Molino de Ideas

Se suele decir que las humanidades no tienen futuro pero Molino de Ideas se encarga de desmentirlo día a día. ¿En qué aspectos del lenguaje y la tecnología se trabaja en Molino de Ideas?

Las humanidades tienen un futuro impresionante, prácticamente un presente. Pero unas humanidades con un enfoque diferente al de hace unos años. Se trata de utilizar los conocimientos lingüísticos y aplicarlos a encontrar modelos y estructuras. Hay que perder el miedo a poner en duda lo que se lleva siglos tomando como verdadero. No es que seamos mejores que los que nos han precedido, sino que simplemente tenemos mejores herramientas. Pienso en lo que podrían haber hecho los grandes de la filología con las herramientas de que disponemos ahora.

En la actualidad en el campo de la lengua hay dos ramas antagónicas que están trabajando en la lengua, por una parte los filólogos de toda la vida, que tienden a no utilizar recursos tecnológicos, se centran en una única lengua y conocen la historia de cada palabra y cada excepción, y por otra a los informáticos que se centran en áreas concretas como la morfología, trabajan para cualquier lengua y esperan que las reglas surjan de modo automático al aplicar algoritmos masivos. Nosotros nos colocamos en el medio, utilizamos conocimiento lingüístico y codificamos ese conocimiento y comprobamos si es válido. Normalmente las teorías se aplican a un grupo de palabras, así que las detectamos y nos centramos en las palabras que quedan y repetimos el proceso.

¿Cuáles son las dificultades más frecuentes con las que os encontráis al trabajar con el lenguaje natural en entornos digitales?

Para nosotros lo más sencillo es la combinación de la tecnología y el lenguaje. Nos encanta el trabajo intelectual y la investigación, así que eso es lo que más nos divierte. Lo complicado para nosotros es pensar en productos y en la comercialización, pero estamos aprendiendo rápido. Nos gusta pensar que estamos creando herramientas que van a servir a los hablantes de español y a las empresas o programadores que quieran crear programas que mejoren los recursos disponibles para nuestra lengua.

También nos resulta frustrante la falta de interés de las entidades públicas que apoyan el español y que no nos perciben como un apoyo, sino que nos ignoran y no buscan la colaboración. A veces uno se sorprende cuando, en conferencias y congresos, se plantea la necesidad de que existan herramientas como las que nosotros ya hemos desarrollado e incluso que ellos conocen. Parece como si fuera más sencillo mantener el discurso de la falta de herramientas que ayudar a que se desarrollen.

¿Crees que está cerca que podamos comunicarnos con las máquinas utilizando el lenguaje natural? ¿De qué forma podrían ayudar a ello las herramientas que está desarrollando Molino de Ideas?

Creo que lo importante es la comunicación entre las personas. Las máquinas nos pueden servir de medio de comunicación entre nosotros que es lo importante. Estamos cerca de conseguir que las máquinas nos ayuden a comunicarnos mejor entre nosotros pero muy lejos de que las máquinas nos entiendan.

Un libro no entiende lo que está escrito en él, pero sin embargo pone en contacto al escritor con el lector. Los ordenadores pueden ayudarnos en esta misma dirección, sin entender nada pero sirviendo para transmitir la información de una persona o grupo de personas a otras.

¿Y en qué sentido nos podrían ayudar las máquinas?

Básicamente en dos áreas, por una parte en agrupar la información de diversas fuentes, es decir, seleccionando la información de muchos textos, para crear una información agrupada, lo que solemos hacer cuando hacemos un trabajo. Por otra parte, y una vez que la información está almacenada, nos pueden permitir responder a las diferentes necesidades de información de diferentes personas. Por ejemplo, la Wikipedia es una fuente muy importante de información, pero sólo permite un artículo por tema, es decir, que ofrecemos la misma respuesta a un niño de 8 años que a un experto en el tema, lo que resulta muy ineficiente. Sería más interesante que el artículo se adaptase al nivel y a las necesidades de información de cada usuario. Y eso está bastante cercano.

Vuestro primer producto, el conjugador de verbos, Onoma, es verdaderamente sensacional. ¿Cuál fue el mayor reto al que os enfrentasteis para llevarlo a cabo y qué nuevos proyectos pensáis implementarlo?

¡Gracias! Para nosotros es un proyecto magnífico que tiene mucha utilidad especialmente para los alumnos de español como lengua extranjera. El problema es que no hemos sabido transmitirlo y muy pocos lo ven. Gracias al proyecto aprendimos que lo importante no es la tecnología que lleva algo dentro sino los problemas que resuelve al usuario.

A mí particularmente me molestaba ver que se manejaban, bueno se manejan, más de 100 modelos de conjugación de verbos en español. Pensaba que debía haber una estructura más simple. Por otra parte los libros de filología informan de que algunos verbos, en algunas ocasiones, hacen ciertos cambios y nosotros necesitábamos saber qué verbos, en qué ocasiones hacían qué cambios. Y buscando, buscando, encontramos que todo era efectivamente muy simple, y que en la mayoría de los cambios había razones morfológicas, ortográficas o fonéticas fácilmente entendibles. Así, las irregularidades de un verbo como leer o cualquiera terminado en “eer” se reducen a poner una tilde en una “i” tónica para romper el diptongo cuando la desinencia empieza por una “i” tónica [leíamos] o permutar una “i” latina en “y” griega cuando la desistencia empieza por una “i” átona ya que se encuentra entre dos vocales abiertas.[leyera]

Deberíamos crear un método de enseñanza de la conjugación en español basado en el sistema, pero no encontramos el momento de hacerlo. En realidad está prácticamente hecho pero nos cuesta cerrarlo y empaquetarlo.

¿Qué es y cuál es el propósito de Gominolabs?

Los Gomino como los llamamos internamente, surgen después de los molinolabs, en un intento de sacar al exterior una serie de funciones lingüísticas que teníamos hechas y que podíamos usar dentro del molino y que quisimos poner a disposición de todos.

Como te comentaba, nosotros venimos del campo de la investigación y nos costaba sacar el material para que lo usasen otros. Seguramente muchos profes nos entenderán, porque es como cuando pasas de tener un material para uso interno de tu clase y lo quieres convertir en material para otros. Te entra como un reparo y un miedo a que no sea todo lo completo que debería ser, y eso nos bloqueaba, así que nos sirvió para romper esa barrera y empezar a sacar cosas.

Son una herramienta para que los profesores puedan recomendar ejercicios a sus alumnos y que éstos refuercen algunos conocimientos.

Por el momento no están demasiado adaptados a los niveles escolares así que estamos trabajando en ello, en poner las preguntas de cada herramienta que correspondan a un curso concreto. Nos queda un poco para conseguirlo pero lo tenemos casi a la vista.

Nos gustaría que sirviesen de inspiración y ejemplo para que otros vean las cosas que se pueden hacer con las funciones que hemos desarrollado. Todas esas funciones estarán en Apicultur, nuestra plataforma de servicios y cualquiera las podrá usar para sus propias herramientas, ya sea una web, un programa una app móvil o lo que sea. Nos encanta poner a disposición de todos las herramientas.

¿Cuál es el proceso que seguís para crear cada nueva aplicación de Labs?

Todo suele resultar muy orgánico, es decir no hay un plan a largo plazo de las cosas que deberíamos hacer, sino que en función de las cosas que vamos haciendo vemos que sería útil añadir algo nuevo y lo añadimos. Suele tener que ver con las necesidades y con los recursos de que disponemos. Es algo así como, “ya que tenemos esto, ¿por qué no lo aplicamos a aquello?” Nos encantaría tener propuestas de la comunidad, que nos pidieran herramientas para hacer esto o lo otro, pero como usuarios no están acostumbrados a que les escuche y por tanto a los usuarios les cuesta dedicar unos minutos a contarnos qué les gustaría tener.

Habéis comenzado a publicar aplicaciones para dispositivos móviles ¿cómo han sido recibidas?¿Creéis que es el camino para llegar al gran público?

Acabamos de empezar a publicarlas en serio con Palabrear y el DrCuaicap. La respuesta está siendo muy buena, pero todavía vamos despacio y aprendiendo. Esperamos ofrecer algo más de lo que ya existe, agrupando los juegos de modo que ayudemos a los usuarios a mantener el cerebro en marcha y a mejorar sus capacidades lingüísticas. A todo el mundo le interesa su lengua y mejorar sus capacidades, si además se divierte, lo tenemos todo.

¿Cómo ha sido la respuesta del mundo educativo, empresarial e institucional a las propuestas del Molino de Ideas?

Diversa, y, en general, según mi impresión, lenta. Somos un país muy lento en estas cosas. Nos cuesta mucho colaborar, establecer una relación comercial o ponernos en contacto para crear algo conjunto. En este sentido, la salida al exterior ha sido como una corriente de aire fresco.

Fuera, alguien que trabaja en tu área es un competidor y un colega a la vez. Aquí sólo vemos la faceta de competición. Analizando el tema por partes, el mundo educativo ha empezado a usar las herramientas rápidamente y poco a poco las va utilizando con una cierta rutina. En particular el sector editorial está interesado en adaptar algunos de los recursos a sus plataformas de libros digitales y estamos trabajando estrechamente con alguna editorial inicialmente con cosas que ya hay y más adelante con recursos desarrollados específicamente para sus necesidades, en particular en el campo de la sintaxis.

El sector institucional no sabe qué hacer con nosotros. Hemos ofrecido colaboración a diversos estamentos pero no responden de ningún modo. No entienden que colaborando podemos llegar a más lejos y sobre todo que podemos hacer de un modo muy sencillo que el español sea la lengua con más recursos gratuitos o de bajo precio en la red, permitiendo a muchos desarrolladores realizar herramientas adaptadas a diferentes perfiles y a muchos hablantes o aprendientes a trabajar sus habilidades. Somos un país que necesita megaproyectos de muchos millones para demostrar que le interesa algo. Las soluciones sencillas y baratas interesan menos.

Sin embargo hay entidades como la Fundeu con la que estamos empezando a colaborar y que sí han entendido la complementariedad de nuestros enfoques.

¿Cuáles son las próximas metas y proyectos del Molino de Ideas?

¡Demasiadas! Tenemos demasiada tendencia a la dispersión y a meternos en mil aventuras, que creo que vamos controlando. Estamos organizando todos nuestros recursos como APIs [funciones que pueden incorporarse a cualquier aplicación o página web] en Apicultur. El objetivo es que cualquiera que necesite una función lingüística del español la obtenga de ahí. Ya sea la definición de una palabra, sus sinónimos, su lema, su transcripción, etc… La plataforma esta abierta a que otros proveedores pongan allí sus funciones también. En ese sentido y para difundir el uso de la tecnología de las APIs hemos organizado los APIdays Mediterranea en Madrid a finales del próximo mes de mayo.

Por otra parte y más centrados en el área de lengua estamos organizando con un par de monstruos del tema también unas jornadas sobre lengua para septiembre. Pronto podremos dar más detalles.

Estamos recuperando algunos textos y diccionarios legendarios del español, como el diccionario etimológico de Monlau de 1850. Lo vamos a convertir en una API, de modo que cualquiera pueda incorporar a su web el contenido de este diccionario etimológico. Hay más textos de este tipo que nos encantaría recuperar.

También seguimos trabajando en herramientas morfológicas y sintácticas, y trabajando en proyectos de adaptación de estos recursos para clientes concretos.

Por último no olvidamos nuestro objetivo inicial de realizar un buscador que mejore los sistemas de búsqueda actuales, tenemos la tecnología y el conocimiento, sólo nos falta el impulso.

Espero que os haya sido interesante esta entrevista. Si queréis conocer un poco más los proyectos en los que está trabajando Molino de Ideas, podéis visitar su web: Molino de Ideas.

Coméntalo en: Twitter Facebook Google +