Consejero Delegado de Verbio

Antoni Terradas

“La tecnología evoluciona. Pero también el entorno”

Miércoles, 16 de Octubre de 2013
Estamos en la gran era de la comunicación y nuestro protagonista de hoy se dedica a ello a través de Verbio, una empresa que mediante las tecnologías del habla, cubre todos los aspectos de la comunicación entre personas y máquinas. En 20 años de experiencia, ha conseguido dar con al respuesta a todas las necesidades de interacción a través de los portales de voz, la biometría de la voz, la transcripción y la inteligencia de voz. Entre sus novedades, el haber conseguido que Codorníu consiga la recepción de pedidos las 24 horas, 7 días a la semana, mediante un portal de voz automático. Recientemente ha anunciado el proceso de compra de otras firmas para impulsar su plan de expansión comercial. 
“El proceso de evolución de la tecnología de la voz es continuo, porque el lenguaje evoluciona, tenemos que reconocer cada día palabras nuevas, las maneras de hablar cambian y los acentos de las personas también”
 
“Ahora a las tecnologías del habla se le empieza a dar mayor importancia que hace unos años. Antes se pensaba que esto era algo fácil, que bastaba con instalar un reconocedor y ya estaba. Pero no, no funciona así”
¿Cuándo empieza vuestra aventura con ‘Verbio’?
Verbio nace hace unos catorce años, en el 99, en la UPC, en un laboratorio que se llamaba ‘Talp’ (“Tecnologies aplicades a la parla”). Diez años después la compramos Carles Puigjaner y yo. Era una empresa con un producto excelente, que no tenía cosas malas escondidas en el cajón, y que disponía de un gran potencial. 
 
De ahí vuestro crecimiento espectacular
De 2009 al 2012 hemos multiplicado por 4 nuestra facturación y en este cuarto año habremos multiplicado por 5 desde que la compramos. Hemos abierto oficinas en Brasil y estamos ya en las grandes cuentas. Así que compramos una pequeña empresa y la reconvertimos. 
 
Y da la impresión que “Verbio” es un proyecto que tiene aún mucho margen de crecimiento
Nosotros también lo creemos, porque las tecnologías del habla cada vez tendrán un mayor índice de penetración. De hecho, la pregunta es simple: ¿Por qué transcribir una conversación si la podemos grabar y después te lo puede hacer una máquina? ¿Por qué tengo que ir yo al banco y explicar veinte veces que soy Antoni Terradas si mi voz puede ser mi password? ¿Por qué hacer una queja a una ‘utility’ si la propia ‘utility’ ya sabrá si la gente, o el atendedor u operador me ha tratado bien o no? 
 
O sea que esto irá a más 
Bueno, forma parte un poco de la propia naturaleza del mundo tecnológico, ¿no? En nuestro caso, el proceso de evolución es continuo, porque el lenguaje evoluciona, tenemos que reconocer cada día palabras nuevas, las maneras de hablar cambian y los acentos de las personas también. Después hay que tener en cuenta de que en los modelos acústicos no únicamente influye el lenguaje sino también por dónde viaja la voz, ya que no es lo mismo el analógico que el digital, por ejemplo.
 
Resulta asombroso
En un par de años podremos detectar si el que está hablando está mintiendo. Entonces si tú vendes alguna cosa por ejemplo y te dicen que te compran, cuando nosotros luego pasemos nuestra tecnología sabremos si ha dicho que compra para sacárselo de encima, porque te quiere engañar o porque es verdad. Es lo de siempre: evoluciona la propia tecnología, pero también su entorno. 
 
¿Creéis que esta expansión podrá llegar mucho más allá, a nivel particular?
No, yo difícilmente veo que Verbio pueda llegar al consumo directo de las personas. Apple sí que lo hará, como también Google, pero al final las especificidades de las personas son diferentes que las de las empresas. Por ejemplo, ¿por qué Google, que tiene muy buen buscador no entra en las grandes corporaciones y les monta el buscador para sus redes internas? Porque no es el mismo público, las necesidades son distintas y las infraestructuras también. 
 
Pero vaya, supongo que llegar a un grado de perfección es la clave de este negocio.
Correcto, y de hecho, hemos hecho un gran proyecto en TV3, porque han apostado con nosotros y esto ha significado un antes y un después. Debemos tener en cuenta que la hoy por hoy la transcripción no es 100% fiable, así que ¿qué es lo que hace la Corporación Catalana al respecto? Pues tienen los re-speakers que, con un buen micrófono, una sala insonorizada y una buena dicción pueden hacer que todo se capte perfectamente. 
 
Pero esto ha crecido espectacularmente en los últimos años, ¿no?
Si, es cierto, ahora a las tecnologías del habla se le empieza a dar importancia. Antes se pensaba que esto era algo fácil, que bastaba con instalar un reconocedor y ya estaba. Pero no, no funciona así. Y del mismo modo que no son iguales las condiciones en las que se graba algo, tampoco el habla de alguien de Barcelona es el mismo que uno de Girona o Tarragona. 
 
Los acentos tienen sus particularidades…
Pues lo que hemos hecho ha sido recoger todos los acentos de todos los lugares de Catalunya, estableciendo sus diferencias y particularidades. Hasta el punto que el ‘no lo entiendo’ de antes se ha reducido a un 10%, cuando antes era de 50%. 
 
En vuestro equipo, pues debe haber ingenieros pero también lingüistas
Sí, trabajamos con unas treinta personas, el 80% de las cuales son ingenieros de telecomunicaciones, doctores y lingüistas, y el resto es equipo comercial. Para nosotros es un buen equilibrio, porque si tu haces un buen trabajo no tienes porqué tener reclamaciones. 
 
¿Tenéis fácil la internalización del producto?
No, no, creemos que en nuestro caso es difícil. Las culturas, y no sólo las lingüísticas son muy diferentes: en Brasil, por ejemplo, tienen un sistema impositivo difícil de entender y nadie ayuda a exportar. Así que cuando dicen que “el gobierno trata de incrementar las exportaciones”, pues a mi me daría ganas de decir que no es cierto, más bien al contrario. Mi producto se encarece, y nadie me ayuda a solucionar problemas cuando trato de vender en Argentina o en otros países sudamericanos porque no hay buenos acuerdos comerciales. 
 
Creía que la dificultad en vender en otros países radicaría en las particularidades de cada voz y no en los aranceles y leyes de exportación
Cualquier biometría es unívoca para las personas. Y en la de la voz hay una ventaja, y es que nuestro sistema puede detectar el nerviosismo. Por ejemplo, si estás en un cajero y dices: “Me llamo Eduardo Berraondo”, el cajero detectará que pasa algo porque no has dicho Eduard. No tiene nada que ver el acento, el tono de voz, ni la prosodia… tiene que ver con cómo fuerzas las cuerdas vocales y la fuerza que haces en el trato bucal para comunicarte. 
 
No sé si la crisis habrás sido especialmente dura
Si no pasa nada extraordinario, este año facturaremos dos millones de euros. Y naturalmente, no repartimos ningún euro de dividendo, porque Verbio es reinversión e I+D, y por tanto reinvertimos continuamente porque sino además nuestra tecnología se quedaría obsoleta. 
 
Habrá algún proyecto futuro…
Ahora nos queremos meter en el mundo de la ‘Ibr’, en el que además tenemos apoyo de un gran banco de España. Un ‘Ibr’ es un sistema respuesta automática de voz, en el que los pedidos de una determinada empresa se hacen de forma automática a un software.  Hemos realizado pruebas piloto con un gran banco y ahora tratamos de consolidarnos en el mundo de las tecnologías, pero ya no únicamente del habla. 
 
Vuestra expansión ha sido imparable 
Hemos iniciado un proceso de compra de otras firmas del sector para impulsar un plan de expansión comercial. Tenemos oficinas propias en España pero también en Brasil, Colombia, Paraguay, Perú y Chile, y sumamos un mercado de más de 500 millones de personas.