Google Duplex: ¿Qué es? ¿Cómo funciona?

Desde hace décadas las máquinas nos llaman a nuestros números telefónicos, se distinguen claramente de un ser humano porque sus voces son bastante robóticas, claramente diferenciables de las de una persona normal.

Hasta ahora no había nada parecido a la voz humana para interactuar telefónicamente, sin embargo al parecer Google Duplex pretende cambiar esta tendencia.

Gracias a la inteligencia artificial han logrado automatizar conversaciones de voz y que éstas no parezcan realizadas por un robot, sino que sean idénticas a las de un humano.

google duplex

De eso se trata Google Duplex, de olvidarnos de los molestos llamados automatizados y con voz robótica que recibimos, pero no se detienen ahí, ellos también pretenden utilizar esta nueva tecnología para que tu asistente también llame a tus lugares favoritos, haga reservaciones, e interactúe con personas de un comercio o restaurant a donde deseas ir más tarde.

En la reciente conferencia Google I/O 2018 todo el mundo quedó de boca abierta con la demostración que hizo el actual CEO de Google: Sundar Pichai.

La voz robótica de Google que se hace pasar por humanos

Cuando estabamos mirando la conferencia en vivo a través del streaming, Pichai comenzó a presentar el caso de Google Assistant, y como con esta nueva tecnología de voz con inteligencia artificial, ahora ya es posible hacer una reserva como si fueramos nosotros mismos.

Veamos el video a continuación donde se ve claramente:

Como habrán visto, el momento en que un software se comunica con  la otra parte de forma tan natural, humana y sencilla, ha marcado un antes y después en la historia de la aplicación de la inteligencia artificial.

No hay ninguna duda de que la persona no sabía que era una máquina con la que se estaba comunicando, y ahí es donde creemos que la IA ha cruzado una línea, de la cual dudamos si alguna vez volvamos.

Las máquinas no es la primera vez que engañan a los humanos, pero esta si ha sido la primera vez que lo han hecho sin que éstos se dieran cuenta.

Y aquí es donde se abre el gran debate sobre los peligros de la inteligencia artificial, sobre la privacidad, la transparencia y los límites de la utilización de la tecnología.

Este robot como hemos visto, puede realizar tonos totalmente humanos, realizar pausas (hacer como que duda) aprender un lenguaje natural para luego desarrollarlo, y seguir aprendiendo sobre la marcha a medida que interactúa con los humanos.

¿Cómo funcion Google Duplex?

Según explica Google en su blog, está la inteligencia artificial metida hasta la médula de este software, que según palabras de su CEO, demoró años en desarrollarse.

Google Duplex funciona gracias a las llamadas redes neuronales recurrentes (RNN), las cuales fueron capacitadas durante largo tiempo con conversaciones telefónicas grabadas y miles de pruebas.

Para reconocer lo que habla la otra persona, hace uso de la tencología llamada Automatic Speech Recognition (ASR) desarrollada por Google, donde se analiza bien el contexto que encierra a cada una de las palabras, para evaluar las posibles respuestas que pueda dar.

Speech dysfluences es el nombre que reciben los “umm”,  “ahm”, “oh”, y otras pausas que realiza el robot de forma tan humana. Y la entonación se controla utilizando la tecnología Text to Speech, o TTS, además de trabajar con otras piezas de software para controlar los tonos y hacerlos naturalmente humanos.

La conversación que se realiza se evalúa si se concretó con éxito, o si tuvo algún fallo donde no se logró con éxito la tarea que tenía asignada (reservar mesa en un restaurant por ejemplo), en ese caso los agentes humanos entran en juego y suponemos que analizarán la conversación para ver donde falló el algoritmo de inteligencia artificial de Google.

Algo importante es que Google Duplex por ahora no puede entablar conversaciones con humanos en cualquier ámbito, solo ha sido programado para interactuar con sitios de resevas de servicios de momento.

¿Es ético engañar a los humanos sin avisarles que quien les llama es una máquina?

Inmediatamente de que se anunció esto al mundo, muchas personas comenzaron a preguntarse que tan ético era esta actividad, sin avisar previamente al humano que atiende el teléfono del otro lado que quien le llama es un software de inteligencia artificial, es decir, una máquina.

Si bien hoy está desarrollado solo para reservas de servicios, el día de mañana se aplicará seguramente a muchas otras cosas, y ahí es donde vamos a tener que tener más miedo que nunca, porque de no regularse y caer en malas manos, podría incluso imitar el tono de voz de una persona, hacerse pasar por ella, y realizar cualquier tipo de cosas sin que nos dieramos cuenta.

Lo que creemos que debe hacer Google en este caso, y el resto de las nuevas apps similares, es que primero debe avisarse al usuario que quien lo está llamando es una máquina.

Hay una delgada línea entre la innovación tecnológica, y la ética robótica en este caso, que al parecer ya se ha cruzado.

También entran en juego cuestions como la privacidad, donde se grabarían y analizarían cada una de estas conversaciones para luego mejorar la inteligencia artificial del robot, aunque primero en teoría debería tener nuestro consentimiento… cosa que casi seguro no harán, pues muchísima gente se negaría.

La historia de la tecnología nos ha enseñado que ésta puede enseñarnos muchas cosas, ayudarnos en beneficio de la humanidad, pero también que se puede aplicar de mala forma para causar daño a la población mundial, por eso deberíamos estar más alertas que nunca respecto al surgimiento de estos inventos tecnológicos.

¿Qué opinas tu sobre la nueva tecnología Google Duplex?


Artículos relacionados:

Deja un comentario