miércoles, 24 de julio de 2019

Google admite que transcribe algunas conversaciones con su asistente virtual

Hace ya unos días, saltó una noticia de que Google transcribía conversaciones con su asistente virtual. La noticia fue bastante comentada, aunque lo de siempre, no se tomó ninguna acción de forma internacional ni repercutió mucho más. Es Google, son intocables.


La noticia saltó y Google admitió que tienen expertos transcribiendo algunas conversaciones que los usuarios mantienen con su Asistente Virtual. Todo esto lo manifestaron en un comunicado, donde además decían que sólo trascribían el 0,2% de las conversaciones.

Esto lo podemos analizar desde 2 puntos de vista. Uno desde el punto de vista que es cierto y otro es desde el punto de vista en el que es falso. No nos engaños, en ambos casos es un problema.

Si lo consideramos como cierto, realmente que sea un porcentaje mínimo no implica que no se hayan saltado Derechos Humanos.


El Artículo 12 de los DDHH dice que no podemos ser objeto de injerencias en nuestra vida privada. Los DDHH son claros, aunque si aún hay alguien que no sepa lo que significa injerencia.



Es decir, que nadie se puede entremeter en nuestra vida privada y Google, de base, ya lo hace 24X7X365. De primeras,  el asistente de Google está escuchando constantemente a la espera de que digas "Ok, Google", sino le sería imposible poder escuchar si quiera ese "Ok,Google".

Ahora vamos a considerar que es mentira y que no transcriben el 0,2% de las conversaciones, sino gran parte de ellas, o al menos las más interesantes.

Y esto no es difícil para Google, recordemos que para Google puede ser realmente sencillo saber nuestros hábitos diarios. Por ejemplo, no tiene por qué grabar nuestras conversaciones las 24 horas, si sabe que por ejemplo de lunes a jueves te acuestas a las 23:00 porque trabajas por la mañana y tienes que madrugar, sólo tendrá que grabar, por ejemplo, de 6:00 a 23:00 (17 horas). Pueden ser muchas horas, pero se puede seguir optimizando.

Si entras a las 7:00 y sales a las 15:00 de trabajar, bueno, esas son 8 horas menos que pueden interesarle. Ya tenemos que podrían estar grabando 9 horas de nuestra vida, el 37.5% de nuestro día. No puede parecer mucho, pero son 9 horas en las que estamos en casa, con nuestra pareja, amigos, familia, en la calle, paseando, en un bar, en un evento, en una manifestación; son las 9 horas que dedicamos a nuestra vida social, que es lo que le termina importando a Google. Pero lo pueden perfeccionar aún más.

Por nuestra ubicación GPS saben dónde estamos en cada momento,  por nuestra velocidad (que se obtiene también gracias a operaciones matemáticas con los datos del GPS) saben si vamos andando, en coche, moto, bici, skate o patinete. Esto es importante porque esta información la tienen de cada persona.

Es decir, no es difícil que saquen la conclusión (de hecho esto una IA podría hacerlo) de que si 2 personas llevan,por ejemplo, 1 año en la misma ubicación en horas que no son de trabajo y para ambos, esa ubicación es considerada como "Casa"; entonces están conviviendo juntos. Sigamos relacionando datos que tiene Google con solamente sus propios servicios.

Que personas convivan en la misma casa puede ser por diversos motivos:

-Pareja
   -Hijos
-Padres
-Compañeros y compañeras de piso

Independientemente del caso, Google puede saber en qué fracciones de tiempo hay, al menos 2 personas en casa. Porque ¿Para qué van a escucharte si estás 1 ó 2 horas al día sólo? Esto por supuesto cambia en función de la persona. Por ejemplo, es posible que si 2 personas viven en pareja y trabajan pero en horas distintas, puede que uno llegue a las 15:00 pero la otra persona llegue a las 14:00, eso sería una hora menos que se quite. Establezcamos una media de que nos tiremos 1 horas al día solos o solas en casa, lo que reduce la grabación a 8 horas solamente por persona.

Pero no sólo eso, Google también podría saber cuándo hay largos periodos de silencio en las grabaciones. Esto lo sabe cualquier persona que haya grabado un poco. Si pasas una grabación a un editor de audio y ves que no hay ondas con ninguna altura, eso es que hay silencio, por lo que Google, conforme graba, podría saber si hay silencios largos. Si nos paramos a pensar, pueden existir muchos momentos de largos periodos de silencio (o con algún ruido como la televisión aunque si está con el volumen suficiente como para que el asistente la pueda escuchar, ahí sí resultaría interesante). Es decir, perfectamente Google podría limitarse a grabar, tan sólo, entre 6-7 horas de nuestro día, que es aproximadamente entre el 25 y el 29,16% de nuestro día. Esto ya no es tanto.

No obstante, aún así hay gente que dice que a Google no le sale rentable a nivel de almacenamiento grabar tantas horas de nuestra vida. Dicen esto porque consideran muy acertadamente que no es viable almacenar tantas horas de audio. Y llevan razón, almacenar si quiera tantas horas de audio es inviable...o no.

Os voy a hablar de empresa nueva, una web nueva que acaba de salir, se llama Youtube y consiste en subir vídeos a esta plataforma. Según sus estadísticas, cada minuto se suben 300 horas de vídeo ¿Conocéis esta plataforma? Pues Google tiene la propiedad de dicha plataforma.

Además, estamos obviando algo fundamental ¿Quién ha dicho que Google almacene esos audios en formato Audio?




Como ya sabemos, Google no tiene ningún problema técnico para poder pasar de audio a texto en pocos segundos, por lo que tampoco debería costarle pasar un archivo de audio a texto, de hecho, ya hay webs que lo hacen.



Esta web, Happyscribe permite hacer eso precisamente hasta con una cuenta gratuita. Yo de referencia he utilizado este vídeo de La Resistencia, que eran de 11 minutos, un vídeo relativamente largo. Tengamos en cuenta que esto es un vídeo, no un archivo de audio solamente.


Esta plataforma, de una forma muy sencilla, nos permite pasar cualquier audio o vídeo a texto en pocos minutos.


Una vez que está listo, lo podremos descargar y, si lo comparamos con el vídeo, pesa bastante menos.


Y lo más importante, con una precisión bastante buena. Así que en una página cualquiera de Internet, vemos que esto es posible y en pocos minutos ¿Quién cree realmente que Google, con todo su potencial, es incapaz de hacer lo mismo?

Además podría programar esta tarea con un crontab y que lo haga por cada usuario, cada 9 horas o a una hora en concreto y así se desentenderían de tener a una persona transcribiendo, lo que nos lleva al origen de nuevo.

Cuando han admitido que sólo transcribían el 0,2% de las conversaciones ¿Se refereían a que sólo el 0,2% lo hacían a mano y el resto o no lo hacían o lo hacían de manera automatizada como ya hemos visto? Porque hay que recordar que Google ha admitido esto porque ya salieron rumores y filtraciones, no lo hicieron como un ejercicio de transparencia.

Es realmente difícil de creer que Google no sea capaz de hacer esto y que no lo esté haciendo ya teniendo las capacidades de cómputo y almacenamiento a su disposición.


Después ocurrió lo de siempre. La noticia salió el día 12 y casualmente bajó su cotización en bolsa...durante 1 hora, después ya subió y volvió a la normalidad. Este es otro problema del que creo que no nos damos cuenta. Y es que a pesar de vulnerar derechos humanos, hay un poder económico detrás que sigue manteniendo a Google ¿Cuándo lo vamos a derribar? Pregunto.

¿Hackeamos el Mundo?

No hay comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...

Entrada destacada

El server me sabe a poco.

Soy un fanático del Rock y de Debian . (Creo que voy a inventar Rockbian, que suena bien y todo xD) Llevaba tiempo queriendo unir estos 2 c...