domingo, 15 de febrero de 2015

Sexo, mentiras y big data

Parece mentira lo poco sinceros que somos en asuntos de sexo. Ya nos lo advertía Soderbergh en su película de 1989 "Sexo, mentiras y cintas de vídeo". Y esa es la misma conclusión a la que ha llegado Seth Stephens-Dawidowitz en su trabajo realizado buceando en las búsquedas de Google y publicando originalmente en The New York Times ("Searching for sex").

Bueno, no es que se sea mentiroso, o poco sincero, en las búsquedas de Google. Todo lo contrario: según Dawidowitz es en la respuesta a las encuestas (como la "General Social Survey", la Encuesta Social General de Estados Unidos) donde no se contesta, según parece, de manera más sincera.

Dawidowitz compara los resultados en las preguntas sobre frecuencia de práctica sexual y otras cuestiones relacionadas con el sexo de la citada encuesta con lo que ha encontrado él analizando los datos disponibles en las búsquedas de Google sobre estos mismos asuntos. Y parece que no concuerdan.

Por ejemplo, cita que si se extrapolan los resultados que ofrece la encuesta sobre frecuencia sexual y uso de preservativo con los datos de venta de preservativos en EE.UU. hay una amplia diferencia: según lo que contestan los varones heterosexuales (63 actos sexuales/año y utilización del preservativo en el 23% de ellos) deberían haberse vendido 1600 millones de preservativos al año en EE.UU. (salvo que se reutilicen...). Y eso sin contar otros usos del preservativo. Pero, según Nielsen se venden menos de 600 millones al año.

Lo que muestran las búsquedas de Google es que hay menos frecuencia de sexo: la primera queja acerca de la vida matrimonial es que no hay sexo. Las parejas no casadas también se lamentan con cierta frecuencia de ausencia de sexo. Dawidowitz concluye que los datos le indican que los estadounidenses mantienen relaciones sexuales unas 30 veces al año.

Tampoco es que Dawidowitz sea el primero en realizar análisis de comportamiento sexual aprovechando "big data": puede encontrarse una cita interesante en una entrada de título casi idéntico a ésta (lamentamos el plagio, pero es difícil encontrar un título mejor) en la que se efectúa una recensión del libro titulado "Dataclysm. Who we are when we think no one's looking".

Entonces ¿es mejor acudir al análisis de "big data" que a las encuestas? Podemos afirmar, sin riesgo de equivocarnos, que es difícil que las encuestas reflejen exactamente la realidad sin carecer de errores sistemáticos. Pero ¿carece de este tipo de error el análisis de "big data"? No creemos que pueda ser pronunciada una afirmación taxativa en este sentido y, pese a que no pueden encontrarse muchas referencias, se ha citado ("Big data and clinicians: a review on the state of the science") que una de las limitaciones de los estudios de "big data" es, precisamente, la existencia de sesgo de selección.

Una línea de investigación pendiente, por lo tanto, es la de validación de encuestas contrastándolas con análisis de "big data" y poder establecer la validez de ambos métodos.

La buena noticia es que el autor del análisis concluye que estos datos le han permitido sentirse mejor y menos solo. Siempre es un consuelo...




No hay comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...