La Conjetura Recuenco – Wilkins (En construcción)

25 05 2013

No por conocido el patrón deja de funcionar. Enter Gonzalo Martín:

Imagen

El artículo que me manda el Maese insidias es esta atrocidad.

Procederé ahora a desglosar en detalle el artículo en cuestión. Pero baste decir que me ha puesto en modo

Conocido también en España como “Hasta aquí llego el agua en la inundación del 58”

El artículo comienza bien, inocentemente, con una diatriba que parece más de nuestro blog hermano Publicidad Singular:

IN AMERICA alone, people spent $170 billion on “direct marketing”—junk mail of both the physical and electronic varieties—last year. Yet of those who received unsolicited adverts through the post, only 3% bought anything as a result. If the bumf arrived electronically, the take-up rate was 0.1%. And for online adverts the “conversion” into sales was a minuscule 0.01%. That means about $165 billion was spent not on drumming up business, but on annoying people, creating landfill and cluttering spam filters.

Los dos párrafos siguientes son ya directamente de abrazar la causa de la Publicidad Singular y que viva y bravo. Además, son científicos de IBM. Chicos serios. Snif. (Lágrimas de emoción rodando por las mejillas)

Which might, in the modern, privacy-free world of sliced and diced web-browsing analysis, come as something of a surprise. Marketing departments gather terabytes of data on potential customers, spend fortunes on software to analyse their spending habits and painstakingly “segment” the data to calibrate their campaigns to appeal to specific groups. And still they get it almost completely wrong.

A group of researchers at IBM’s Almaden Research Centre in San Jose, California, however, is here to help. According to Eben Haber, the group’s leader, the problem is that firms are trying to understand their customers by studying their “demographics” (age, sex, marital status, dwelling place, income and so on) and their existing buying habits. That approach, he believes, is flawed. What they really need is a way to discover the “deep psychological profiles” of their customers, including their personalities, values and needs. And he and his team think they can provide it.

Pero de pronto, con en el minuto setenta de una película de Medem, pasa algo horrible.

Modern psychology recognises five dimensions of personality: extroversion, agreeableness, conscientiousness, neuroticism and openness to experience. Previous research has shown that people’s scores on these traits can, indeed, predict what they purchase. Extroverts are more likely to respond to an advert for a mobile phone that promises excitement than one that promises convenience or security. They also prefer Coca-Cola to Pepsi and Maybelline cosmetics to Max Factor. Agreeable people, though, tend to prefer Pepsi, and those open to experience prefer Max Factor.

People are, of course, unlikely to want to take personality tests so that marketing departments around the world can intrude even more on their lives than happens already. But Dr Haber thinks he can get around that—at least for users of Twitter. He and his team have developed software that takes streams of “tweets” from this social medium and searches them for words that indicate a tweeter’s personality, values and needs.

The personality-profiling part of the software is based on a study published in 2010 by Tal Yarkoni of the University of Colorado, Boulder. Dr Yarkoni recruited a group of bloggers and correlated the frequencies of certain words and categories of word that they used in their blogs with their personality traits, as established by questionnaire.

Some of the relations he found were commonsensical. Extroversion correlated with “bar”, “restaurant” and “crowd”. Neuroticism correlated with “awful”, “lazy” and “depressing”. But there were also unforeseen patterns. Trust (an important component of agreeableness), for example, correlated with “summer”, and co-operativeness (another element of agreeableness) with “unusual”.

Inspired by Dr Yarkoni’s findings, Dr Haber and his team are conducting research of their own, matching word use with two sets of traits not directly related to personality. These are people’s values (things they deem to be good, beneficial and important, such as loyalty, accuracy and self-enhancement) and their needs (things they feel they cannot live without, such as excitement, control or acceptance).

In a test of the new system, Dr Haber analysed three months’ worth of data from 90m users of Twitter. His software was able to parse someone’s presumptive personality reasonably well from just 50 tweets, and very well indeed from 200.

At the moment the system is being tested by a financial-services company. If all goes well, Dr Haber hopes to launch it commercially by the end of the year. He says the new software has the potential to serve people as individuals rather than “vague demographic blurs”. Whether they will actually wish to be “served” in this way, when the price of such service is having strangers build up intimate psychological profiles of them, remains to be seen.

Es que no sé por donde empezar. Voy a dejar el tema de los modelados psicológicos en base a análisis sintáctico de primero de buscador a gente más curtida que yo en esto (@senseiconsultor, estoy hablando de ti) pero vamos, que básicamente, estos amigos, usando a medias bálsamo de fierabrás y pixie dust, a partir de 200 tweets de cualquier mortal son capaces de modelar realidades tan complejas como las que yo plasmo aquí y aquí . Con dos cojones.

Sobre una serie de datos limitados, las conjeturas que podemos hacer son limitadas. Sobre una recta de regresión, puedo hacer una ecuación que se aproxime. En cuanto el tema se complica, tocan Polinomios de Taylor o mecanismos de interpolación complicados, como el Teorema de Lagrange que usé yo sobre las tablas de Erlang B en mi proyecto de fin de carrera. A menos regularidad y simplicidad en el modelo, necesitamos más puntos de información. Esto es así y no lo he inventado yo.

¿Y tú me dices que con doscientos tweets de alguien tu puedes construir un modelo psicológico profundo capitalizable publicitariamente?

Show me the model, fucker.

Quiero dos cosas con este post:

A) Formular, de manera intuitiva y no formal, una serie de premisas que yo considero innegociables en términos de como funciona la creación de modelos personotécnicos, sean para usos publicitarios o cualesquiera otros

Cuerpo de la premisa: No se puede generar un espacio vectorial personotécnico complejo partiendo de una serie de vectores simples independientes de orden inferior al del espacio vectorial que se quiere representar o linealmente dependientes. No puedo hacer con un seis y un cuatro el retrato del Conde Duque de Olivares. No puedo hacer con una cuerda y un clip un motor de fusión fría, diga lo que diga McGyver.

Alehop

Corolario 1: No hay atajos en la construcción de modelos que pretendan representar una realidad compleja

Corolario 2: (Extraído del artículo sobre vectores personotécnicos donde se mencionaba de manera no rigurosa aplicado al campo de las imágenes) No interpreten un perfil en su totalidad por lo que ven del mismo desde un único o pocos vectores personotécnicos disponibles , y mucho menos saquen conclusiones. En el mejor de los casos, serán triviales, en el peor, les llevarán a terribles errores.

Corolario 3: Sin involucración del usuario es virtualmente imposible acceder a determinados vectores personotécnicos

B) Generar una conjetura matemática formal que soporte las formulaciones anteriores.

Y para esto, voy  a recurrir al Crowbuilding.

Tengo la intuición, y no tengo las herramientas ni el conocimiento especializado, de que lo que estoy mencionando es formulable de manera matemática e inapelable.

Y lo que quiero es usar esa conjetura para desactivar, en la medida de lo posible, estas patrañas a las que somos tan aficionados. Aquí el problema es si cabe más grave, ya que al igual que cuando se invoca a la ciencia para justificar la homeopatía, es un crimen que se tire de la ciencia y de los data scientist para justificar caralladas que soporten el argumentario que ya sabemos que se compra fácil y que es una mentira gigantesca: Todo YA ESTA EN SUS DATOS, no tiene que currar más. Todo está en su Facebook, en su base de datos de compras, en su base de datos de transacciones de tarjeta, en su página Facebook. Un poco de Data Mining, unos clusters con kétchup, y ya tiene todo hecho. Estamos hasta el jeribeque de desactivar esto, pero es como el malo de una peli de Viernes 13, que siempre vuelve.

Y la conjetura, as of now, se va a llamar de Recuenco- Wilkins. ¿Quién es Wilkins? Este señor: Dominique Wilkins, uno de mis jugadores preferidos de la NBA de los ’80.

Básicamente lo que vengo a decir es que el nombre de la conjetura está “up for grabs” El que me ayude a formalizarla tendrá crédito. Si se llama Garcigómez será la conjetura de Recuenco-Garcigómez. Si son tres personas y la tercera se llama Pichardo, será la conjetura de Recuenco-Garcigómez-Pichardo. Y así sucesivamente. He lanzado la batiseñal a todos mis amigos matemáticos o con experiencia en formulaciones formales, o aficionados a la matemática, ingenieros, o que sientan que tienen algo que aportar al respecto.

De aquí salimos con algo que podamos referenciar de tal modo que todas estas discusiones se terminen con un “Según la conjetura de Recuenco-Wilkins, esto sería una soberana gilipollez” Si somos capaces de formularla y probarla, con lo que dejaría de ser conjetura para pasar a ser teorema, mejor que mejor. Si ya existe el teorema (En álgebra vectorial, en teorías de conjunto, en Topología, en teorías de orden matemático…) y se llama, yo que sé, teorema de Pushkin-Gogol, cojonudo, usamos la referencia original y todavía nos queda un par de corolarios que añadirle. “Según el teorema de Pushkin-Gogol y el tercer corolario Recuenco-Wilkins, esto es wishful thinking at best”

La idea está clara, ¿no? Anímense. Los territorios indómitos necesitan de trailblazers.

Help is welcome and credited.

Anuncios

Acciones

Information

7 responses

25 05 2013
Gonzalo Martín

OMG. Esto es lo más divertido que te he leído nunca. Recuerde usted que Woody Allen decía que comedia era tragedia más tiempo.

25 05 2013
javiergrecuenco

Es o tomártelo de coña o subirte a un tejado con un rifle.

26 05 2013
litox

No estoy de acuerdo con esto: “No se puede generar un espacio vectorial personotécnico complejo partiendo de una serie de vectores simples independientes de orden inferior al del espacio vectorial que se quiere representar “. Matemáticamente un espacio vectorial se forma a partir de varios vectores simples independientes, otra cosa es si con sólo esos vectores consigues el espacio vectorial que tu quieres o solo un a parte del modelo que no te sirve para nada. Lo que sí es cierto es que si los vectores no son independientes no tienes un espacio vectorial, como mucho tienes una recta, un plano o un hiperplano (en el caso lineal), este puede ser el caso de partir de los datos de twitter, que todos dependen de eso mismo, de tu relación con twitter.
Por lo tanto, comparto la conclusión.
Saludos

28 05 2013
javiergrecuenco

Estoy de hecho replanteando todo con ayuda de un par de amigos matemáticos. Lamento mucho las potenciales incorrecciones que pueden existir en la fase actual. Gracias por el insight, lo incluiré y daré crédito del mismo en la reformulación.

31 05 2013
Cajón semanal de enlaces nº8 | Periferia Digital

[…] – La Conjetura Recuenco – Wilkins (En construcción) | Javier Recuenco […]

20 03 2014
El Jueves, Personotecnia, Publicidad Singular | Publicidad Singular

[…] que facebook no tiene CASI NADA, al igual que Google. Todo está desarrollado en detalle en la conjetura Recuenco-Wilkins. Google y FB tienen mucho más que los demás, que es NADA. El propio Gandaria hace esta […]

29 01 2015
Cajón semanal de enlaces nº8 - Marc Martí | Observaciones, reflexiones y dudas sobre la digitalización. Sobre todo dudas

[…] – La Conjetura Recuenco – Wilkins (En construcción) | Javier Recuenco […]

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s




A %d blogueros les gusta esto: