En Noviembre de 2004, Roldán & Roldán decidieron llevar a cabo un macro - experimento (sic) de percepción extrasensorial aprovechando un certamen en Barcelona. En él, evaluaron en 1356 personas su capacidad telepática de azar con cartas Zener. Para aquellos despistados, decir que una baraja Zener está formada por 25 cartas, divididas en 5 grupos o palos (círculos, cuadrados, estrellas, ondas y cruces), y no tienen nada que ver con los (más útiles) diodos. La prueba consiste en barajar las cartas, para sacarlas de una en una sin que las vea el supuesto telépata. Éste debe adivinar qué palo ha salido, según las percepciones que reciba. Un número significativo de aciertos, mostraría (hipotéticamente) que esa persona tiene ciertas capacidades extrasensoriales.
En sus conclusiones, destacan que para su sorpresa, el 45% de la gente, fue capaz de acertar más cartas que lo esperado por puro azar. Y que de ellos, un 12% fue capaz de acertar un número muy alto de naipes.
En Gluón con Leche hemos ido más allá, y hemos decidido simular el experimento, con la ayuda de un ordenador y un pequeño programa, que debido a los nulos conocimientos de flash, los lectores de esta bitácora pueden bajarse gratis en C++ para compilarlo ellos mismos, y experimentar por su cuenta: PES.cpp.
Como una muestra de 1356 parecía pequeña, decidimos realizar la simulación un millón de veces, representando cada vez a una persona que se somete al experimento. En cada experimento simulado, barajamos las cartas generando aleatoriamente una lista de 25 cartas compuestas de 5 naipes de 5 palos distintos. Luego, aleatoriamente también se genera una lista de predicciones de 25 naipes, sin tener en cuenta el número de naipes por cada palo. Se ha hecho así bajo la suposición de que con un número alto de cartas (25), una persona no se va a preocupar de contar cuantas veces ha predicho ya tal o cual palo. Luego, se comparan ambas listas posición a posición, y se anota el número de coincidencias obtenidas, que se interpretan como aciertos.
Conviene señalar una vez más que en la simulación el proceso es aleatorio, y el ordenador no entra en trance, ni se concentra para adivinar carta alguna.
Corrido el programa, he aquí los resultados:
- El 38.3% de las personas, acierta más veces a lo esperado por azar (de 6 a 16, siendo 5 lo esperado)
- De ellos, el 12.2% acierta un número elevado de cartas (de 9 a 16 aciertos)
Resultados similares a los obtenidos por Roldán & Roldán. Pero, ¡oh, sorpresa!, estos resultados has sido generados por azar. El truco está en que Los Roldanes, o bien no saben nada de números, o muy al contrario, saben demasiado bien cómo presentarlos para que parezcan algo que no son.
Como una imagen vale más que mil palabras, representemos en un histograma el número de aciertos frente al porcentaje de veces que se han obtenido esos aciertos. Es decir, vamos a representar un histograma, o distribución de probabilidad.
Como se puede comprobar, los mismos datos en una gráfica pierden la espectacularidad que parecían tener explicados de palabra.
Cualquier matemático, cualquier persona que haya experimentado mínimamente en un laboratorio, o cualquier persona con un mínimo conocimiento de estadística, reconoce la forma de esa distribución: en primera aproximación, es una Campana de Gauss, o Gaussiana, que aparece en cualquier tipo medida sistemática. Se caracteriza por tres valores:
- Valor medio: Al hacer muchas medidas de un mismo sistema, éstas se distribuyen en torno a un valor central o medio, que se toma como valor verdadero de la medida, mientras que el número de veces que salen otros valores es menor cuanto más lejos estemos de ese valor medio. Es un valor que depende principalmente de qué se va a medir, y en menor medida del sistema de medida (la capacidad telepática o probabilidad de acertar, con una baraja Zener)
- Anchura: También llamada desviación típica. Se relaciona con el rango de valores de una serie de medidas. Exactamente, determina entre qué rango de valores caería una medida 2 de cada 3 veces. Es un valor que depende principalmente del sistema de medida (una baraja con 5 palos de 5 naipes produce una anchura distinta que una baraja con 7 palos de 7 naipes)
- Área: Se relaciona con el número de veces que se lleva a cabo el experimento. Se sustituye a menudo por la Amplitud, que determina la probabilidad (máxima) de que al hacer una medida el resultado sea el valor medio. Cuando se usa la amplitud, la anchura se cambia por su mitad (la semianchura)
Aplicada esta receta a nuestra distribución, tenemos que el valor medio es de 5 aciertos (las "centésimas de acierto" no existen, por lo que se redondea al número entero más próximo), y que la probabilidad es del 19.9%, que, teniendo en cuenta el error estimado, está de acuerdo con lo que cualquiera calcula usando el popular método de "la cuenta de la vieja": 25 cartas con probabilidad de 1 entre 5 (20%), hacen un total de 5 aciertos. Cuya interpretación correcta según una gaussiana es que un 20% de las veces se acertarán 5 cartas, mientras que el 68% de las veces, una persona acertará de 3 a 7 cartas, debido a los 2 aciertos de semianchura.
Aquí hay que señalar que Roldán & Roldán dicen en su artículo que la media esperada por cuenta de la vieja, es de entre 6 y 7 aciertos. Esto hace pensar que o bien no conocen tal método, o que usan una baraja Zener distinta.
Respecto a la afirmación de que el 45% acierta por encima de la media, nos basta con ver como con nuestra distribución el 38.3% también acierta por encima de la media. Y estos resultados no son aciertos por encima de lo previsto por azar, sino precisamente ¡Los esperados por azar!
Por si a alguien le parece que del 45% a 38% hay una diferencia significativa, comentar que en el experimento simulado la muestra es muchísimo mayor, o cual siempre reduce las fluctuaciones estadísticas, que es la posible explicación al resultado de Los Roldanes. Como ejemplo, he aquí tres series de simulaciones con una muestra de 1356 personas:
Cada barra corresponde a una serie, y los puntos a la media aritmética de las tres series. Una vez más, el valor medio y la probabilidad son las que tienen que ser. Si se fijan en las barras, verán que para un mismo número de aciertos (4 por ejemplo) el valor obtenido puede variar significativamente entre ellas. De igual forma, el porcentaje de aciertos mayor a la media también fluctúa.
¿Y qué hay de ese 12% que acierta un alto número de cartas? Este es el punto que hace pensar que sí saben de números para poder presentarlos de forma llamativa. Porque un 12% de un 45% es un mucho menos llamativo 5.4% del total. Para Roldán & Roldán estos aciertos altos son de 12 a 16 naipes. Para obtener resultados similares, junto con una media de 6 aciertos como ellos, se necesitarían 24 cartas en 4 palos de 6 naipes cada uno. Ante el desconocimiento de qué baraja exacta usaron, hemos tomado estos aciertos entre 9 y 16, obteniendo un 12.2%, que representan un insignificante 4.7% del total. Una vez más, datos similares obtenidos sólo con el azar, sin poner al ordenador en trance.
Un último punto, en su macro - experimento dicen que 14 personas se acercaron al 90% de aciertos. Dado que hasta ahora no se ha podido ver ningún dato que permita inducir algún tipo de percepción extrasensorial, antes de catalogar a estas 14 personas como interesantes para el estudio, es preferible intentar averiguar si de alguna forma eran capaces de ver, saber o que les chivaran qué carta tenía en su mano el experimentador.
Éste es en definitiva un ejemplo más de cómo no se diseña un experimento, y de cómo no se analizan los datos obtenidos. La simulación se puede leer de dos formas: como la descrita aquí (experimentar sobre un millón de personas) o también como una sola persona que se somete al experimento un millón de veces. Una sola persona haciendo el experimento una sola vez, no produce un resultado significativo (y esto incluye a los 14 del 90%). Es la repetición sistemática (y cuantas más veces mejor) la que establece las propiedades reales de esa persona, que si se limita a la adivinación por azar, resulta en una gráfica como las mostradas. Si el experimento quiere además no evaluar a una sola persona, sino a un conjunto de ellas, significa que a cada uno de los 1356 individuos habría que haberles realizado el test un elevado número de veces.
Por último mencionar que Los Roldanes son promotores de una iniciativa para que se cree un área de conocimiento sobre parapsicología, de forma que se pueda obtener una licenciatura o un grado de formación profesional que permita estudiar científicamente este tipo de materias. Visto lo visto, sólo decirles que para emplear el método y rigor científico lo único que necesitan es estudiar una carrera de ciencias de las ya existentes. Ahí pueden aprender qué son las distribuciones estadísticas, cómo diseñar experimentos y cómo analizar los datos. Y después aplicarlo a estudios como su macro - experimento, y evitar llegar a conclusiones que tienen más de "ganas de creer" que de análisis serio y riguroso.
Más info:
El macro - experimento
Cartas Zener
Distribuciones de probabilidad
La Campana de Gauss
18 comentarios:
Un artículo demoledor. Tal vez en vez de pedir una "titulación" específica para las paranormalidades deberían empezar por realizar con rigor sus investigaciones.
Deberían empezar por aprender las cosas básicas de casi todo: qué es un experimento, cual es la finalidad de éste, qué es una hipótesis, para que sirve, qué son las matemáticas, y como se aplican al método científico...
En fin, a mi me parece que antes de ponerse un chaleco multibolsillos, se debería empezar por aprender a utilizar las herramientas que se van a usar.
Pero la más graciosa de las frases de la himbestigación de los Roldán es aquella que dice:
"Y de ellos, un 12% superó con creces la telepatía de azar".
Genial, ¿no? Porque esto quiere decir que la telepatía existe siempre, y si no puede diferenciarse de la no-telepatía es porque es un tipo especial de telepatía que se caracteriza por no distinguirse de la inexistencia de la misma.
Quedó claro?
Yo creo que deberían darles un campus universitario entero, vea.
ains, si todo fuera negar las evidencias... esa simulación es eso, una simulación, como una simulación meteorológica, que se aproxima a la realidad. Pues lo mismo, es una aproximación. en cuánto a la definición de la investigación, keda clarita, xo como negais la realidad... llegará el día que negareis la e=c·eme al cuadrado... o cualquier cosa que se os escape
Estimado señor Baal:
Cogemos la teoría, y hallamos el resultado que predice. Cogemos un experimento, y obtenemos unos resultados. Comparamos ambos resultados, y si coinciden, ¡Oh, sorpresa! significa que la teoría no es falsa, o al menos lo bastante aproximada.
Es decir, la simulación genera los resultados de la teoría, los comparo con los del experimento, y resultan ser los mismos. Conclusión: en el experimento no hubo nadie capaz de adivinar cartas más allá de lo esperado por azar. Opinar lo contrario sí es negar la realidad y la evidencia.
Por cierto, E=mc^2, lo descubrió un científico
anda, que maravilla, junto con la simulación, que es eso, simulación, te vas a la realidad, ¡anda, qué tiene más variables!, ainssss, negar todo, es lo que hay
Sin embargo, soy capaz de explicar los mismos resultados usando menos variables. Eso quiere decir que hay variables que no hay que tener en cuenta.
Mira, la realidad nunca vas a poder describirla en su totalidad. Sólo puedes describir aproximacines, como esta simulación.
Pero puedes conseguir que las aproximaciones sean muy buenas, y no haga falta considerar otras variables. Complicar innecesariamente las cosas es una tontería.
¿Que tendría que incluir según tu? ¿Las altas y bajas presiones de la atmósfera?¿Los huracanes del caribe? ¿la humedad ambiente? ¿La edad de las personas? ¿Para qué, si ya soy capaz de reproducir los resultados? ¿En qué los mejoraría?
tendrias q incluir el estado emocional de la persona, q nunca lo reproducira un ordenador. 2º a ver si publicas la respuesta de los hermanos roldán...
¿Y eso como se incluye? ¿tienes ya una hipótesis de cómo afecta y cómo se calcula la distribución de probabilidad teniendo en cuenta el estado emocional de una persona?
A ver, repasemos el método científico:
- Observacion: Teneis unos datos que parecen ser sorprendentes, y que parecen contradecir las leyes de la probabilidad.
- Hipótesis: Yo creo que esos datos corresponden a los que se obtienen por probabilidad y azar puro y duro
- Comparación hipótesis- observacion: Coinciden, entonces, la hipótesis es correcta. Los resultados son debidos al azar, nada sorprendente.
¿cual era vuestra hipótesis? ¿Cómo la habeis comparado con la observación?
¿En qué influiría el estado emocional de una persona en la coincidencia de experimento - hipótesis del azar puro y duro?
Por cierto, para hacer una mejor comparación, necesitaría los datos completos, y no sólo unas conclusiones finales. Es uno de los grandes problemas de quienes estudiais estas cosas: exponeis los grandes titulares, y os olvidais de contar todos los detalles, algunos incluso importantes.
en noviembre puedes recabar la informacion.
2º. si ponemos en grandes titulares, ponemos despues los datos, ni se inventan, ni se excluyen los importantes, lee más prensa, y observa los datos de las escuestas, o, en economía, que ahí hay más...
3º espero aún la respuesta de marisol, ya que no está publicada
4ºse puede extrapolar una estadística de un programa, realizada por una persona, según se deduce de tu argumentación, o... ¿por qué no pueden ser esas personas individuales?
5º ¿se mezcla la medicina con las matemáticas?
1º ¿Tengo que esperar a Noviembre para que me den los datos? ¿O es que tengo que ir yo a cogerlos? Una parte importante del método científico es comunicar los resultados, incluyendo todos los datos, para que otras personas puedna refutar/reproducir/confirmar resultados.
2ºEn el artículo que cito, sólo están los titulares: "tanto porciento de esto, tanto porciento de lo otro, y que sorpresas mas grandes nos hemos llevado". Aún no se cual es el desarrollo exacto del experimento, ni la distribución exacta de aciertos, como el histograma que ha sacado yo con el ordenador. Faltan muchos dato, los más importantes, además.
3º Marisol me envió varios e-mail privados, que le contesté. Si quiere expresar su opinión en público, aquí tiene una sección de comentarios en los que no se censura nada.
4º El objetivo del progama es hacer lo que no habeis hecho vosotros: comparar la hipótesis con la observación. Habeis observado "algo" ¿Cual era vuestra hipótesis? ¿Que tal coincide con el resultado? ¿Es buena o mala la hipótesis? ¿hay que cambiarla o no?. Si la hipótesis era "con telepatía se aciertan más que por puro azar", tendréis que comparar con lo que se espera por azar, que son los resultados que da mi programa: lo esperado por azar. Yo lo he comparado, y sale bastante bien.
5º ¿Y que pinta la medicina en este debate? Pregúntale a un médico cómo investiga, que yo no lo sé, pero estoy seguro de que se usan método estadísticos bastante.
Por si tienes dudads acerca del método científico:
http://www.formauri.es/personal/FAQesceptico/FAQ/Complementos/metodo-cientifico.php
La simulacion, por cierto, se puede leer de dos formas:
1- Un millón de personas que hacen una vez el test
2- Una persona que hace un millón de veces el test
Los resultados, si son debidos al azar, es el mismo en ambos casos.
De hecho, el experimento tal y como está planteado por los hermanos Roldan, no es correcto:
Para saber si una persona es capaz de acertar más de lo esperado por azar, debe repetir el test un numero elevado de veces(100 por ejemplo).
Si quieres saber de un grupo de personas (1000 por ejemplo) si hay algunas que puedan tener telepatia, entonces a todos los integrantes del grupo debes hacerles el test un numero elevado de veces (1000x100=100000 tests en total), ver la distribución de aciertos de cada uno de ellos, y ver cuantos se desvían de lo predicho por azar.
¿Tú vienes de C o me lo está pareciendo a mí? :-DD
uhm... Ya decía yo que el código parecía muy C... de hecho, ES C. ¿Por qué dices que lo hiciste en C++?
Bueno, no soy programador (como podrás comprobar). De hecho, veo pocas diferencias entre c++ y c (si, seguro que un buen programador me crucificaría por decir tamaña herejía). Bueno, vale, sí, hay algunas diferencias muy importantes y útiles.
El compilador era de c++ de borland, así que por eso puse c++, pero lo importante es algoritmo.
:)
no hace falta ver el método científico, me lo sé de sobra, y no ese método propuesto por Popper, donde esta incluida la falsabilidad de las cosas. Eso nunca lo he visto, la falsabilidad, xq una teoria es universal, y no concreta. Dudar de todo lo dudable, aunque sea obvio, xq así encotrará el camino, ains....
anwbys, al final no respondiste nada, solamente críticas la falta de fe (o por lo menos eso es lo que entiendo por tu comentario sobre que se duda sobre lo dudable ¿?)
Otra entrada de Gluón con leche que me viene de lujo. Estoy haciendo un trabajo con mis alumnos. Algún tiempo escribí esta entrada, si quieres aportar algo.
Publicar un comentario