jueves, 19 de abril de 2007

Mar de Copas - Suna

Les dejo algo de Mar de Copas..para variar:

La evolución del Estadístico

Miren como hemos evolucionado de un tiempo a esta parte:

viernes, 13 de abril de 2007

Filtro Bayesiano de Spam. ¿Como funciona?

El filtro Bayesiano de spam es un proceso que usa el llamado "Clasificador Bayesiano Ingenuo" para identificar un correo spam.

Este se ha hecho un mecanismo popular para distinguir el correo electrónico ilegítimo (spam) del correo electrónico legítimo (ham). Muchos programas de correo modernos ponen en práctica el filtro Bayesiano. Los usuarios de correos también pueden instalar programas de filtración de correo electrónico por separado.

Los filtros Bayesianos tienen su sustento en el teorema de Bayes. En el contexto de un spam, este teorema dice que la probabilidad de que un correo sea spam, dado que ciertas palabras están en el, es igual a la probabilidad de encontrar dichas palabras en un correo spam multiplicado por la probabilidad de que un correo sea spam, dividido por la probabilidad de encontrar dichas palabras en un correo cualquiera.




Por otra parte, la técnica del envenenamiento Bayesiano es una técnica usada por los spammers (léase los que mandan spam)como una tentativa de degradar la eficacia de los filtros de spam que usan en la filtración Bayesiana. Un spammer que practica el envenenamiento Bayesiano enviará correos electrónicos con grandes cantidades grandes de texto legítimo (juntado de noticias legítimas o fuentes literarias), con el fin de tratar de engañar al programa y tratar de que este no filtre su spam. Sin embargo, la gran ventaja que tiene el filtro Bayesiano es que este puede ser "entrenado" en base a la información del lector del correo. Por lo que su precisión es cada vez mayor a medida que el correo recibe mas emails.

Mayor información:
Documento en pdf: http://citeseer.ist.psu.edu/sahami98bayesian.html
Libro: Graham, Paul (2002). A Plan for Spam.
Web: http://research.microsoft.com/~horvitz/junkfilter.htm
Programa: http://www.spambully.com/

Reconstrucción Bayesiana de accidentes de tránsito

La reconstrucción de un accidente de tránsito es definida como el esfuerzo para determinar, con cualquier prueba está disponible, como sucedió un accidente. La reconstrucción de un accidente de tránsito puede ser tratada como un problema de razonamiento incierto sobre un acontecimiento particular, y los avances en el modelado del razonamiento incierto para la inteligencia artificial pueden ser aplicados a este problema. Por lo general principios físicos pueden ser usados para desarrollar un modelo estructural del accidente y este modelo, junto con una evaluación experta de la incertidumbre a priori sobre las condiciones iniciales del accidente, pueden ser representados como una red Bayesiana. Luego, las probabilidades de las condiciones iniciales del accidente, dado las evidencias recogidas en la escena del accidente, pueden ser calculadas actualizando la red Bayesiana. La información obtenida puede ser utilizada para implementa de forma rigurosa una prueba de "but for", con el fin de definir si la violación del límite de velocidad puede ser considerado una causa del accidente. Esta lógica puede usarse tanto para acidentes tipo vehículo/peatón, como a accidentes más complejos.


Mayor información en:
Davis, Gary A., "Bayesian Reconstruction of Traffic Accidents" . Law, Probability and Risk, Vol. 2, pp. 69-89.
Documento en pdf: http://www.cts.umn.edu/pdf/CTS-06-01B.pdf

domingo, 8 de abril de 2007

Dios tiene 62% de probabilidades de existir, según teorema de bayes

Si Thomas viera para que están usando su teorema...
La probabilidad de que Dios exista es del 62%, según el cálculo realizado por el periodista y ensayista alemán Thomas Vasek a partir de una fórmula creada hace 250 años por el pastor presbiteriano inglés Thomas Bayes.
Con su cálculo personal, Vasek trata de encontrar al menos una salida parcial a un problema que ha ocupado a un sinnúmero de pensadores a lo largo de los siglos.
Los esfuerzos por probar racionalmente la existencia de Dios, según Vasek, han desembocado todos en el fracaso y ya en el siglo XVII Blaise Pascal —que era matemático, físico, teólogo y un jugador apasionado— creía que se trataba de una cuestión ante la que no quedaba otra posibilidad que apostar a ciegas.
Vasek, que sigue de cerca las reflexiones hechas por el físico Stephen D. Unwin en su libro La probabilidad de la existencia de Dios, no se contenta con apostar a ciegas y trata de precisar un tanto la posibilidad de una u otra hipótesis al respecto.
Para ello, Vasek usa el cálculo de probabilidades, disciplina que Pascal contribuyó decisivamente a desarrollar, y expone sus conclusiones en un ensayo que publica la revista científica alemana P.M en su próxima edición.
Como punto de partida, Vasek asume que la probabilidad de que exista Dios es de un 50%, lo que, según admite, es una manera de decir que no se tiene ni la más remota idea de cuál es la respuesta más adecuada, puesto que la hipótesis contraria se asume como igualmente probable.
A partir de ese punto de desconcierto absoluto, se examinan cinco ámbitos de indicios para ver si estos fortalecen una u otra hipótesis.
El primero de esos ámbitos es todo lo relacionado con el origen del universo y, a partir del hecho evidente de que el universo existe, se formula la pregunta de si su surgimiento hubiera sido más o menos posible con o sin la existencia de Dios.
En ello, se ve como “algo más posible” que el universo haya sido creado por Dios a que haya surgido de la nada, con lo que la probabilidad de la existencia de un ser supremo aumenta a un 67%.
En el segundo ámbito, todo lo relacionado con el hecho de que el cosmos tiene un orden, también aumenta la probabilidad de la existencia de Dios. Si las condiciones físicas de nuestro mundo, según Vasek, cambiaran sólo mínimamente, éste colapsaría, lo que sin embargo no ocurre.
“Vivimos en un universo improbable”, dice Vasek, y para hacerlo un tanto más probable —y en vista de que parece existir— opta por aumentar la probabilidad de la existencia de Dios al 80%.
El tercer ámbito es todo lo relacionado con la evolución y allí se ven las dos hipótesis —la de que Dios exista y haya desatado el proceso de evolución o la de que éste sea algo autosuficiente— como igualmente factibles. Esto hace que la probabilidad de que Dios existe no cambie.
El cuarto ámbito —el relacionado con la existencia del bien y del mal moral—, sin embargo, le da un duro golpe a la hipótesis de que Dios existe.
Aunque la evidente posibilidad que tenemos los seres humanos de reconocer el bien aumenta en algo la probabilidad de la existencia de Dios, la existencia del mal le da un duro golpe hasta reducirla al 45 por ciento.
Sólo el último ámbito de indicios, el relacionado con la evidencia de que a lo largo de la Historia ha habido muchas personas que han tenido experiencias místicas y religiosas, hace que la probabilidad de la existencia de Dios vuelva a aumentar hasta ponerse en un 62%.
El resultado de Vasek corrige a la baja el de Unwin, quien en su libro publicado en 2005 había llegado la conclusión de que la probabilidad de que Dios exista es del 67%.
En todo caso, llega a una situación algo más confortable que la de Pascal, que no veía otra salida que la de apostar a ciegas y sólo podía justificar su decisión de creer en Dios diciendo que, de acertar, le esperaba una ganancia eterna, mientras que el riesgo de perder la apuesta era prácticamente inexistente.

viernes, 6 de abril de 2007

Comenzando

Recién comienzo con esto de los blogs...por lo que al principio lo verán todo monse, sin mucha cosa. Pero poco a poco iré aprendiendo. Lo que quiero es compartir archivos documentos, información sobre los temas que más me gustan, claro está, la Estadística, que es mi profesión, Informática, que también es mi profesión, y otras cosas de internet, mas que nada relacionadas con tecnología.Espero no ser aburrido y que encuentren cosas que les sirvan.