domingo, 4 de noviembre de 2007

Nuevos Aires

Nuevos aires se respiran hoy día. Ahora estoy en otro trabajo, que significa otro reto, una nueva experiencia que pienso aprovechar lo más que pueda. Nuevas áreas de interés me esperan, y debo leer e investigar más para dar lo mejor de mí.
Y todo eso esta bien, porque era uno de los cambios que más estaba esperando...y es que ya es hora de echar ha andar algunos de los planes que tengo, como comprar algunas cosas, meterme a estudiar alguna especialidad (o maestría, dependiendo de que tenga ganas).

Ahora, ¿será el único cambio?..es lo más probable, por lo menos por ahora, pero últimamente me han pasado cosas tan inéditas que todo puede pasar...de ello ya hablaré en otro post..más adelante...

domingo, 19 de agosto de 2007

Video de la sustentación

Mi hermana logró grabar 7 minutos de la sustentación, llega hasta la parte de la metodología..lo puse en YouTube:

Sustentación!!!!

Y al fin sustenté!! y me fué bien, me pusieron Sobresaliente, aunque la verdad las preguntas del jurado no fueron tan rebuscadas, eso me ayudó.
Espero que mi tema :"Modelamiento Bayesiano de Tablas de Contingencia IxJ" sirva para otros trabajos en la Universidad Agraria La Molina..
Ese bonito día miercoles 15 se vió empañado por la tragedia que sucedió esa noche en Ica, la ciudad más afectada por el terremoto de 7.9 grados en la escala de Richter. La verdad que como estaba en la calle no lo sentí tan fuerte, y la verdad me sorprendí cuando vi las imágenes de lo que había causado...
Sin duda..un día que nunca olvidaré.
Para los interesados les adjunto las diapositivas que usé en mi exposición:

http://rapidshare.com/files/49891169/Presentaci_n.ppt.html

Para descargar, hacen click en "Free", luego en la página siguiente ponen el código que aparece y por último hacen click en "Download".
Espero que les guste..y mejor aún si les sirve.

jueves, 17 de mayo de 2007

Clasificadores Probabilísticos - Ingenuo de Bayes

El clasificador CVSi(dj), es quizás el clasificador más utilizado y el que más frecuentemente se encuentra en la literatura. Este clasificador expresa la probabilidad de que un documento, representado por el vector dj cualquiera, pertenezca a una clase ci dada. De forma matemática, se puede ver de la siguiente manera:




donde el espacio de eventos es el de los documentos, P(dj) es la probabilidad de escoger aleatoriamente un documento este esté representado por el vector d(j); y P(ci) es la probabilidad de que al tomar un documento cualquiera este pertenezca a la clase ci.

Estimar la probabilidad anterior no es fácil por lo complejo de dj; por lo que normalmente se asume que las variables que componen el documento vector son independientes; por lo que se puede representar la probabilidad anterior como:




Dada esta suposición, es lo que se conoce como Ingenuo de Bayes (Naive Bayes), y por su simplicidad y rendimiento, es ampliamente utilizado en Categorización de Textos.

De todas las aproximaciones del Ingenuo de Bayes, la más común es la Independencia Binaria, donde se usan valores binarios para la representación del documento en el vector; pero se pueden encontrar otras variaciones que apuntan a:
- Relajar la restricción que el vector documento tenga valores binarios
- Introducir normalización en el largo del documento
- Relajar la suposición de independencia

jueves, 19 de abril de 2007

Mar de Copas - Suna

Les dejo algo de Mar de Copas..para variar:

La evolución del Estadístico

Miren como hemos evolucionado de un tiempo a esta parte:

viernes, 13 de abril de 2007

Filtro Bayesiano de Spam. ¿Como funciona?

El filtro Bayesiano de spam es un proceso que usa el llamado "Clasificador Bayesiano Ingenuo" para identificar un correo spam.

Este se ha hecho un mecanismo popular para distinguir el correo electrónico ilegítimo (spam) del correo electrónico legítimo (ham). Muchos programas de correo modernos ponen en práctica el filtro Bayesiano. Los usuarios de correos también pueden instalar programas de filtración de correo electrónico por separado.

Los filtros Bayesianos tienen su sustento en el teorema de Bayes. En el contexto de un spam, este teorema dice que la probabilidad de que un correo sea spam, dado que ciertas palabras están en el, es igual a la probabilidad de encontrar dichas palabras en un correo spam multiplicado por la probabilidad de que un correo sea spam, dividido por la probabilidad de encontrar dichas palabras en un correo cualquiera.




Por otra parte, la técnica del envenenamiento Bayesiano es una técnica usada por los spammers (léase los que mandan spam)como una tentativa de degradar la eficacia de los filtros de spam que usan en la filtración Bayesiana. Un spammer que practica el envenenamiento Bayesiano enviará correos electrónicos con grandes cantidades grandes de texto legítimo (juntado de noticias legítimas o fuentes literarias), con el fin de tratar de engañar al programa y tratar de que este no filtre su spam. Sin embargo, la gran ventaja que tiene el filtro Bayesiano es que este puede ser "entrenado" en base a la información del lector del correo. Por lo que su precisión es cada vez mayor a medida que el correo recibe mas emails.

Mayor información:
Documento en pdf: http://citeseer.ist.psu.edu/sahami98bayesian.html
Libro: Graham, Paul (2002). A Plan for Spam.
Web: http://research.microsoft.com/~horvitz/junkfilter.htm
Programa: http://www.spambully.com/

Reconstrucción Bayesiana de accidentes de tránsito

La reconstrucción de un accidente de tránsito es definida como el esfuerzo para determinar, con cualquier prueba está disponible, como sucedió un accidente. La reconstrucción de un accidente de tránsito puede ser tratada como un problema de razonamiento incierto sobre un acontecimiento particular, y los avances en el modelado del razonamiento incierto para la inteligencia artificial pueden ser aplicados a este problema. Por lo general principios físicos pueden ser usados para desarrollar un modelo estructural del accidente y este modelo, junto con una evaluación experta de la incertidumbre a priori sobre las condiciones iniciales del accidente, pueden ser representados como una red Bayesiana. Luego, las probabilidades de las condiciones iniciales del accidente, dado las evidencias recogidas en la escena del accidente, pueden ser calculadas actualizando la red Bayesiana. La información obtenida puede ser utilizada para implementa de forma rigurosa una prueba de "but for", con el fin de definir si la violación del límite de velocidad puede ser considerado una causa del accidente. Esta lógica puede usarse tanto para acidentes tipo vehículo/peatón, como a accidentes más complejos.


Mayor información en:
Davis, Gary A., "Bayesian Reconstruction of Traffic Accidents" . Law, Probability and Risk, Vol. 2, pp. 69-89.
Documento en pdf: http://www.cts.umn.edu/pdf/CTS-06-01B.pdf

domingo, 8 de abril de 2007

Dios tiene 62% de probabilidades de existir, según teorema de bayes

Si Thomas viera para que están usando su teorema...
La probabilidad de que Dios exista es del 62%, según el cálculo realizado por el periodista y ensayista alemán Thomas Vasek a partir de una fórmula creada hace 250 años por el pastor presbiteriano inglés Thomas Bayes.
Con su cálculo personal, Vasek trata de encontrar al menos una salida parcial a un problema que ha ocupado a un sinnúmero de pensadores a lo largo de los siglos.
Los esfuerzos por probar racionalmente la existencia de Dios, según Vasek, han desembocado todos en el fracaso y ya en el siglo XVII Blaise Pascal —que era matemático, físico, teólogo y un jugador apasionado— creía que se trataba de una cuestión ante la que no quedaba otra posibilidad que apostar a ciegas.
Vasek, que sigue de cerca las reflexiones hechas por el físico Stephen D. Unwin en su libro La probabilidad de la existencia de Dios, no se contenta con apostar a ciegas y trata de precisar un tanto la posibilidad de una u otra hipótesis al respecto.
Para ello, Vasek usa el cálculo de probabilidades, disciplina que Pascal contribuyó decisivamente a desarrollar, y expone sus conclusiones en un ensayo que publica la revista científica alemana P.M en su próxima edición.
Como punto de partida, Vasek asume que la probabilidad de que exista Dios es de un 50%, lo que, según admite, es una manera de decir que no se tiene ni la más remota idea de cuál es la respuesta más adecuada, puesto que la hipótesis contraria se asume como igualmente probable.
A partir de ese punto de desconcierto absoluto, se examinan cinco ámbitos de indicios para ver si estos fortalecen una u otra hipótesis.
El primero de esos ámbitos es todo lo relacionado con el origen del universo y, a partir del hecho evidente de que el universo existe, se formula la pregunta de si su surgimiento hubiera sido más o menos posible con o sin la existencia de Dios.
En ello, se ve como “algo más posible” que el universo haya sido creado por Dios a que haya surgido de la nada, con lo que la probabilidad de la existencia de un ser supremo aumenta a un 67%.
En el segundo ámbito, todo lo relacionado con el hecho de que el cosmos tiene un orden, también aumenta la probabilidad de la existencia de Dios. Si las condiciones físicas de nuestro mundo, según Vasek, cambiaran sólo mínimamente, éste colapsaría, lo que sin embargo no ocurre.
“Vivimos en un universo improbable”, dice Vasek, y para hacerlo un tanto más probable —y en vista de que parece existir— opta por aumentar la probabilidad de la existencia de Dios al 80%.
El tercer ámbito es todo lo relacionado con la evolución y allí se ven las dos hipótesis —la de que Dios exista y haya desatado el proceso de evolución o la de que éste sea algo autosuficiente— como igualmente factibles. Esto hace que la probabilidad de que Dios existe no cambie.
El cuarto ámbito —el relacionado con la existencia del bien y del mal moral—, sin embargo, le da un duro golpe a la hipótesis de que Dios existe.
Aunque la evidente posibilidad que tenemos los seres humanos de reconocer el bien aumenta en algo la probabilidad de la existencia de Dios, la existencia del mal le da un duro golpe hasta reducirla al 45 por ciento.
Sólo el último ámbito de indicios, el relacionado con la evidencia de que a lo largo de la Historia ha habido muchas personas que han tenido experiencias místicas y religiosas, hace que la probabilidad de la existencia de Dios vuelva a aumentar hasta ponerse en un 62%.
El resultado de Vasek corrige a la baja el de Unwin, quien en su libro publicado en 2005 había llegado la conclusión de que la probabilidad de que Dios exista es del 67%.
En todo caso, llega a una situación algo más confortable que la de Pascal, que no veía otra salida que la de apostar a ciegas y sólo podía justificar su decisión de creer en Dios diciendo que, de acertar, le esperaba una ganancia eterna, mientras que el riesgo de perder la apuesta era prácticamente inexistente.

viernes, 6 de abril de 2007

Comenzando

Recién comienzo con esto de los blogs...por lo que al principio lo verán todo monse, sin mucha cosa. Pero poco a poco iré aprendiendo. Lo que quiero es compartir archivos documentos, información sobre los temas que más me gustan, claro está, la Estadística, que es mi profesión, Informática, que también es mi profesión, y otras cosas de internet, mas que nada relacionadas con tecnología.Espero no ser aburrido y que encuentren cosas que les sirvan.