Bioestadística
 

 


 
 
Probabilidad condicionada, compuesta y total.

PROBABILIDAD CONDICIONAL.

Consideremos la siguiente situación. Se tienen tres urnas similares; por fuera son idénticas. Se sabe que

  • en la urna 1 hay 3 bolas blancas y 19 azules,
  • en la urna 2 hay 20 bolas blancas y 2 azules,
  • en la urna 3 hay 11 bolas blancas y 11 azules.
Se va a sacar una bola de una de las urnas. Puede ser azul o blanca. ¿Cuál es la probabilidad de que sea blanca?

Hay cuatro posibles soluciones:

  1. La probabilidad de una blanca es 3 / 22. Esto es porque si se escoge la urna 1, hay 3 de 22 bolas que son blancas. Esta respuesta nos deja pensando en que es muy arbitrario decir que la urna escogida es la 1. Si la urna escogida fuese la 1 esta sería la respuesta correcta.
  2. De manera similar, podemos pensar que la urna escogida es la 2 y entonces la probabilidad de una bola blanca es 20 / 22.
  3. Claro que, también, la urna escogida puede ser la 3 y entonces la probabilidad de blanca es 11 / 22.
  4. Como no se sabe cual es la urna escogida y las tres urnas tienen el mismo número de bolas, la probabilidad se calcula como si fuese uan gran urna con 66 bolas de las cuales 3 + 20 + 11 son blancas y, así, la probabilidad es 34 / 66
¿Cuál es la respuesta correcta? o ¿habrá otra que sea la respuesta correcta?

Una cosa es clara; si podemos suponer que la urna escogida es la 1, la respuesta correcta es la primera. Lo mismo se puede decir de la segunda y la tercera. La cuarta es un poquito más atrevida y quizá sea correcta. Por lo pronto vamos a darle un nombre a las tres primeras: les llamamos probabilidad condicional.

Más adelante en el curso, veremos lo que se llama fórmula de la probabilidad total y entonces, veremos que la cuarta respuesta daría la ``probablidad no condicional''.

Por el momento ampliemos nuestras ideas sobre probabilidad condicional con un poco de matemáticas.

Formalmente, definimos en clase la probabilidad condicional de la siguiente manera:
 

P( A | B ) = [P( A y B )] / [P( B )]


El símbolo P( A | B ) lo leemos como probabilidad de A dado B. Lo interpretamos como la probabilidad de que, sabiendo que ya sucedió B, además suceda A. En el ejemplo de las urnas A sería el evento "la bola es blanca''; B sería la urna correspondiente.

Como lo que está abajo en el quebrado es la probabilidad de lo dado, la fórmula no es simétrica en A y B. Si los intercambiamos, da otro número. Esto se ve en el ejemplo ya que no es lo mismo que nos informen cual es el número de la urna escogida a que nos digan que la bola fue blanca y nos pregunten cuál es la urna.

Esta fórmula no tiene sentido matemático si P(B) = 0. En tal caso decimos que la probabilidad condicional no está definida. Claro que eso está bien porque no puede haber sucedido algo que es imposible.

Fíjese que esta fórmula se usará cuando haya una manera fácil de calcular las probabilidades no condicionales y la condicional sea difícil. Eso no fue el caso con el color de la bola y las urnas.

Para ejemplificar el tipo de situación en que nos sirve la fórmula descrita, considere este problema.

Se tiran dos dados y se sabe que el primero no tiene el número 5. ¿Cuál es la probabilidad de que la suma de los dados sea 8? Para resolver, llamemos

B el evento: "el primer dado no es 5''.
A el evento: "la suma de los dados es 8''.
Con los datos se ve que:
P(B) = 30 / 36. Porque de las 36 parejas posibles, 6 tienen 5 en el primer dado.
P(A y B) = 4 / 36. Porque sólo se obtiene 8, con las parejas (2,6), (3,5), (4,4) y (6,2) [La pareja (5,3) sí suma ocho pero tiene un 5 en el primer dado].
y, usando la fórmula, P(A|B) = 4 / 30.
También hubieramos podido calcular sin la fórmula, pero esa cuenta requiere más ingenio. En este ejemplo es fácil calcular las probabilidades no condicionales.

Hay muchos problemas, como en el de las urnas, en que lo contrario es lo cierto: es fácil calcular la condicional y la podemos usar para calcular la conjunta.

Si despejamos a P(A y B), tendremos una fórmula para calcular la probabilidad conjunta cuando sea fácil calcular la condicional.

En clase hacemos un ejemplo simple de cálculo de probabilidad condicional con una tabla de dos clasificaciones cruzadas.

En ese ejemplo se ven tres cosas:

  1. La probabilidad condicional nos permite medir la información. En los ejemplos vimos como cambia la probabilidad de A, antes de conocer nada: P(A) y después de conocer la ocurrencia de el evento B: P(A | B).
  2. En un extremo está el cambio enorme que corresponde a que A y B sean excluyentes (ajenos). En este caso la probabilidad podría llegar incluso a ser cero.
  3. En el otro extremo están los eventos en los que sucede que P(A | B) = P(A). Esto quiere decir que la información de que B ocurrió no cambia la probabilidad de A y decimos que A y B son independientes.
Esta última característica, la independencia, juega un papel muy importante en la probabilidad y merece una atención más detallada. Por el momento debemos establecer una definición:
A y B son eventos independientes si y sólo si P(A y B) = P(A) P(B)
En forma equivalente decimos:
A y B son eventos independientes si y sólo si P(A | B) = P(A)
La equivalencia se sigue de una sustitución algebraica muy sencilla.

La consecuencia de que esta sea una definición es que:

para comprobar la independencia de dos eventos es preciso hacer ver que P(A y B) = P(A)P(B).
Es importante remarcar la diferencia de concepto entre eventos independientes y eventos excluyentes o ajenos. En nuestro ejemplo se ve claramente que ambos conceptos son antitéticos. El hecho de que dos eventos se excluyan casi implica que no son independientes. La excepción se da en el caso degenerado de que alguno de ellos (o los dos), sea imposible. En el habla cotidiana, a veces, se confunden estos conceptos.

Note que si A es imposible; P(A) = 0. Además "A y B'' también es imposible y se tiene P(A y B) = P(A)P(B) ya que ambos lados de la igualdad valen cero . Pero éste es el único caso en que dos eventos son ajenos e independientes a la vez; en términos geométrios la idea de independencia se asemeja a la perpendicularidad y la de ``ajenos'' al paralelismo.
.


Temario.

Buscadores.
 
    Enlace hacia algunos de los "Robots genéricos de búsqueda" mas usados en Internet, desde los que podrá realizar búsquedas selectivas de temas relacionados con la "estadística" en general y la "Bioestadística" en particular:


Ultima modificación: 15-V-2003.