sábado, 4 de junio de 2011

Teoría de Juegos.

La teoría de juegos es un área de la matemática aplicada que utiliza modelos para estudiar interacciones en estructuras formalizadas de incentivos (los llamados juegos) y llevar a cabo procesos de decisión. Sus investigadores estudian las estrategias óptimas así como el comportamiento previsto y observado de individuos en juegos. Tipos de interacción aparentemente distintos pueden, en realidad, presentar estructura de incentivo similar y, por lo tanto, se puede representar mil veces conjuntamente un mismo juego.

Desarrollada en sus comienzos como una herramienta para entender el comportamiento de la economía, la teoría de juegos se usa actualmente en muchos campos, como en la biología, sociología, psicología y filosofía. Experimentó un crecimiento sustancial y se formalizó por primera vez a partir de los trabajos de John von Neumann y Oskar Morgenstern, antes y durante la Guerra Fría, debido sobre todo a su aplicación a la estrategia militar —en particular a causa del concepto de destrucción mutua garantizada.


Desde los setenta, la teoría de juegos se ha aplicado a la conducta animal, incluyendo el desarrollo de las especies por la selección natural. A raíz de juegos como el dilema del prisionero, en los que el egoísmo generalizado perjudica a los jugadores, la teoría de juegos ha atraído también la atención de los investigadores en informática, usándose en inteligencia artificial y cibernética.

Aunque tiene algunos puntos en común con la teoría de la decisión, la teoría de juegos estudia decisiones realizadas en entornos donde interaccionan. En otras palabras, estudia la elección de la conducta óptima cuando los costes y los beneficios de cada opción no están fijados de antemano, sino que dependen de las elecciones de otros individuos. Un ejemplo muy conocido de la aplicación de la teoría de juegos a la vida real es el dilema del prisionero, popularizado por el matemático Albert W. Tucker, el cual tiene muchas implicaciones para comprender la naturaleza de la cooperación humana.

Juegos de suma cero: Suma cero describe una situación en la que la ganancia o pérdida de un participante se equilibra con exactitud con las pérdidas o ganancias de los otros participantes. Se llama así; porque si se suma el total de las ganancias de los participantes y se resta las pérdidas totales el resultado es cero.

La matriz de pagos de un juego bipersonal de suma cero; tiene reglones etiquetados por las acciones del jugador renglón y columnas etiquetadas por las acciones del su contrincante, el jugador columna. Los valores positivos indican que el ganador es el  jugador renglón.

Jugador Columna
E1
E2
Jugador Renglón
E1
3
2
E2
4
-9

Un punto de silla es un pago que está simultáneamente un mínimo de su renglón y un máximo de su columna, un punto de silla se grafica en el espacio como un paraboloide hiperbólico.
Un juego es estrictamente determinado si tiene por lo menos un punto de silla. Las siguientes condiciones se aplican a los juegos estrictamente determinados:

a)    Todos los puntos de silla en un juego tienen los mismos valores de pago.
b)      Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias mini-Max para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.

El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial. Observemos el siguiente ejemplo:
En este caso, si el jugador renglón juega la estrategia 1 siempre ganara; mientras que si juega la estrategia 2 y si el jugador columna usa la estrategia 2, perdería 9. Por este motivo el jugador renglón jugaría siempre a la estrategia 1 y el jugador columna jugaría la estrategia 2 que es la que le da menos perdida (2); ya que el resultad de este juego ya se conoce se dice que el juego es estrictamente determinado. Aplicando el criterio Maxi-min y mini-Max podemos determinar que el valor del juego es 2.
Un jugador quien usa el criterio mini-Max escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio mini-Max es una que minimiza el daño máximo que puede hacer el contrincante, en otras palabras es la mejor de las peores opciones. El criterio Maxi-min aplica de manera correspondiente; así que para identificar el valor esperado del juego estrictamente determinado aplicamos el criterio mini-Max para el jugador columna y el Maxi-min para el jugador renglón.
Una estrategia pura es aquella estrategia que se da cuando el jugador utiliza la misma estrategia o acción en cada turno.
Si el valor de la matriz de pago del ejercicio cambiara a la siguiente, podemos notar que ya no es posible calcular el valor del juego a través del criterio mini-Max ni Maxi-min, ya que no dan el mismo valor por lo que no hay presencia de un punto de silla:
Jugador Columna
E1
E2
min-Max
Jugador Renglón
E1
3
-2
-2
E2
-1
5
-1
Max-min
3
5

Podemos entonces definir los juegos no estrictamente determinados como aquellos que tienen más de una alternativa de juego por la que los jugadores podrían ganar, por lo que no están obligados a siempre jugar con la misma estrategia, no presentan un punto silla por que el número menor de todos los máximos de las columnas no es igual al número mayor de los menores de los renglones, dando como resultado un juego no estrictamente determinado.
Eliminación de las estrategias dominadas: Existen juegos con estrategias las cuales los jugadores nunca escogerán por tener una mejor opción (estrategia con mayor ganancia), estas estrategias se denominan dominadas, y aquellas las cuales siempre están encima por ofrecer mayor ganancia son las dominantes. En el siguiente ejemplo vemos que de las estrategias del jugador renglón, as del renglón 1 ofrecen mayores ganancias que las del renglón 3; por esto se dice que la estrategia 1 es dominante sobre la 3 (E1R D E3R).
E1
E2
E3
E4
E5
E6
E1
1
2
3
4
5
5
E2
-1
2
4
5
5
5
E3
0
1
1
1
1
1
E4
3
0
0
1
1
0

De igual forma, analizando las estrategias del jugador columna, notamos que la estrategia 2 da un valor menor de perdida que la estrategia 3, por lo que E2c D E3c. De esta forma continuamos hasta reducir la matriz de pago a una bipersonal.
E1
E2
E4
E5
E6
E1
1
2
4
5
5
E2
-1
2
5
5
5
E4
3
0
1
1
0
E4c D E5c
E1
E2
E4
E6
E1
1
2
4
5
E2
-1
2
5
5
E4
3
0
1
0
E2c D E4c
E1
E2
E6
E1
1
2
5
E2
-1
2
5
E4
3
0
0
E2c D E6c
E1
E2
E1
1
2
E2
-1
2
E4
3
0
E1R D E2R
E1
E2
E1
1
2
1
E4
3
0
0
3
2

Una estrategia pura es un término empleado para designar un tipo de estrategias en teoría de juegos. Cada jugador tiene a su disposición un conjunto de estrategias. Si un jugador elige una acción con probabilidad 1 entonces está jugando una estrategia pura. Esto la diferencia de la estrategia mezclada, donde jugadores individuales eligen una distribución de probabilidad sobre muchas acciones.
Una estrategia aleatorizada es aquella en donde el jugador renglón elige un renglón al azar, de acuerdo con cierta distribución de probabilidad.
Estrategias mixtas: en la teoría de juego el objetivo para los jugadores es siempre escoger la estratégica optima, si el juego es estrictamente determinado, siempre habrá una estrategia pura, por lo que no habrá cambios de esta, sin embargo se podría tener situaciones en donde el juego no es estrictamente determinado y por consiguiente el oponente no está sujeto a una sola estrategia, al conocer ya la adoptada por el jugador, este oponente podría cambiar a otra estrategia que le traería mayores beneficios a él y menores al jugador, debido a esto, es necesario que este adopte un cambio de estrategias continuamente, obteniendo así un juego de estrategias mixtas.
Una estrategia aleatorizada es utilizada cuando el valor del juego bipersonal no es estrictamente determinado, retomando la matriz presentada y tomando en cuenta la distribución de probabilidad asignada aleatoriamente calcularemos el valor esperado para el jugado renglón:
Jugador Columna
E1 (1/3)
E2 (2/3)
min-Max
Jugador Renglón
E1 (3/4)
3
-2
-2
E2 (3/4)
-1
5
-1
Max-min
3
5

El valor esperado neto del jugador renglón seria (7/4). Ahora queremos buscar valores de las probabilidades de forma tal que obtengamos para ambas ecuaciones valores positivos y que a su vez nos den la mayor ganancia. Tomando en cuenta las siguientes ecuaciones:
Obtenemos:
Graficando ambas ecuaciones con valores de 0 y 1 tenemos:
Calculamos el punto de intersección, el cual es el que da el mayor valor esperado con valores positivos para ambas ecuaciones, igualando ambas ecuaciones:
Ahora repetimos el procedimiento para las estrategias del Jugador Columna:


Referencias:

No hay comentarios:

Publicar un comentario