Emparejamiento óptimo

De Wikipedia, la enciclopedia libre

El emparejamiento óptimo es un método de análisis secuencial utilizado en ciencias sociales, para evaluar la similitud de arreglos ordenados de símbolos que normalmente representan una secuencia temporal ordenada de los estados socioeconómicos que dos individuos han experimentado. Una vez que tales distancias han sido calculadas para un conjunto de observaciones (por ejemplo, individuos de una cohorte) herramientas clásicas (tales como el Algoritmo de agrupamiento) pueden ser utilizados. El método fue adaptado a las ciencias sociales[1]​ a partir de una técnica introducida originalmente para estudiar la biología molecular. El emparejamiento óptimo utiliza el Algoritmo Needleman-Wunsch.

Algoritmo[editar]

Sea una secuencia de estados que pertenecen a un conjunto finito de estados posibles. Denotemos el espacio de secuencias, es decir, el conjunto de todas las posibles secuencias de estados. Los algoritmos de correspondencia óptimos funcionan mediante la definición de operador simples álgebras que manipulan secuencias, es decir, un conjunto de operadores . En el enfoque más simple, se utiliza un conjunto compuesto de solamente tres operaciones básicas para transformar secuencias:

  • un estado se inserta en la secuencia
  • un estado es borrado de la secuencia y
  • un estado es reemplazado (substituted) por un estado , .

Imagínese ahora que un coste se asocia a cada operador. Dadas dos secuencias and , La idea es medir el costo de obtener de utilizando los operadores del álgebra. Dejar ser una secuencia de operadores de manera que la aplicación de todos los operadores de esta secuencia La a la primera secuencia da la segunda secuencia S_2 : donde denota el operador compuesto. A este conjunto asociamos el costo c (A) = \ sum_ {i = 1} ^ n c (a_i) , Que representa el costo total de la transformación. Hay que tener en cuenta en este punto que podría existir diferentes tales secuencias La que transforman en ; Una elección razonable es para seleccionar el más barato de tales secuencias. Por la presente instamos a distancia
 :

es decir, el coste del conjunto menos costosa de las transformaciones que se convierten en . Tenga en cuenta que es por definición no negativo, ya que es la suma de los costes de positivos, y trivialmente si y sólo si , Es decir, no hay ningún costo. La función de distancia es simétrica si los costos de inserción y supresión son iguales , El término costo indel lo general se refiere a los gastos comunes de inserción y supresión.

Teniendo en cuenta un conjunto compuesto de sólo las tres operaciones básicas descritas anteriormente, esta medida proximidad satisface la desigualdad triangular. transitividad sin embargo, depende de la definición del conjunto de las operaciones elementales.

Crítica[editar]

Aunque las técnicas de juego óptimas son ampliamente utilizadas en sociología y la demografía, estas técnicas también tienen sus defectos. Como se ha señalado por varios autores (por ejemplo L. L. Wu[2]​), el principal problema en la aplicación de emparejamiento óptimo es definir adecuadamente los costos .

Emparejamiento óptimo en el modelado causal[editar]

El emparejamiento óptimo es también un término usado en el modelado estadístico de efectos causales. En este contexto se refiere a la combinación "casos" con "controles", y es completamente independiente del sentido de la secuencia analítica.

Referencias[editar]

  1. A. Abbott and A. Tsay, (2000) Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect Sociological Methods & Research], Vol. 29, 3-33. doi 10.1177/0049124100029001001
  2. L. L. Wu. (2000) Some Comments on "Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect" Archivado el 24 de octubre de 2006 en Wayback Machine. Sociological Methods & Research, 29 41-64. doi 10.1177/0049124100029001003