Homología persistente

De Wikipedia, la enciclopedia libre
La imagen muestra un ejemplo de barcode o código de barras de homología persistente.En este caso, el barcode ilustra la evolución de las características topológicas presentes en un espacio topológico dado. Se observa que hay componentes conectados (H0) que persisten en un rango amplio de escalas. Además, se detectan algunos ciclos (H1) y cavidades (H2) que persisten en ciertos intervalos de escala, indicando la presencia de estructuras topológicas de mayor dimensión en los datos.
Consulte homología para obtener una introducción a la notación.

La homología persistente es un método para calcular características topológicas de un espacio en diferentes resoluciones espaciales. Las características más persistentes se detectan moviendo un parámetro espacial donde se considera que la mayor persistencia está relacionada con ser características verdaderas del espacio subyacente en lugar de artefactos de muestreo, ruido o una elección particular de parámetros. [1]

Una de sus características principales y por la cual la homología persistente ha sido utilizada en varias ramas fuera de las matemáticas como la biología[2][3]​ ,es su capacidad para extraer información de datos que de otro modo pasarían desapercibidos con los métodos tradicionales de análisis.[4]

Para encontrar la homología persistente de un espacio, primero se debe representar el espacio como un complejo simplicial . Una filtración del complejo simplicial es una secuencia anidada de subconjuntos creciente bajo una distancia en el espacio subyacente . Una filtración simple conocida es la filtración de Čech . [5]​ Una construcción similar utiliza una secuencia anidada de complejos Vietoris-Rips conocida como filtración Vietoris-Rips . [6]

En el análisis topológico de datos, particularmente en el contexto de la homología persistente, se utiliza una representación gráfica llamada diagrama de persistencia para visualizar las características topológicas de una función de valor real. El diagrama de persistencia de una función de valor real f es un multiconjunto de puntos en el plano extendido. Cada punto del diagrama representa una característica homológica en el conjunto de subnivel de f, y sus dos coordenadas son los valores de f en los que la característica aparece y desaparece en los conjuntos de subnivel.[7]

Otra representación gráfica utilizada en la homología persistente es el código de barras (barcode en inglés), que permite visualizar las características topológicas de un conjunto de datos que persisten a lo largo de diferentes escalas o resoluciones[8]​​. Los barcodes permiten resumir y comprender la estructura global de los datos, especialmente cuando estos son de alta dimensión y no pueden ser fácilmente visualizados de manera directa.

En un barcode, cada característica topológica se representa mediante una barra horizontal, donde la posición y longitud de la barra indican, respectivamente, el valor del parámetro en el que aparece y desaparece la característica[8]​. De esta manera, los barcodes brindan una descripción visual concisa de la topología subyacente de los datos y sus propiedades persistentes.

Aplicaciones a la biología computacional

La homología persistente es utilizada como una herramienta para encontrar transferencias horizontales entre diferentes individuos de un linaje taxonómico. [2]​Al usarla con este propósito la topología en dimensión cero de la homología persistente resume la evolución clonal, mientras que la topología en dimensiones superiores proporciona evidencia de eventos de evolución reticulada, como la recombinación y el reordenamiento de segmentos genómicos. Los generadores de estos grupos de homología de mayor dimensión permiten identificar eventos reticulados específicos, y su conteo normalizado provee una cota inferior para la tasa de recombinación o reordenamiento en la historia evolutiva de los virus.[2]

Referencias[editar]

  1. Carlsson, Gunnar (2009). "Topology and data". AMS Bulletin 46(2), 255–308.
  2. a b c Chan, Joseph Minhow; Carlsson, Gunnar; Rabadan, Raul (12 de noviembre de 2013). «Topology of viral evolution». Proceedings of the National Academy of Sciences (en inglés) 110 (46): 18566-18571. ISSN 0027-8424. PMC 3831954. PMID 24170857. doi:10.1073/pnas.1313480110. Consultado el 21 de marzo de 2024. 
  3. Cámara, Pablo G.; Levine, Arnold J.; Rabadán, Raúl (17 de agosto de 2016). «Inference of Ancestral Recombination Graphs through Topological Data Analysis». PLOS Computational Biology 12 (8): e1005071. ISSN 1553-7358. doi:10.1371/journal.pcbi.1005071. Consultado el 16 de abril de 2024. 
  4. Berry, Eric; Chen, Yen-Chi; Cisewski-Kehe, Jessi; Fasy, Brittany Terese (1 de junio de 2020). «Functional summaries of persistence diagrams». Journal of Applied and Computational Topology (en inglés) 4 (2): 211-262. ISSN 2367-1734. doi:10.1007/s41468-020-00048-w. Consultado el 16 de abril de 2024. 
  5. Kerber, Michael; Sharathkumar, R. (2013). «Approximate Čech Complex in Low and High Dimensions». En Cai, Leizhen; Cheng, Siu-Wing, eds. Algorithms and Computation. Lecture Notes in Computer Science (en inglés) 8283. Berlin, Heidelberg: Springer. pp. 666-676. ISBN 978-3-642-45030-3. doi:10.1007/978-3-642-45030-3_62. 
  6. Dey, Tamal K.; Shi, Dayu; Wang, Yusu (30 de enero de 2019). «SimBa: An Efficient Tool for Approximating Rips-filtration Persistence via Simplicial Batch Collapse». ACM Journal of Experimental Algorithmics 24: 1.5:1-1.5:16. ISSN 1084-6654. doi:10.1145/3284360. 
  7. Rote, Günter; Vegter, Gert. Computational Topology: An Introduction. Springer Berlin Heidelberg. pp. 277-312. ISBN 978-3-540-33258-9. Consultado el 18 de abril de 2024. 
  8. a b Carlsson, Gunnar; Zomorodian, Afra; Collins, Anne; Guibas, Leonidas J. (2005-12). «PERSISTENCE BARCODES FOR SHAPES». International Journal of Shape Modeling (en inglés) 11 (02): 149-187. ISSN 0218-6543. doi:10.1142/S0218654305000761. Consultado el 16 de abril de 2024.