Aprendizaje Automático Cuántico

De Wikipedia, la enciclopedia libre

El Aprendizaje Automático Cuántico es un área de investigación interdisciplinar, situada entre la mecánica cuántica y la Inteligencia Artificial, que suma esfuerzos para combinar la mecánica cuántica y el aprendizaje automático.[1][2]

El aprendizaje automático cuántico puede identificarse como un método híbrido de aprendizaje mediante algoritmos clásicos aplicados a estados de naturaleza cuántica (transiciones de fase en un sistema cuántico), o también, como un algoritmo cuántico (empleando puertas lógicas cuánticas, aprovechando las propiedades de la mecánica cuántica) que estudia un conjunto de datos clásicos.

Esta tendencia se ha acelerado gracias a las recientes inversiones de empresas como Google y Microsoft en computación cuántica. Sin embargo el aprendizaje automático cuántico está todavía en su etapa inicial y necesita mayores fundamentos teóricos así como resultados científicos sólidos para llegar a ser una disciplina académica.

Mejoras del aprendizaje automático cuántico[editar]

Existen diferentes formas de aprendizaje automático:[3]​ el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje por refuerzo. Para cada uno de estos campos, existen algoritmos a los que podemos encontrar una extensión cuántica, mediante propiedades cuánticas como el entrelazamiento o la superposición, entre otras.

Los algoritmos o modelos de aprendizaje automático cuántico intentan usar las ventajas de la información cuántica con el fin de mejorar el aprendizaje automático clásico, por ejemplo desarrollando implementaciones eficientes de pesados algoritmos clásicos mediante computación cuántica.[4][5]

Además, el aprendizaje automático cuántico incluye también la aproximación recíproca, aplicando los métodos de aprendizaje automático clásico a la teoría de la información cuántica. Ya en su nacimiento, el aprendizaje automático cuántico reunió grandes expectativas de proporcionar una solución al análisis de grandes volúmenes de datos utilizando el poder del paralelismo de la computación cuántica.[6]

Son una serie de ideas de como adaptar los métodos clásicos de aprendizaje automático a los procesos de computación cuántica.[7][8]​ Los algoritmos que permiten mejorar el aprendizaje automático típicamente requieren codificar un conjunto de datos clásicos en un ordenador cuántico, que permita el procesamiento de información cuántica con el objetivo de crear un algoritmo capaz de aprender a resolver un problema.

Aprendizaje supervisado[editar]

El aprendizaje supervisado, usualmente enfocado a problemas relacionados con el análisis de datos, es un método de aprendizaje para el cual se dan una serie de datos, que están clasificados por una clase, este sería el ejemplo que usa el programa para clasificar nuevos datos. Por ejemplo, cuando recibimos correo, y lo clasificamos como spam, la próxima vez un correo con las mismas características (ó similares) será enviado a la bandeja de spam.

Máquinas de soporte vectorial cuánticas[editar]

Las máquinas de soporte vectorial pueden ser implementadas en un ordenador cuántico usando una combinación de algoritmos cuánticos ya conocidos.[9]​ Con el fin de construir el hiper-plano que separa el conjunto de datos para las tareas de clasificación, la ecuación lineal para la formulación dual o de mínimos cuadrados se resuelve utilizando un algoritmo cuántico para resolver ecuaciones lineales.[10]​ Una tarea importante es construir una matriz de densidad cuyas entradas se corresponden con las de la matriz del núcleo. La extracción de la información del estado final puede hacerse a través del análisis de componentes principales cuántico.[11]​ La clasificación de una nueva entrada se lleva a cabo a través de un ensayo de intercambio. La máquina de soporte vectorial cuántico se ejecuta en tiempo logarítmico respecto a la dimensión del espacio de características y el número de vectores de entrenamiento, mientras que la solución clásica tiene una dependencia polinómica.[11]​ Los primeros experimentos en máquinas de soporte vectorial cuánticas ya han sido realizados.[12]

Redes neuronales cuánticas[editar]

Se denomina Red neuronal cuántica al análogo cuántico de las redes neuronales clásicas. La extensión cuántica de las redes neuronales clásicas suscita un problema, y es que la dinámica de las Redes neuronales clásicas se rige por funciones de activación, que en general, asumimos que nunca son funciones lineales, porque se ha demostrado que son mucho más rápidas en la optimización de los parámetros de las neuronas. Siguen habiendo funciones lineales pero han quedado para redes que se utilizan con fines didácticos. Y el problema es este, que no son lineales, a diferencia de la mecánica cuántica, que sí es lineal. Para solventar este problema se emplean métodos RUS (repeat until success), simulando funciones no lineales (en contraposición con la naturaleza del Hamiltoniano), para especular con un conjunto de datos. El problema es que entonces existen ciertos estados que no pueden ser observados y generan oscilaciones específicas.

Las maneras más reconocidas para implementar redes neuronales cuánticas: empleando fotones, circuitos variacionales en capas o con modelos cuánticos del tipo Ising.

Las redes neuronales cuánticas fueron inicialmente investigadas desde una perspectiva diferente, el papel de los efectos cuánticos en los circuitos neuronales.[13]​ Sin embargo, el debate pasó rápidamente hacia un enfoque puramente computacional en versiones cuánticas de redes neuronales artificiales, las cuales juegan un papel importante en el aprendizaje automático. Una serie de ideas sobre modelos de redes neuronales cuánticas se han publicado desde entonces.[14][15][16][17][18]​ Un enfoque interesante para el aprendizaje automático cuántico es el modelo de memoria asociativa cuántica basado en el algoritmo de Grover.[19]

Todavía no se ha demostrado si realmente de forma general, el método de las redes de neuronas cuánticas aporta ventajas a la hora de resolver un problema de Inteligencia Artificial. Sin embargo, Google e IBM demuestran que existen problemas de alta complejidad con ciertas características en los que este método permite una convergencia de la red con mayor precisión y velocidad.[20][21]

Aprendizaje no supervisado[editar]

El aprendizaje no supervisado, al igual que el aprendizaje supervisado, se dedica a resolver problemas de agrupamiento de datos, sin embargo en este escenario, al programa se le dan un ejemplo de los datos pero no de las clases a las que pertenecen. Existen varios métodos aunque aquí no se incluyan todos.

Algoritmos cuánticos de agrupamiento y métodos K-nn[editar]

Los algoritmos de aprendizaje cuántico tales como K-means o el método K-vecinos más cercanos están basados en calcular la distancia entre los vectores de características y la selección más próxima (ya sea para identificar el grupo centroide más cercano o los vecinos más cercanos a un determinado vector de características). La implementación de estos métodos, basados en la distancia en un ordenador cuántico significa en primer lugar encontrar una manera de calcular distancias clásicas con algoritmos cuánticos. Una idea frecuente es emplear la superposición de dos funciones de onda cuidadosamente preparadas como media de la distancia entre dos estados cuánticos.

Métodos de amplificación de amplitudes basados en el algoritmo de Grover permiten resolver problemas de búsqueda no estructurados con una optimización cuadrática, en comparación con algoritmos clásicos. La distancia mínima puede ser encontrada mediante el Algoritmo de Grover.[22][23]​ Los algoritmos de aprendizaje automático basados en la distancia, tales como la agrupación sin supervisión, pueden ser implementados a través de la computación cuántica adiabática la cual mejora a la computación clásica de para el algoritmo de Lloyd a (donde M es el número de vectores de datos N-dimensional y K es el número de agrupaciones).[24]

Aprendizaje por Refuerzo cuántico[editar]

El aprendizaje por Refuerzo cuántico, en contraposición con los anteriores métodos de aprendizaje automático cuántico, se dedica a estudiar problemas relacionados con la elección óptima de una estrategia bajo ciertas condiciones, es decir, puede resolver problemas asociados a teoría de juegos, teorías de control óptimo, investigación de operaciones y teoría de la información.

En este método se tiene un agente, que interacciona con el entorno produciéndose un cambio del mismo a un nuevo estado, y en función de la bondad de la acción, el agente recibe una recompensa mejor o peor. De nuevo, el agente vuelve a interactuar con el entorno mediante una de las acciones posibles y se vuelve a analizar la bondad de la acción entre los dos estados del entorno. Este proceso se repite hasta que se llega a un estado final del entorno que es el que se busca alcanzar, lo que denominamos como un episodio. Una vez termina un episodio se repite de nuevo el procedimiento, pero esta vez el agente ya tiene más conocimiento de la bondad de sus acciones desde ciertos estados del entorno. Una vez se completan varios episodios se comparan las estrategias de todos los episodios ejecutados para ver cual ha sido la mejor estrategia.

En el aprendizaje por refuerzo cuántico, se aprovecha la propiedad de la superposición, ahora los estados del entorno y los estados de las acciones se expresan como una combinación lineal de auto-acciones y auto-estados del entorno. Partiendo de un estado del entorno se ejecutan todas las acciones a la vez y se estudian las recompensas asociadas a cada acción, se mide el sistema y se escoge la acción con mayor recompensa. Este proceso se realiza de forma iterativa. Los episodios necesarios para encontrar la estrategia óptima se aceleran cuadráticamente.[25]

Métodos de aprendizaje automático para información cuántica[editar]

El aprendizaje automático cuántico también puede ser usado para los enfoques que aplican métodos clásicos de aprendizaje automático a los problemas de la teoría de la información cuántica. Por ejemplo, cuando los físicos experimentales tienen que lidiar con información incompleta de una fuente o sistema cuántico, la estadística bayesiana y los conceptos de aprendizaje algorítmico pueden ser fructíferamente aplicados. Otro ejemplo sería la tomografía del estado cuántico, donde el estado cuántico es aprendido por el hecho de medir. Esto incluye aproximaciones de aprendizaje automático para la clasificación del estado cuántico, el aprendizaje del Hamiltoniano y el aprendizaje de una transformación unitaria.

Teoría del aprendizaje cuántico[editar]

La teoría del aprendizaje cuántico, todavía una disciplina en pleno desarrollo, insiste en el análisis matemático de generalizaciones cuánticas para modelos de aprendizaje automático clásico, de cara a optimizar la teoría clásica. El enfoque es bastante similar a la teoría de aprendizaje clásico, pero en este caso, el agente (cuya misión es aprender) es un dispositivo procesador de información cuántica, independientemente de que los datos sean clásicos o cuánticos. El objetivo de la teoría del aprendizaje cuántico es el estudio de problemas específicos que resuelve la teoría de aprendizaje clásico pero empleando protocolos cuánticos de cara a optimizar la resolución de estos problemas. Aunque sea una disciplina todavía en desarrollo, se han encontrado buenos resultados en esta dirección.[26]

Inversiones empresariales en la investigación del aprendizaje automático cuántico[editar]

Los experimentos más recientes emplearon el ordenador cuántico adiabático D-Wave para detectar coches en imágenes digitales empleando aumentos regulados con funciones objetivo no-convexas en una demostración en 2009.[27]​ No solo el mundo académico sino también las empresas líderes en las tecnologías de la información muestran interés en el potencial del aprendizaje automático cuántico. Google Research lanzó su laboratorio cuántico de inteligencia artificial en 2013,[28]​ el cual es una iniciativa conjunta con la NASA y la asociación de universidades de investigación espacial. Una baza importante es el controvertido debate sobre el ordenador cuántico D-Wave.[29]​ También Microsoft parece interesado en el tema y Peter Lee anunció que va a aumentar la actividad de las empresas en la computación cuántica .[30]

Empleando otro tipo de tecnología basada en la resonancia nuclear magnética (NMR), una red cuántica de Hopfield fue implementada en 2009 que mapea los datos de entrada y memorizados a Hamiltonianos, permitiendo el uso de computación cuántica adiabática.[31]​ NMR también tolera la computación cuántica universal, y fue empleada para la primera implementación experimental de una máquina cuántica de soporte vectorial para distinguir los números escritos a mano '6' y '9' para un ordenador cuántico en estado líquido (2015).[32]

Implementaciones fotónicas son el punto de mira de muchas empresas,[33]​ ya que no requieren el gran enfriamiento requerido en ordenadores cuánticos. Empleando fotónica no lineal para implementar un clasificador linear de todas las ópticas, se creó un modelo de perceptrón capaz de aprender los delimitadores de clasificación de forma iterativa mediante conjuntos de datos ejemplo mediante una regla basada en la retroalimentación.[34]​ En 2015 se demostró experimentalmente que mediante cúbits entrelazados en un ordenador fotónico cuántico se podía medir la distancia clásica entre dos vectores de forma más eficiente que con un ordenador clásico,[35]​ pilar fundamental de muchos algoritmos de aprendizaje automático.

Desde 2016, IBM ha lanzado una nube online para desarrolladores de softwares cuánticos, llamada IBM Quantum Experience. Esta plataforma está formada por varios procesadores cuánticos completamente operativos accesibles en la IBM API Web. La compañía esta motivando desarrolladores de software a crear nuevos algoritmos a partir de este entorno de desarrollo con capacidades cuánticas. Nuevos diseños, de hasta 32 cúbits, están siendo explorados en bases experimentales, empleando celdas de iones atrapados y ordenadores cuánticos superconductores.

En 2019, la introducción de Generadores Cuánticos de Números Aleatorios (QRNGs) en modelos de aprendizaje automático, incluyendo redes neuronales cuánticas y redes neuronales convolucionadas para distribuciones aleatorias iniciales muestran mayor habilidad comparados con el método clásico de Generadores Pseudoaleatorios de Números (PRNGs).[36]​ Sin embargo, en 2021 se demuestra que el uso de QRNGs en redes neuronales no aporta ninguna ventaja significativa en comparación con el uso de PRNGs.[37]

Véase también[editar]

Referencias[editar]

  1. Maria Schuld, Ilya Sinayiskiy, and Francesco Petruccione (2014) An introduction to quantum machine learning, Contemporary Physics, DOI: 10.1080/00107514.2014.964942 (preprint avaiable at arXiv:1409.3097)
  2. Wittek, Peter (2014). Quantum Machine Learning: What Quantum Computing Means to Data Mining. Academic Press. ISBN 978-0-12-800953-6. 
  3. M. Schuld, I. Sinayskiy, F. Petruccione. «An introduction to quantum machine learning». Contemporary Physics, 56:2, 172-185 (2015). doi:10.1080/00107514.2014.964942. 
  4. see for example, Nathan Wiebe, Ashish Kapoor, and Krysta M. Svorey (2014) Quantum Algorithms for Nearest-Neighbor Methods for Supervised and Unsupervised Learning, arXiv:1401.2142v2
  5. Seth Lloyd, Masoud Mohseni, and Patrick Rebentrost (2014) Quantum algorithms for supervised and unsupervised machine learning, arXiv:1307.0411v2
  6. «How Quantum Computers and Machine Learning Will Revolutionize Big Data». WIRED. Consultado el 26 de noviembre de 2014. 
  7. For a review, see Maria Schuld, Ilya Sinayiskiy, and Francesco Petruccione (2014) An introduction to quantum machine learning, Contemporary Physics, DOI: 10.1080/00107514.2014.964942 (upcoming, preprint avaiable at arXiv:1409.3097)
  8. Paparo, G. D., Dunjko, V., Makmal, A., Martin-Delgado, M. A. and Briegel, H. J. «Quantum speedup for active learning agents». Phys. Rev. X 4, 031002. doi:10.1103/PhysRevX.4.031002. 
  9. Patrick Rebentrost, Masoud Mohseni, and Seth Lloyd (2014) Quantum support vector machine for big data classification, Physical Review Letters 113 130501
  10. Aram W. Harrow, Avinatan Hassidim and Seth Lloyd (2009) Quantum Algorithm for Linear Systems of Equations, Physical Review Letters 103 150502
  11. a b Seth Lloyd, Masoud Mohseni, and Patrick Rebentrost (2014) Quantum principal component analysis, Nature Physics 10 pp. 631-633
  12. Zhaokai Li, Xiaomei Liu, Nanyang Xu,1, and Jiangfeng Du (2014) Experimental Realization of Quantum Artificial Intelligence, arXiv preprint arXiv:1410.1054v1
  13. Kak (1995). «Quantum neural computing, Advances in Imaging and Electron Physics 94». Sciencedirect.com. pp. 259-313. Consultado el 26 de noviembre de 2014. 
  14. for example, Menneer, T., Narayanan, A. (1995) Quantum-inspired neural networks. Department of Computer Science, University of Exeter, UK, Technical Report 32
  15. Altaisky, M.V. (2001) Quantum neural network. ArXiv quant-ph/0107012
  16. Zak, M., Williams, C.P. (1998) Quantum neural nets. International Journal of Theoretical Physics 37(2), pp. 651–684
  17. Behrman, E.C., Steck, J.E., Skinner, S.R. (1999) A spatial quantum neural computer. In: International Joint Conference on Neural Networks, IEEE IJCNN’99, Vol. 2, pp. 874–877
  18. Purushothaman, G., Karayiannis, N.B. (1997) Quantum neural networks (qnns): inherently fuzzy feedforward neural networks. IEEE Trans. Neural Netw. 8(3), pp. 679–693
  19. Dan Ventura, and Tony Martinez (2000) Quantum associative memory, Information Sciences 124 pp. 273-296
  20. Hsin-Yuan Huang, Michael Broughton, Masoud Mohseni, Ryan Babbush, Sergio Boixo, Hartmut Neven, Jarrod R. McClean. «Power of data in quantum machine learning». Nature Communications, Vol.12, No. 2631 (2021). doi:10.1038/s41467-021-22539-9. 
  21. Amira Abbas, David Sutter, Christa Zoufal, Aurélien Lucchi, Alessio Figalli, Stefan Woerner. «The power of quantum neural networks». Nat Comput Sci 1, 403-409 (2021). doi:10.1038/s43588-021-00084-1. 
  22. C. Duerr and P. Hoyer (1996), A quantum algorithm for finding the minimum, arXiv preprint quantph/ 9607014
  23. Esma Aïmeur, Gilles Brassard, Sébastien Gambs (2013) Quantum speed-up for unsupervised learning, Machine Learning 90, pp. 261-287
  24. Seth Lloyd, Masoud Mohseni, and Patrick Rebentrost Quantum algorithms for supervised and unsupervised machine learning, arXiv preprint arXiv:1307.0411v2
  25. Daoyi Dong, Chunlin Chen, Hanxiong Li, Tzyh-Jong Tarn. «Quantum reinforcement learning». IEEE Transactions on Systems Man and Cybernetics Part B: Cybernetics, Vol. 38, No. 5, pp.1207-1220, 2008. doi:10.1109/TSMCB.2008.925743. 
  26. Arunachalam, Srinivasan, de Wolf, Ronald. [arXiv:1701.06806 «A Survey of Quantum Learning Theory»]. arXiv:1701.06806. 
  27. «NIPS 2009 Demonstration: Binary Classification using Hardware Implementation of Quantum Annealing». Static.googleusercontent.com. Consultado el 26 de noviembre de 2014. 
  28. «Google Quantum A.I. Lab Team - Google+». Plus.google.com. Consultado el 26 de noviembre de 2014. 
  29. «NIPS 2009 Demonstration: Binary Classification using Hardware Implementation of Quantum Annealing» (PDF). Static.googleusercontent.com. Consultado el 26 de noviembre de 2014. 
  30. «Microsoft Leans on Machine Learning and Quantum Computing in New Research Strategy - MIT Technology Review». MIT Technology Review. Archivado desde el original el 4 de enero de 2015. Consultado el 26 de noviembre de 2014. 
  31. Neigovzen, Rodion; Neves, Jorge L.; Sollacher, Rudolf; Glaser, Steffen J. (2009). «Quantum pattern recognition with liquid-state nuclear magnetic resonance». Physical Review A 79 (4): 042321. Bibcode:2009PhRvA..79d2321N. S2CID 119115625. arXiv:0802.1592. doi:10.1103/PhysRevA.79.042321. 
  32. Li, Zhaokai; Liu, Xiaomei; Xu, Nanyang; Du, Jiangfeng (2015). «Experimental Realization of a Quantum Support Vector Machine». Physical Review Letters 114 (14): 140504. Bibcode:2015PhRvL.114n0504L. PMID 25910101. arXiv:1410.1054. doi:10.1103/PhysRevLett.114.140504. 
  33. Wan, Kwok-Ho; Dahlsten, Oscar; Kristjansson, Hler; Gardner, Robert; Kim, Myungshik (2017). «Quantum generalisation of feedforward neural networks». NPJ Quantum Information 3 (36): 36. Bibcode:2017npjQI...3...36W. S2CID 51685660. arXiv:1612.01045. doi:10.1038/s41534-017-0032-4. 
  34. Tezak, Nikolas; Mabuchi, Hideo (2015). «A coherent perceptron for all-optical learning». EPJ Quantum Technology 2. Bibcode:2015arXiv150101608T. S2CID 28568346. arXiv:1501.01608. doi:10.1140/epjqt/s40507-015-0023-3. 
  35. Cai, X.-D.; Wu, D.; Su, Z.-E.; Chen, M.-C.; Wang, X.-L.; Li, Li; Liu, N.-L.; Lu, C.-Y. et al. (2015). «Entanglement-Based Machine Learning on a Quantum Computer». Physical Review Letters 114 (11): 110504. Bibcode:2015PhRvL.114k0504C. PMID 25839250. S2CID 44769024. arXiv:1409.7770. doi:10.1103/PhysRevLett.114.110504. 
  36. Bird, Jordan J.; Ekárt, Anikó; Faria, Diego R. (28 de octubre de 2019). «On the effects of pseudorandom and quantum-random number generators in soft computing». Soft Computing (Springer Science and Business Media LLC) 24 (12): 9243-9256. ISSN 1432-7643. doi:10.1007/s00500-019-04450-0. 
  37. Heese, Raoul; Wolter, Moritz; Mücke, Sascha; Franken, Lukas; Piatkowski, Nico (2021). «On the effects of biased quantum random numbers on the initialization of artificial neural networks». arXiv:2108.13329  [quant-ph]. 

Bibliografía[editar]

  • Michael A Nielsen and Isaac L Chuang. Quantum computation and quantum information. Cambridge University Press, 2010.
  • Elizabeth C Behrman and James E Steck. A quantum neural network computes its own relative phase. arXiv preprint arXiv:1301.2808, 2013.
  • Maria Schuld, Ilya Sinayskiy, and Francesco Petruccione. The quest for a quantum neural network. Quantum Information Processing, DOI 10.1007/s11128-014-0809-8, 2014.
  • Seth Lloyd, Masoud Mohseni, and Patrick Rebentrost. Quantum algorithms for supervised and unsupervised machine learning. arXiv preprint arXiv:1307.0411, 2013.