Problema de la mochila cuadrática

De Wikipedia, la enciclopedia libre

El problema de la mochila cuadrática (QKP), introducido por primera vez en el siglo XIX,[1]​ es una extensión del problema de la mochila que permite términos cuadráticos en la función objetivo: dado un conjunto de elementos, cada uno con un peso, un valor y un beneficio adicional que se puede obtener si se seleccionan dos artículos concretos, determinar la cantidad de artículos que se incluirán en una colección sin exceder la capacidad de la mochila, para maximizar el beneficio general. Por lo general, los problemas de la mochila cuadráticos vienen con una restricción en el número de copias de cada tipo de artículo: 0 o 1. Este tipo especial de QKP forma el problema de la mochila cuadrático 0-1, que fue discutido por primera vez por Gallo et al.[2]​ El problema de la mochila cuadrático 0-1 es una variación de los problemas de la mochila, que combina las características del problema de la mochila ilimitado, el problema de la mochila 0-1 y el problema de la mochila cuadrático.

Definición[editar]

Específicamente, el problema de la mochila cuadrático 0-1 tiene la siguiente forma:

Aquí la variable binaria x i representa si el artículo i está incluido en la mochila, es la ganancia obtenida al seleccionar el elemento i y es el beneficio obtenido si se suman los elementos i y j .
Informalmente, el problema es maximizar la suma de los valores de los artículos en la mochila de modo que la suma de los pesos sea menor o igual a la capacidad de la mochila.

Aplicación[editar]

Como era de esperar, QKP tiene una amplia gama de aplicaciones que incluyen telecomunicaciones, redes de transporte, informática y economía. De hecho, Witzgall analizó por primera vez QKP al seleccionar lugares para ubicar estaciones de ferrocarril secundarias con el fin de maximizar el tráfico global con respecto a una restricción presupuestaria. Un modelo similar se aplica a problemas como considerar la ubicación de aeropuertos, estaciones de ferrocarril o terminales de manipulación de carga.[3]​ Las aplicaciones de QKP en el campo de la informática son más comunes después de los primeros tiempos de su desarrollo: problemas de diseño de compiladores,[4]problema de camarilla,[5][6]​ diseño de integración a muy gran escala (VLSI).[7]​ Además, los problemas de precios parecen ser una aplicación de QKP como lo describen Johnson et al.[8]

Complejidad computacional[editar]

En general, la versión de decisión del problema de la mochila (¿Se puede alcanzar un valor de al menos V bajo una restricción de una determinada capacidad W?) es NP-completa .[9]​ Por lo tanto, una solución dada se puede verificar en tiempo polinómico, mientras que ningún algoritmo puede identificar una solución de manera eficiente.

El problema de la mochila de optimización es NP-difícil y no existe ningún algoritmo conocido que pueda resolver el problema en tiempo polinomial.

Como variación particular del problema de la mochila, el problema de la mochila cuadrático 0-1 también es NP-difícil.

Si bien no existe ningún algoritmo eficiente disponible en la literatura, existe un tiempo pseudopolinomial basado en programación dinámica y otros algoritmos heurísticos que siempre pueden generar "buenas" soluciones.

Resolviendo[editar]

Si bien el problema de la mochila es uno de los problemas de investigación operativa (OR) más comúnmente resueltos, existen algoritmos eficientes limitados que pueden resolver problemas de mochila cuadráticos 0-1. Los algoritmos disponibles incluyen, entre otros, fuerza bruta, linealización,[10]​ y reformulación convexa. Al igual que otros problemas NP-difíciles, suele ser suficiente encontrar una solución viable aunque no sea necesariamente óptima. Algoritmos heurísticos basados en algoritmos codiciosos, la programación dinámica puede brindar una solución relativamente "buena" al QKP 0-1 de manera eficiente.

Fuerza bruta

El algoritmo de fuerza bruta para resolver este problema consiste en identificar todos los subconjuntos posibles de elementos sin exceder la capacidad y seleccionar el que tiene el valor óptimo. El pseudocódigo se proporciona de la siguiente manera:

// Aporte:
//     Ganancias (almacenadas en la matriz p)
//     Beneficios cuadráticos (almacenados en la matriz P)
//     Pesos (almacenados en la matriz w)
//     Número de elementos (n)
//     Capacidad de la mochila (W)

En t máximo = 0
para todo subconjunto S hacer
    en t valor, peso = 0
    para i de 0 a S. tamaño -1 hacer:
        valor = valor + p[i]
        peso = peso + w[i]
            para j de i+1 a S. tamaño -1 hacer: 
                valor = valor + P[i][j]
    si peso <= W entonces:
        si valor > máximo entonces:    
            máximo = valor

Dados n elementos, habrá como máximo subconjuntos y para cada conjunto de candidatos legales, el tiempo de ejecución para calcular los valores obtenidos es . Por tanto, la clase de eficiencia del algoritmo de fuerza bruta es

, siendo exponencial.

Linealización

Los problemas de este tipo son difíciles de resolver directamente utilizando solucionadores estándar y, por lo tanto, la gente intenta reformularlo como un programa lineal utilizando variables auxiliares y restricciones para que el problema pueda resolverse fácilmente utilizando paquetes comerciales. Dos enfoques de linealización bien conocidos para el QKP 0-1 son la linealización estándar y la linealización de Glover.[11][12][13]

Linealización estándar

La primera es la estrategia de linealización estándar, como se muestra a continuación:

LP1: maximizar
sujeto a
para todos
para todos
para todos
para todos
binario

En la formulación LP1, hemos reemplazado el término x i x j con una variable continua z ij . Esto reformula el QKP en un problema de la mochila, que luego podemos resolver de manera óptima utilizando solucionadores estándar.

Linealización de Glover

La segunda reformulación, que es más concisa, se llama linealización de Glover.[14][15][16]​ La formulación de Glover se muestra a continuación, donde L i y U i son límites inferior y superior en

, respectivamente:

LP2: maximizar
sujeto a
para
para
binario

En la formulación LP2, hemos reemplazado la expresión con una variable continua z i . De manera similar, podemos usar solucionadores estándar para resolver el problema linealizado. Tenga en cuenta que la linealización de Glover solo incluye variables auxiliares con restricciones mientras que la linealización estándar requiere variables auxiliares y restricciones para lograr la linealidad.

Reformulación cuadrática convexa

Tenga en cuenta que los programas no lineales son difíciles de resolver debido a la posibilidad de quedar atrapados en un máximo local . Sin embargo, cuando el programa es convexo, cualquier máximo local es el máximo global . Un programa convexo consiste en maximizar una función cóncava o minimizar una función convexa en un conjunto convexo . Un conjunto S es convexo si , dónde . Es decir, cualquier punto entre dos puntos del conjunto también debe ser un elemento del conjunto. Una función f es cóncava si . Una función f es convexa si . Informalmente, una función es cóncava si el segmento de recta que conecta dos puntos en la gráfica se encuentra arriba o sobre la gráfica, mientras que una función es convexa si está debajo o sobre la gráfica. Por lo tanto, al reescribir la función objetivo en una función convexa equivalente, podemos reformular el programa para que sea convexo, lo que se puede resolver utilizando paquetes de optimización.

La función objetivo se puede escribir como usando notación de álgebra lineal. Necesitamos hacer de P una matriz semidefinida positiva para reformular una función convexa. En este caso, modificamos la función objetivo para que sea aplicando resultados de álgebra lineal, donde P es una matriz diagonalmente dominante y, por tanto, una semidefinida positiva. Esta reformulación se puede resolver utilizando un paquete cuadrático entero mixto comercial estándar.[17]

Algoritmo heurístico codicioso

George Dantzig[18]​ propuso un algoritmo de aproximación codiciosa al problema de la mochila ilimitado que también puede usarse para resolver el QKP 0-1. El algoritmo consta de dos frases: identificar una solución inicial y mejorarla.

Primero calcule para cada elemento, la contribución objetiva total realizable al seleccionarlo, y clasifique los artículos en orden decreciente del valor potencial por unidad de peso, . Luego seleccione los artículos con la máxima relación valor-peso en la mochila hasta que no haya espacio para más, lo que constituye la solución inicial. A partir de la solución inicial, la mejora se realiza mediante intercambio por pares. Para cada elemento del conjunto de soluciones, identifique los elementos que no están en el conjunto donde el intercambio da como resultado un objetivo de mejora. Seleccione el par con máxima mejora e intercambie. También hay posibilidades de que eliminar uno del conjunto o agregar uno al conjunto produzca la mayor contribución. Repita hasta que no haya ningún intercambio mejorado. La clase de complejidad de este algoritmo es ya que para el peor de los casos se identificarán todas las combinaciones posibles de elementos.

cuádruple

Quadknap es un algoritmo exacto de rama y límite propuesto por Caprara et al.,[19]​ donde los límites superiores se calculan considerando una relajación lagrangiana que aproxima un problema difícil mediante un problema más simple y penaliza las violaciones de restricciones utilizando el multiplicador de Lagrange para imponer un costo por violaciones. Quadknap libera el requisito de números enteros al calcular los límites superiores. Los multiplicadores lagrangianos subóptimos se derivan de la optimización de subgradiente y proporcionan una reformulación conveniente del problema. Este algoritmo es bastante eficiente ya que los multiplicadores lagrangianos son estables y se adoptan estructuras de datos adecuadas para calcular un límite superior ajustado en el tiempo lineal esperado en el número de variables. Se informó que este algoritmo genera soluciones exactas de instancias con hasta 400 variables binarias, es decir, significativamente más grandes que aquellas que pueden resolverse mediante otros enfoques. El código fue escrito en C y está disponible en línea.[20]

Heurística de programación dinámica

Si bien la programación dinámica puede generar soluciones óptimas a los problemas de la mochila, los enfoques de programación dinámica para QKP[21]​ sólo pueden producir una solución de calidad relativamente buena, que puede servir como límite inferior para los objetivos óptimos. Si bien se ejecuta en tiempo pseudopolinomial, requiere una gran cantidad de memoria.

Algoritmo de programación dinámica

Para simplificar, supongamos que todas las ponderaciones no son negativas. El objetivo es maximizar el valor total sujeto a la restricción: que el peso total sea menor o igual a W. Luego para cada , definir ser el valor del embalaje más rentable de los primeros m artículos encontrados con un peso total de w . Es decir, deja

Entonces, es la solución al problema. Tenga en cuenta que mediante la programación dinámica, la solución a un problema surge de la solución a sus subproblemas más pequeños. En este caso particular, comienza con el primer artículo e intenta encontrar un mejor empaque considerando agregar artículos con un peso esperado de 𝑤. Si el peso del elemento que se va a agregar excede 𝑤, entonces es lo mismo con . Dado que el artículo tiene un peso menor en comparación con el peso deseado, es lo mismo que si sumar no aporta nada, o la misma solución que para una mochila de menor capacidad, concretamente una con la capacidad reducida por el peso de ese artículo elegido, más el valor de un artículo correcto, es decir . Para concluir tenemos que

Nota sobre la clase de eficiencia: claramente el tiempo de ejecución de este algoritmo es , basado en el bucle anidado y el cálculo del beneficio del nuevo embalaje. Esto no contradice el hecho de que QKP sea NP-duro ya que W no es polinomio en la longitud de la entrada.

Algoritmo de programación dinámica revisado

Tenga en cuenta que el algoritmo anterior requiere espacio para almacenar el embalaje actual de artículos para todos los m,w, que pueden no ser capaces de manejar problemas de gran tamaño. De hecho, esto se puede mejorar fácilmente eliminando el índice m de ya que todos los cálculos dependen únicamente de los resultados de la etapa anterior.

Redefinir ser el valor actual del embalaje más rentable encontrado por la heurística. Eso es,

En consecuencia, por programación dinámica tenemos que

Tenga en cuenta que este algoritmo revisado todavía se ejecuta en mientras solo tomaba memoria en comparación con el anterior .

Temas de investigación relacionados[editar]

Los investigadores han estudiado problemas de la mochila cuadráticos 0-1 durante décadas. Un objetivo es encontrar algoritmos o heurísticas eficaces, especialmente aquellos con un rendimiento excepcional para resolver problemas del mundo real. La relación entre la versión de decisión y la versión de optimización del QKP 0-1 no debe ignorarse cuando se trabaja con cualquiera de ellas. Por un lado, si el problema de decisión se puede resolver en tiempo polinómico, entonces se puede encontrar la solución óptima aplicando este algoritmo de forma iterativa. Por otro lado, si existe un algoritmo que puede resolver el problema de optimización de manera eficiente, entonces se puede utilizar para resolver el problema de decisión comparando la entrada con el valor óptimo.

Otro tema en la literatura es identificar cuáles son los problemas "difíciles". Los investigadores que estudian el QKP 0-1 suelen realizar estudios computacionales[22]​ para mostrar la superioridad de sus estrategias. Estos estudios también se pueden realizar para evaluar el rendimiento de diferentes métodos de solución. Para el QKP 0-1, esos estudios computacionales a menudo se basan en datos generados aleatoriamente, presentados por Gallo et al. Básicamente, todos los estudios computacionales del QKP 0-1 utilizan datos que se generan aleatoriamente de la siguiente manera. Las ponderaciones son números enteros tomados de una distribución uniforme en el intervalo [1, 50], y las restricciones de capacidad son un número entero tomado de una distribución uniforme entre 50 y la suma de las ponderaciones de los elementos. Los coeficientes objetivos, es decir, los valores, se eligen aleatoriamente entre [1100]. Se ha observado que generar instancias de esta forma produce problemas con dificultad muy variable e impredecible. Por lo tanto, los estudios computacionales presentados en la literatura pueden no ser sólidos. Así, algunas investigaciones pretenden desarrollar una metodología para generar instancias del QKP 0-1 con un nivel de dificultad predecible y consistente.

Véase también[editar]

Referencias[editar]

  1. C., Witzgall (1975). «Mathematical methods of site selection for Electronic Message Systems (EMS)». NBS Internal Report 76: 18321. Bibcode:1975STIN...7618321W. doi:10.6028/nbs.ir.75-737. 
  2. Gallo, G.; Hammer, P.L.; Simeone, B. (1980). «Quadratic knapsack problems». Mathematical Programming Studies Combinatorial Optimization. Mathematical Programming Studies 12. pp. 132-149. ISBN 978-3-642-00801-6. doi:10.1007/bfb0120892. 
  3. Rhys, J.M.W. (1970). «A Selection Problem of Shared Fixed Costs and Network Flows». Management Science 17 (3): 200-207. doi:10.1287/mnsc.17.3.200. 
  4. Helmberg, C.; Rendl, F.; Weismantel, R. (1996). Quadratic knapsack relaxations using cutting planes and semidefinite programming. «Integer Programming and Combinatorial Optimization». Integer Programming and Combinatorial Optimization Lecture Notes in Computer Science. Lecture Notes in Computer Science 1084. pp. 175-189. ISBN 978-3-540-61310-7. doi:10.1007/3-540-61310-2_14. 
  5. Dijkhuizen, G.; Faigle, U. (1993). «A cutting-plane approach to the edge-weighted maximal clique problem». European Journal of Operational Research 69 (1): 121-130. doi:10.1016/0377-2217(93)90097-7. 
  6. Park, Kyungchul; Lee, Kyungsik; Park, Sungsoo (1996). «An extended formulation approach to the edge-weighted maximal clique problem». European Journal of Operational Research 95 (3): 671-682. doi:10.1016/0377-2217(95)00299-5. 
  7. Ferreira, C.E.; Martin, A.; Souza, C.C.De; Weismantel, R.; Wolsey, L.A. (1996). «Formulations and valid inequalities for the node capacitated graph partitioning problem». Mathematical Programming 74 (3): 247-266. doi:10.1007/bf02592198. 
  8. Johnson, Ellis L.; Mehrotra, Anuj; Nemhauser, George L. (1993). «Min-cut clustering». Mathematical Programming 62 (1–3): 133-151. doi:10.1007/bf01585164. 
  9. Garey, Michael R.; Johnson, David S. (1979). Computers and intractibility: A guide to the theory of NP completeness. New York: Freeman and Co. 
  10. Adams, Warren P.; Sherali, Hanif D. (1986). «A Tight Linearization and an Algorithm for Zero-One Quadratic Programming Problems». Management Science 32 (10): 1274-1290. doi:10.1287/mnsc.32.10.1274. 
  11. Adams, Warren P.; Forrester, Richard J.; Glover, Fred W. (2004). «Comparisons and enhancement strategies for linearizing mixed 0-1 quadratic programs». Discrete Optimization 1 (2): 99-120. doi:10.1016/j.disopt.2004.03.006. 
  12. Adams, Warren P.; Forrester, Richard J. (2005). «A simple recipe for concise mixed 0-1 linearizations». Operations Research Letters 33 (1): 55-61. doi:10.1016/j.orl.2004.05.001. 
  13. Adams, Warren P.; Forrester, Richard J. (2007). «Linear forms of nonlinear expressions: New insights on old ideas». Operations Research Letters 35 (4): 510-518. doi:10.1016/j.orl.2006.08.008. 
  14. Glover, Fred; Woolsey, Eugene (1974). «Technical Note—Converting the 0-1 Polynomial Programming Problem to a 0-1 Linear Program». Operations Research 22 (1): 180-182. doi:10.1287/opre.22.1.180. 
  15. Glover, Fred (1975). «Improved Linear Integer Programming Formulations of Nonlinear Integer Problems». Management Science 22 (4): 455-460. doi:10.1287/mnsc.22.4.455. 
  16. Glover, Fred; Woolsey, Eugene (1973). «Further Reduction of Zero-One Polynomial Programming Problems to Zero-One linear Programming Problems». Operations Research 21 (1): 156-161. doi:10.1287/opre.21.1.156. 
  17. Bliek, Christian; Bonami, Pierre; Lodi, Andrea (2014). Solving Mixed-Integer Quadratic Programming problems with IBM-CPLEX: a progress report. 
  18. Dantzig, George B. (1957). «Discrete-Variable Extremum Problems». Operations Research 5 (2): 266-288. doi:10.1016/j.disopt.2004.03.006. 
  19. Caprara, Alberto; Pisinger, David; Toth, Paolo (1999). «Exact Solution of the Quadratic Knapsack Problem». INFORMS Journal on Computing 11 (2): 125-137. doi:10.1287/ijoc.11.2.125. 
  20. «Quadknap». Consultado el 3 de diciembre de 2016. 
  21. Fomeni, Franklin Djeumou; Letchford, Adam N. (2014). «A Dynamic Programming Heuristic for the Quadratic Knapsack Problem». INFORMS Journal on Computing 26 (1): 173-182. doi:10.1287/ijoc.2013.0555. 
  22. Forrester, Richard J.; Adams, Warren P.; Hadavas, Paul T. (2009). «Concise RLT forms of binary programs: A computational study of the quadratic knapsack problem.». Naval Research Logistics 57: 1-12. doi:10.1002/nav.20364. 

Enlaces externos[editar]