2026-01-052026-01-05https://repositorio.uandes.cl/handle/uandes/68365La evidencia numérica es elocuente, utilizando datos diarios de la plataforma bloomberg en el período julio 2018 a octubre 2024. El modelo MARL, logra un retorno acumulado (RA) de 2.21, reduce el drawdown máximo (DD) a un -14 % y mejora el índice de Sharpe (SH) a 1.39, siendo notablemente superior a modelos de aprendizaje uniagente (RL), con un RA de 2.11, DD de -18 % y un SH de 1.31. El modelo multicriterio entrópico difuso (MED) registra un RA de 2.15, un DD de -17 % y un SH de 1.24. superando en gran medida a los modelos clásicos como Markowitz, con un RA de 1.63, DD de -22 % y SH de 1,07, siendo comparable con modelos RL, pero sin superar a MARL. Con base en los resultados, se plantea un modelo híbrido, a partir de una combinación de estrategias en la que los retornos de cada agente del Modelo RL, son vistos como activos de un portafolio a optimizar mediante un MED, los resultados son competitivos al nivel de MARL, con un RA de 2.18, un DD de -15 % y un SH de 1.33. <br/>Se concluye que la rentabilidad, eficiencia y resiliencia del modelo MARL es sustancialmente mejor. La tensión entre competencia y cooperación se convierte en el motor de innovación y eficiencia en un entorno realista, inspirado en la teoría de juegos y la noción de equilibrio de Nash, se demuestra que la inteligencia distribuida, la competencia-cooperación supervisada y la incorporación explícita de la incertidumbre no solo mejoran los resultados, sino que transforman la propia filosofía de la gestión de capital, cuya metodología es extrapolable a diferentes tipos deproblemas de optimización con asignación bajo incertidumbre.info:eu-repo/semantics/restrictedAccessConstrucción de portafolios de inversión por medio de aprendizaje reforzado multiagente y aplicaciones de lógica difusaDoctoral Thesis