DE LAS REDES NEURONALES RECURRENTES A LOS TRANSFORMADORES: EVOLUCIÓN Y ANÁLISIS CRÍTICO DE LOS PARADIGMAS FUNDAMENTALES DEL APRENDIZAJE PROFUNDO
El aprendizaje profundo (Deep Learning) ha experimentado una evolución significativa durante las últimas décadas, convirtiéndose en uno de los pilares fundamentales de la Inteligencia Artificial moderna. Desde la introducción de las Redes Neuronales Recurrentes (RNN), diseñadas para el procesamiento de secuencias temporales, hasta el desarrollo de las Redes Neuronales Convolucionales (CNN), que revolucionaron la visión por computadora, y la aparición de los Transformadores, que transformaron el procesamiento del lenguaje natural y dieron origen a los actuales modelos fundacionales, cada paradigma ha contribuido de manera decisiva al avance de los sistemas inteligentes (Hochreiter & Schmidhuber, 1997; LeCun et al., 1998; Vaswani et al., 2017). Este capítulo presenta una revisión analítica y crítica de estas tres arquitecturas fundamentales, examinando sus principios de funcionamiento, capacidades computacionales, aplicaciones predominantes y limitaciones inherentes. Se analizan aspectos relacionados con la representación del conocimiento, la capacidad para modelar dependencias complejas, la eficiencia computacional, la escalabilidad y la adaptabilidad a diferentes dominios de aplicación, incluyendo el procesamiento del lenguaje natural, la visión artificial, la robótica y los sistemas inteligentes basados en datos. Asimismo, se discute el impacto que los Transformadores han tenido en el surgimiento de los Foundation Models y la Inteligencia Artificial Generativa, destacando su papel en el desarrollo de sistemas multimodales capaces de integrar texto, imágenes, audio y video dentro de una misma arquitectura (Devlin et al., 2019; Brown et al., 2020; Bommasani et al., 2021). A partir de este análisis, se identifican desafíos abiertos relacionados con la interpretabilidad, el consumo energético, la dependencia de grandes volúmenes de datos y las limitaciones en el razonamiento causal. Finalmente, se argumenta que la evolución del aprendizaje profundo no debe interpretarse como una sustitución lineal de paradigmas, sino como un proceso de complementariedad tecnológica en el que RNN, CNN y Transformadores continúan coexistiendo y aportando soluciones especializadas a problemas específicos. El capítulo concluye identificando las principales tendencias emergentes que probablemente orientarán el desarrollo de la Inteligencia Artificial durante la próxima década, incluyendo arquitecturas híbridas, modelos multimodales, IA Generativa, IA Agéntica y enfoques orientados a la sostenibilidad computacional.
DE LAS REDES NEURONALES RECURRENTES A LOS TRANSFORMADORES: EVOLUCIÓN Y ANÁLISIS CRÍTICO DE LOS PARADIGMAS FUNDAMENTALES DEL APRENDIZAJE PROFUNDO
-
DOI: 10.37572/EdArt_2706261097
-
Palavras-chave: Aprendizaje profundo, Redes Neuronales Recurrentes, Redes Neuronales Convolucionales, Transformadores, Foundation Models, Inteligencia Artificial Generativa, Modelos Multimodales, Análisis Comparativo.
-
Keywords: Deep Learning; Recurrent Neural Networks; Convolutional Neural Networks; Transformers; Foundation Models; Generative Artificial Intelligence; Multimodal Models; Comparative Analysis.
-
Abstract:
Deep Learning has undergone significant evolution over the last decades, becoming one of the fundamental pillars of modern Artificial Intelligence. From the introduction of Recurrent Neural Networks (RNNs), designed for processing temporal sequences, to the development of Convolutional Neural Networks (CNNs), which revolutionized computer vision, and the emergence of Transformers, which transformed natural language processing and gave rise to current foundation models, each paradigm has contributed decisively to the advancement of intelligent systems (Hochreiter & Schmidhuber, 1997; LeCun et al., 1998; Vaswani et al., 2017). This chapter presents an analytical and critical review of these three fundamental architectures, examining their operating principles, computational capabilities, predominant applications, and inherent limitations. It analyzes aspects related to knowledge representation, the ability to model complex dependencies, computational efficiency, scalability, and adaptability to different domains of application, including natural language processing, artificial vision, robotics, and data-driven intelligent systems. Likewise, the chapter discusses the impact that Transformers have had on the emergence of Foundation Models and Generative Artificial Intelligence, highlighting their role in the development of multimodal systems capable of integrating text, images, audio, and video within a single architecture (Devlin et al., 2019; Brown et al., 2020; Bommasani et al., 2021). Based on this analysis, open challenges are identified, including interpretability, energy consumption, dependence on large volumes of data, and limitations in causal reasoning. Finally, it is argued that the evolution of deep learning should not be understood as a linear replacement of paradigms, but rather as a process of technological complementarity in which RNNs, CNNs, and Transformers continue to coexist and provide specialized solutions to specific problems. The chapter concludes by identifying the main emerging trends that will likely guide the development of Artificial Intelligence over the next decade, including hybrid architectures, multimodal models, Generative AI, Agentic AI, and approaches oriented toward computational sustainability.
- Adolfo Meléndez Ramírez
- Francisco Jacob Avila Camacho
- Juan Manuel Stein Carrillo
- Leonardo Miguel Moreno Villalba