viernes. 29.03.2024

Carlos Perales González, doctorando del Programa de Doctorado en Ciencias de los Datos de la Universidad Loyola, ha defendido su tesis de forma virtual en la Universidad Loyola obteniendo una calificación de sobresaliente. En su trabajo titulado “Diversidad Explícita en Modelos de Ensembles de Extreme Learning Machine” ha realizado una serie de trabajos en los que a partir de un algoritmo de aprendizaje automático, ha desarrollado una serie de meta-algoritmos que generalizan los resultados y son capaces de optimizar los resultados obtenidos y hacer así mejores predicciones en inteligencia artificial.

Esta tesis en inteligencia artificial parte de la optimización en la que esta nueva era de la información necesita para gestionar la gran cantidad de datos que se recogen, almacenan y procesan con el fin de anticiparse a situaciones o elaborar estrategias preventivas como observar y prever la variación de precios de la vivienda o reconocer patrones de voz. Todas estas técnicas se aplican utilizando algoritmos matemáticos de aprendizaje.

 

Generalizar para anticiparse mejor a situaciones reales

Esta investigación desarrollada en la tesis ha creado un modelo matemático llamado de entrenamiento de conjunto o Ensembles Extreme capaz de controlar la diversidad de datos y generalizarlos en las ecuaciones, con lo que la generación de predictiores se puede controlar y generalizar para cada caso en particular y anticiparse mejor así a situaciones reales y poder elaborar estrategias preventivas.

La tesis ha sido dirigida ha sido dirigida por el profesor de la Universidad Loyola experto en Ciencia de los Datos David Becerra Alonso, y codirigida por Francisco de Asís Fernández Navarro y Mariano Carbonero Ruz. El Tribunal, ha estado constituido por el doctor Miguel García Torres, de la Universidad Pablo de Olavide, el profesor doctor de la Universidad Loyola Francisco José Martínez Estudillo y por la doctora Aida de Haro García, profesora de la Universidad de Córdoba.

 

Automatizar la interpretación de datos científicos

En esta era de la información, los avances tecnológicos nos han permitido recoger, almacenar y procesar una gran cantidad de datos a los cuales antes no teníamos tan fácil acceso. Ciencias como la física, la economía, la biología, se han visto beneficiados puesto que los datos son necesarios para validar o no hipótesis científicas. Surge este campo que permite automatizar la interpretación de estos datos para así anticiparse a situaciones y elaborar estrategias preventivas.

 

Detectar caras o reconocer la voz

En esta área, los algoritmos de aprendizaje automático supervisado son algoritmos matemáticos que usan datos para inferir una serie de reglas estadísticas que relacionan unas variables de entradas o de salida. De esta manera nos permite predecir una serie de situaciones relacionando únicamente datos obtenidos como por ejemplo la variación de precios de la vivienda, la detección de caras en una fotografía o los reconocimientos de voz, que son las aplicaciones de estos algoritmos en el mundo real.

Estos resultados predictivos se crean a través de correlaciones entre dichas variables de entrada y salida, lo que provoca que estos modelos no siempre estén apegados a la realidad. Además, la dependencia de que haya una gran cantidad de datos para implementar a estos algoritmos provoca que los modelos matemáticos creados sean muy sensibles a estos y con poca capacidad para adaptarse a nuevas situaciones. Por eso se intentan generalizar estos algoritmos a distintas metodologías como el llamado entrenamiento de conjuntos utilizado en esta tesis.

Esta tecnología permite que las predicciones que se obtienen por separado se agrupan en una única predicción menos dependiente de los datos y más generalizable a nuevas situaciones. Así, los resultados de los experimentos han demostrado mejoras estadísticamente significativas en la predicción de datos.  

Esta investigación también trabaja para que estos entrenamientos de conjunto se puedan aplicar a distintos algoritmos supervisados para así ampliar el impacto en investigación a aplicaciones en el mundo real. Se trata de una propuesta novedosa que abre nuevas líneas de investigación en el ámbito de la Ensembles Extreme.