Um framework de código aberto para mineração de dados multiobjetivo
Otimização Multiobjetivo, Seleção de Atributos, Seleção de Instâncias, Algoritmo de Lichtenberg, Aprendizado de Máquina
A mineração de dados multiobjetivo representa um desafio contemporâneo na ciência de dados, buscando o equilíbrio ideal entre a redução drástica da dimensionalidade e a preservação da capacidade preditiva dos modelos. Esta tese de doutorado apresenta o desenvolvimento e a validação do MOLA-PY, um framework de código aberto em Python que implementa o Algoritmo de Lichtenberg Multiobjetivo (MOLA). O algoritmo fundamenta-se na física de descargas elétricas radiais e no conceito de Figuras de Lichtenberg, utilizando uma estrutura de busca heurística que se adapta à topologia do problema. O foco central desta etapa da pesquisa foi o problema de Seleção de Atributos (Feature Selection FS), onde o MOLA foi submetido a um rigoroso processo de benchmarking utilizando 30 conjuntos de dados de diferentes complexidades. O desempenho foi comparado com algo ritmos consolidados na literatura, como NSGA-III, SPEA2, GDE3 e SMPSO, utilizando o classificador K-Vizinhos Mais Próximos (KNN) para avaliação da acurácia. Os resultados, submetidos a análises estatísticas rigorosas através dos testes de Friedman e post-hoc de Nemenyi, demonstraram que o MOLA obteve os melhores rankings médios globais tanto em convergência quanto em diversidade de soluções. Um diferencial crítico observado foi a resiliência do algoritmo em cenários de Big Data e alta dimensionalidade; enquanto algoritmos tradicionais apresentaram degradação nas métricas de Inverted Generational Distance (IGD) e Hypervolume (HV), o MOLA manteve frentes de Pareto consistentes e soluções com alta taxa de compressão. Esta pesquisa não apenas disponibiliza uma ferramenta robusta para a comunidade acadêmica, mas também estabelece a base para a próxima fase do doutorado, que integrará técnicas de Seleção de Instâncias (IS) para permitir a redução bidimensional inteligente de grandes bases de dados