Banca de DEFESA: LEANDRO DUARTE PEREIRA

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE : LEANDRO DUARTE PEREIRA
DATA : 23/09/2025
HORA: 09:00
LOCAL: Itajubá - Programa de Pós-Graduação em Engenharia de Produção- Online
TÍTULO:

ABORDAGENS EFICIENTES PARA CLASSIFICAÇÃO BINÁRIA EM BASES DE DADOS EXTREMAMENTE DESBALANCEADAS


PALAVRAS-CHAVES:

Desbalanceamento Extremo de Classes, Classificação Binária, Revisão Sistemática da Literatura (RSL), Geração de Dados Sintéticos, Design de Experimentos (DoE)


PÁGINAS: 91
RESUMO:

Lidar com dados extremamente desbalanceados em tarefas de classificação binária representa um desafio recorrente em diversos domínios, pois a baixa prevalência da classe minoritária (<1%) compromete a confiabilidade e o desempenho preditivo dos modelos. Embora a literatura apresente um número expressivo de estudos sobre o desbalanceamento, o cenário de desbalanceamento extremo ainda carece de investigações aprofundadas. Nesse contexto, esta tese desenvolveu duas frentes complementares de pesquisa. Na primeira, foi conduzida uma Revisão Sistemática da Literatura (RSL), seguindo rigoroso protocolo de seleção e qualidade, a partir da qual 22 estudos primários foram analisados em 52 bases de dados. Os resultados indicaram que abordagens combinadas apresentam desempenho superior em diversos cenários, destacando-se técnicas de sobreamostragem (oversampling) associadas a ensembles, em especial a combinação de Floresta Aleatória (Random Forest – RF) com métodos derivados da Técnica de Sobreamostragem de Minorias Sintéticas (Synthetic Minority Oversampling Technique – SMOTE). Na segunda frente, propõe-se uma abordagem inovadora baseada em Design de Experimentos (DoE) para geração de conjuntos de dados sintéticos em condições de desequilíbrio extremo. A estrutura permite a manipulação controlada de seis fatores críticos (dimensionalidade, tamanho da amostra, razão de desbalanceamento, tipo de função de resposta, limiar de decisão e variabilidade do erro), possibilitando experimentação sistemática e replicável. Experimentos realizados com Random Forest combinado ao SMOTE evidenciaram a utilidade da estrutura para analisar o impacto de fatores e interações, sendo identificada, por meio de Análise de Variância (ANOVA), a relevância da dimensionalidade e da variabilidade do erro no comportamento do classificador. Assim, os achados da Revisão Sistemática da Literatura e a estrutura experimental proposta contribuem de forma integrada para o avanço do conhecimento e para o desenvolvimento de métodos mais robustos em cenários de classificação binária sob desbalanceamento extremo.


MEMBROS DA BANCA:
Presidente - 1041451 - PEDRO PAULO BALESTRASSI
Interna - 3141783 - JULIANA HELENA DAROZ GAUDENCIO
Interno - 3291994 - MATHEUS BRENDON FRANCISCO
Externo ao Programa - ***.838.466-** - FABRICIO ALVES DE ALMEIDA - UNIFEI
Externo à Instituição - PAULO ROTELLA JUNIOR - UFPB
Externo à Instituição - WESLEY VIEIRA DA SILVA - UFAL
Notícia cadastrada em: 19/08/2025 10:15
SIGAA | DTI - Diretoria de Tecnologia da Informação - (35) 3629-1080 | Copyright © 2006-2025 - UFRN - sigaa01.unifei.edu.br.sigaa01