Meta-otimização dos Hiperparâmetros do Algoritmo XGBoost para classificação binária: uma integração entre Planejamento de Experimentos e o Método da Interseção Normal à Fronteira
Otimização de hiperparâmetros; Planejamento de experimentos; Superfície de resposta; Otimização multiobjetivo; Interseção Normal à Fronteira; Extreme Gradient Boosting.
A calibração de hiperparâmetros é decisiva para o desempenho preditivo e o custo computacional de modelos de aprendizagem de máquina. Em classificação binária com Extreme Gradient Boosting, esse ajuste é inerentemente multiobjetivo: busca-se maximizar a qualidade preditiva e, simultaneamente, minimizar o tempo de execução. Este trabalho propõe um arcabouço metodológico que integra Planejamento de Experimentos, Metodologia de Superfície de Resposta, Análise Fatorial e o método Interseção Normal à Fronteira para orientar a seleção de hiperparâmetros do Extreme Gradient Boosting sob um orçamento fixo de avaliações. A exploração inicial do espaço é conduzida por um delineamento composto central face centrada fracionário, totalizando 88 configurações. As respostas (acurácia, precisão, revocação, especificidade e tempo) são obtidas sob protocolo reprodutível com replicações e sintetizadas por escores fatoriais derivados de análise de componentes principais com rotação Varimax. Esses escores permitem definir funções objetivo de qualidade e de custo, reduzindo a redundância entre métricas e favorecendo a interpretação de trade-offs. Em seguida, modelos quadráticos de Metodologia de Superfície de Resposta são ajustados às funções objetivo e empregados pela Interseção Normal à Fronteira para amostrar uma fronteira de Pareto aproximadamente uniforme; as soluções candidatas são reavaliadas no modelo real e uma configuração final de compromisso é selecionada. A proposta é comparada, sob orçamento equivalente, com busca em grade, busca aleatória, otimização bayesiana e Hyperopt. Os resultados indicam redução substancial do custo computacional: o método proposto alcança tempo médio por fold de 0,078 s e tempo médio total de 162 s, com reduções de 9% a 71% no tempo total em relação aos benchmarks, mantendo desempenho preditivo elevado e estável entre réplicas. Conclui-se que a integração entre Planejamento de Experimentos e Interseção Normal à Fronteira constitui uma alternativa parcimoniosa, interpretável e replicável para calibração multiobjetivo de hiperparâmetros, com potencial de generalização para outros algoritmos da família Gradient Boosting Decision Trees e cenários com restrições de custo.