Prototipação de um sistema de apoio ao diagnóstico de TEA baseado em imagens de ressonância magnética e aprendizado de máquina
Transtorno do Espectro Autista, Aprendizado de Máquina, rs-fMRI,Preprocessamento, Conectividade Funcional
O Transtorno do Espectro Autista (TEA) é um transtorno do neurodesenvolvimento cujo diagnóstico permanece centrado em critérios comportamentais, o que pode introduzir atrasos e variabilidade interavaliadores. A ressonância magnética funcional em estado de repouso (rs-fMRI) permite investigar a conectividade funcional do cérebro e, combinada a modelos de aprendizado de máquina, tem sido explorada como apoio ao diagnóstico. Contudo, as escolhas de parâmetros de configuração e estratégias de preprocessamento exercem
forte influência na qualidade das características e, consequentemente, no desempenho e na reprodutibilidade dos classificadores. Este trabalho avalia o impacto de configurações de preprocessamento de rs-fMRI no
desempenho de modelos para classificação de TEA. Foi desenvolvido um software modular que automatiza o preprocessamento das imagens, a extração e seleção de características, o treinamento e a avaliação de diversos classificadores. Foram utilizados os dados do dataset ABIDE I e II. Inicialmente, formou-se um conjunto balanceado por gênero com 72 participantes (metade dos quais com TEA), sobre o qual foram aplicadas 108 diferentes configurações de preprocessamento, variando parâmetros de suavização espacial, limiar de máscara, remoção de ruído e redução de dimensionalidade. Características de conectividade foram derivadas por correlação completa (FC), correlação parcial (PC) e sua combinação (FC+PC), seguidas de testes estatísticos e seleção incremental das características por ordem de importância. Treze algoritmos de classificação foram avaliados com validação leave-one-out, variando incrementalmente o número de características utilizadas, o que totalizou 113.698 experimentos.
Nesse conjunto inicial, a melhor acurácia atingiu 95,8% e especificidade 100%, com destaque para classificadores baseados em multilayer perceptron (MLP) e para o uso combinado de características FC+PC. Em seguida, para simular e avaliar a performance desses modelos em um cenário mais próximo da prática clínica, foram selecionados os pipelines de preprocessamento que obtiveram os melhores resultados na etapa anterior e aplicados a um conjunto estendido de 216 novos participantes. Os modelos de classificação foram
treinados utilizando os participantes da primeira etapa e testados nesse novo conjunto, em que foi constatada redução para 61,4% de acurácia e 58,4% de especificidade. Os resultados reforçam a sensibilidade do desempenho às configurações de preprocessamento e apontam a necessidade de estratégias que privilegiem a capacidade de generalização.