Teletrabalho no contexto brasileiro: fatores socioeconômicos, ambientais e de transporte a partir de uma abordagem de aprendizado de máquina
Machine Learning. Modelos de Classificação. Mobilidade Urbana. Determinantes
Socioeconômicos. Pesquisa Nacional por Amostra de Domicílios Contínua
(PNAD Contínua)
O teletrabalho apresenta-se como uma potencial ferramenta para redução de deslocamentos,
economia de custos externos e promoção da qualidade de vida. Neste sentido,
o objetivo geral da pesquisa é investigar a realização do teletrabalho no contexto brasileiro
sob uma perspectiva de machine learning. Inicialmente, foi desenvolvido um modelo
conceitual abrangente das relações entre o teletrabalho e variáveis socioeconômicas, de
transporte e ambientais, com base em uma revisão sistemática da literatura de estudos
publicados até 2025. A análise temporal da literatura evidencia o crescimento do interesse
acadêmico pelo tema, destacando o perfil do teletrabalhador, caracterizado por fatores
como idade, nível educacional, renda e tipo de ocupação. Adicionalmente, são exploradas
as interações entre o teletrabalho e aspectos urbanos, incluindo a adoção de modos de
transporte sustentáveis, como caminhada e ciclismo, bem como sua relação com a expansão
urbana. Os impactos na qualidade de vida também são discutidos, especialmente
no que se refere à flexibilidade de horários e ao equilíbrio entre vida pessoal e profissional.
A tese analisa a evolução do teletrabalho no Brasil no período de 2022 a 2025,
por meio da aplicação de modelos de Machine Learning a microdados representativos da
Pesquisa Nacional por Amostra de Domicílios Contínua, abrangendo aproximadamente
210 mil domicílios por período. Foi implementado um pipeline padronizado envolvendo
pré-processamento dos dados, tratamento de valores ausentes, balanceamento de classes
por subamostragem aleatória, codificação e normalização das variáveis, além da divisão
estratificada dos dados com validação cruzada do tipo k-fold. Foram avaliados nove algoritmos
de classificação, incluindo Regressão Logística Multinomial, Árvores de Decisão,
Random Forest, XGBoost, Máquinas de Vetores de Suporte, MARS e Redes Neurais,
com ajuste de hiperparâmetros por meio do método ANOVA racing. O desempenho dos
modelos apresentou resultados consistentemente elevados (ROC AUC > 0,80) em todos
os períodos analisados. A avaliação da importância das variáveis revela que os principais
preditores do teletrabalho permanecem relativamente estáveis, embora com variações em
sua relevância, destacando-se o aumento da importância do gênero nos períodos mais
recentes. Os resultados evidenciam que o teletrabalho no Brasil é influenciado por uma
combinação de fatores sociodemográficos e ocupacionais, reforçando seu caráter seletivo.
De forma geral, esta tese contribui para a compreensão das múltiplas dimensões do teletrabalho,
articulando evidências teóricas e empíricas. Os achados fornecem subsídios
relevantes para formuladores de políticas públicas, gestores organizacionais e planejadores
urbanos, ao evidenciar como o teletrabalho influencia a dinâmica das cidades e pode
auxiliar no enfrentamento de desafios urbanos contemporâneos.