Ementa/Descrição: |
Esta disciplina almeja apresentar os principais conceitos de Ciências dos Dados e Big Data através da linguagem de programação R. Espera-se oferecer algo que seja útil aos alunos, de modo que possam trabalhar também com dados reais do seu universo de estudo e pesquisa. Entre os principais tópicos podemos destacar: apresentação da linguagem R e uma revisão de estatística multivariada; apresentação do tidyverse e seus principais pacotes (ggplot, dplyr, tidyr, readr, purrr, tibble, stringr, forcats), com destaque para os recursos eficientes para manipular dados volumosos, em grandes matrizes multidimensionais (e esparsas), visualização de dados complexos, processamento paralelo multithreading/multicore etc. |