1.1 O que é Ciência de Dados?

Ciência de dados não se trata apenas de aprendizado de máquina e estatística, também não é somente sobre predição. Também não é uma disciplina totalmente contida nos campos STEM (Ciências, Tecnologia, Engenharia e Matemática) (Meng, 2019). Entretanto, podemos afirmar com certeza que ciência de dados é sempre sobre dados. Nossos objetivos com este livro são dois:

Explicamos porque Julia é uma linguagem extremamente eficaz para a ciência de dados em Section 2. Por enquanto, vamos focar nos dados.

1.1.1 Alfabetização de dados

De acordo com a Wikipedia, a definição formal para alfabetização de dados é “a habilidade de ler, entender, criar e comunicar dados enquanto informação.”. Também gostamos da concepção informal de que, ao se tornar alfabetizado em dados, você não se sentirá sufocado pelos dados, mas sim, saberá utilizá-los na tomada correta de decisões. Alfabetização de dados é uma habilidade extremamente competitiva. Neste livro iremos abordar dois importantes aspectos da alfabetização de dados:

  1. Manipulação de dados com DataFrames.jl (Section 4). Neste capítulo, você aprenderá a:
    1. Ler dados em CSV e Excel com Julia.
    2. Processar dados em Julia, ou seja, aprender a responder questões com dados.
    3. Filtrar dados e criar subconjuntos de dados.
    4. Lidar com dados faltantes.
    5. Unir e combinar dados provenientes de várias fontes.
    6. Agrupar e resumir dados.
    7. Exportar dados do Julia para arquivos CSV e Excel.
  2. Visualização de dados com Makie.jl (Section 5). Neste capítulo você entenderá como:
    1. Plotar dados utilizando diversos backends do Makie.jl.
    2. Salvar visualizações nos mais diferentes formatos, como PNG ou PDF.
    3. Usar diferentes funções de plotagem para criar diversas formas de visualização dos dados.
    4. Customizar visualizações por meio de atributos.
    5. Usar e criar novos temas para suas plotagens.
    6. Adicionar elementos \(\LaTeX\) aos plots.
    7. Manipular cores e paletas.
    8. Criar layouts de figuras complexas.


CC BY-NC-SA 4.0 Jose Storopoli, Rik Huijzer, Lazaro Alonso