Introdução
Neste projeto, você aprenderá como limpar e purificar dados CSV removendo dados incompletos, incorretos e inválidos. O objetivo é criar um conjunto de dados limpo a partir dos dados brutos, que pode ser usado para análise ou processamento posterior.
🎯 Tarefas
Neste projeto, você aprenderá:
- Como configurar o ambiente do projeto e preparar os arquivos necessários
- Como importar as bibliotecas necessárias para a limpeza de dados
- Como ler e processar os dados brutos, verificando vários tipos de dados sujos (dirty data)
- Como escrever os dados limpos em um novo arquivo CSV
🏆 Conquistas
Após concluir este projeto, você será capaz de:
- Usar Python e sua biblioteca padrão para trabalhar com dados CSV
- Aplicar técnicas para validar e limpar dados, como verificar valores ausentes, formatos inválidos e dados irrealistas
- Implementar um processo de limpeza de dados para criar um conjunto de dados de alta qualidade
- Gerar um novo arquivo CSV com os dados limpos