A visualização de dados é uma técnica que permite aos cientistas de dados converter dados brutos em gráficos e gráficos que geram percepções valiosas. Os gráficos reduzem a complexidade dos dados e facilitam o entendimento para qualquer usuário.

Existem muitas ferramentas para realizar a visualização de dados, como Tableau, Power BI, ChartBlocks e mais, que são ferramentas sem código. Eles são ferramentas muito poderosas e têm seu público. No entanto, ao trabalhar com dados brutos que requerem transformação e um bom playground para os dados, o Python é uma excelente escolha.

Embora mais complicado porque requer conhecimento de programação, Python permite que você execute qualquer manipulação, transformação e visualização de seus dados. É ideal para cientistas de dados.

Existem muitos motivos pelos quais Python é a melhor escolha para ciência de dados, mas um dos mais importantes é seu ecossistema de bibliotecas. Muitas bibliotecas excelentes estão disponíveis para Python trabalhar com dados como numpy, pandas, matplotlib, tensorflow.

Matplotlib é provavelmente a biblioteca de plotagem mais reconhecida que existe, disponível para Python e outras linguagens de programação como R. É seu nível de personalização e operabilidade que o definiu em primeiro lugar. No entanto, algumas ações ou personalizações podem ser difíceis de lidar ao usá-lo.

Os desenvolvedores criaram uma nova biblioteca baseada em matplotlib chamada seaborn. Seaborn é tão poderoso quanto matplotlib ao mesmo tempo, fornece uma abstração para simplificar plotagens e trazer alguns recursos exclusivos.

Neste artigo, vamos nos concentrar em como trabalhar com a Seaborn para criar os melhores gráficos da classe. Se quiser acompanhar você pode criar seu próprio projeto ou simplesmente dar uma olhada no meu projeto de guia marítimo no GitHub.

O que é Seaborn?

Seaborn é uma biblioteca para fazer gráficos estatísticos em Python. Ele se baseia em matplotlib e se integra estreitamente com estruturas de dados do pandas .

O design Seaborn permite que você explore e entenda seus dados rapidamente. Seaborn funciona capturando frames inteiros de dados ou arrays contendo todos os seus dados e realizando todas as funções internas necessárias para mapeamento semântico e agregação estatística para converter dados em gráficos informativos.

Ele abstrai a complexidade enquanto permite que você projete seus gráficos de acordo com seus requisitos.

[Ler:[Read:Conheça as 4 expansões usando dados para salvar o planeta]

Instalando Seaborn

Instalando seaborn é tão fácil quanto instalar uma biblioteca usando seu gerenciador de pacotes Python favorito. Ao instalar seaborn, a biblioteca instalará suas dependências, incluindo matplotlib, pandas, numpye scipy.

Vamos então instalar o Seaborn e, claro, também o pacote caderno para ter acesso ao nosso parque de dados.

pipenv install seaborn notebook

Além disso, vamos importar alguns módulos antes de começar.

import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib

Construindo seus primeiros lotes

Antes de começarmos a plotar qualquer coisa, precisamos de dados. A beleza de seaborn é que funciona diretamente com pandas dataframes, tornando-o super conveniente. Ainda mais, a biblioteca vem com alguns conjuntos de dados integrados que agora você pode carregar do código, sem a necessidade de baixar arquivos manualmente.

Vamos ver como isso funciona carregando um conjunto de dados que contém informações sobre voos.

Gráfico de dispersão

Um gráfico de dispersão é um diagrama que exibe pontos com base em duas dimensões do conjunto de dados. Criar um gráfico de dispersão na biblioteca Seaborn é tão simples e com apenas uma linha de código.

sns.scatterplot(data=flights_data, x="year", y="passengers")