# Data Visualização Aprofundada | Tutorial de Data Visualização | Simplilearn Data: 09-01-2025 13: 42: 55 ## Sumário 1. [10 Melhores Gráficos em Power BI | Gráficos e Visualização em Power BI | Power BI Tutorial | Simplilearn](https://www.youtube.com/watch?v=3JUzEn6L-FE) 2. [DATA VISUALIZAÇÃO em EXCEL | Como Construir Gráficos Interativos em EXCEL | Simplilearn #excel #gráficos](https://www.youtube.com/watch?v=QESobY60Qfs) 3. [Modelagem de Dados em Power BI | Tipos de Modelagem de Dados em Power BI | Power BI | Simplilearn](https://www.youtube.com/watch?v=1Z_f6jkjprM) 4. [Tutorial de Visualização de Dados em Python | Projetos de Visualização de Dados em Python (Exemplos) | Simplilearn](https://www.youtube.com/watch?v=Nt84_TzRkbo) 5. [Curso de Visualização de Dados | Tutorial de Visualização de Dados | Explicação de Visualização de Dados | Simplilearn](https://www.youtube.com/watch?v=7kPqESo1vRw) 6. [GGPlot2 em R Tutorial | Fundamentos de GGPlot2 | Visualização de Dados em R | R Programming | Simplilearn](https://www.youtube.com/watch?v=l8SW38FLTwg) 7. [Big Data em 5 Minutos | O Que é Big Data? | Big Data Analytics | Big Data Tutorial | Simplilearn](https://www.youtube.com/watch?v=bAyrObl7TYE) 8. [Visualização de Dados em R | Tutorial de Ciência de Dados | Simplilearn](https://www.youtube.com/watch?v=_WyUme_H2ZQ) 9. [Tutorial de Visualização de Dados para Iniciantes | Tutorial de Análise de Big Data | Simplilearn](https://www.youtube.com/watch?v=MiiANxRHSv4) ## Transcrições ### 10 Melhores Gráficos em Power BI | Gráficos e Visualização em Power BI | Power BI Tutorial | Simplilearn URL: [https: //www. youtube. com/watch? v=3JUzEn6L-FE](https://www.youtube.com/watch?v=3JUzEn6L-FE) Idioma: en Olá, tudo bem? Bem-vindo ao canal do YouTube Simplilearn. Hoje teremos um tutorial completo para todos os gráficos do Power BI. Se estes são os tipos de vídeos que você gostaria de assistir, clique em Like e assine e dê um clique no botão de sino para ser notificado. Apenas para uma informação rápida, se você deseja escalar sua carreira, se tornar mestre na análise de dados e conseguir seu sonho de emprego ou avançar em sua carreira, então deve explorar os vários programas de análise de dados da Simplilearn. A Simplilearn oferece programas post-graduados da P University em parceria com a IBM. Por meio deste programa, você pode obter conhecimento e capacidade de trabalho preparada em habilidades como análise prescritiva e análise predictiva, classificação e mais de uma docena de outras. E não é isso ainda; você também tem a oportunidade de trabalhar em projetos e aprender de especialistas em empresas produtivas top de linha e de professores acadêmicos da universidade de elite. Após concluir estes cursos, milhares de alunos se transformaram em pessoas na # Data Visualização em Excel Aprenda a construir gráficos interativos em Excel com esta extensa guia. ## **Introdução** Nesta sessão, iremos explorar o mundo da visualização de dados usando o Microsoft Excel. Antes de começar, se você gosta destes tipos de vídeos, não esqueça de dar o seu "Like", inscrever e clicar no botão de sino para notificações. **Para os que tem ask para avançar suas habilidades em análise de dados ou começarem uma carreira na área, a Simply Learn oferece uma variedade de programas de certificação em dominios cortantes, incluindo ciência de dados, computação na nuvem, segurança cibernética, IA, aprendizado de máquina, e marketing digital. Estes programas são desenvolvidos em colaboração com universidades líderes e grandes corporações, e são ministrados por especialistas da indústria. Para encontrar um programa adaptado à sua experiência e interesses, consulte o link na descrição abaixo. ** ## **Entendendo a Visualização de Dados em Excel** O Microsoft Excel é amplamente conhecido como ferramenta de armazenamento de dados, mas oferece ilo mais do que isso. Pode também realizar análise exploratória de dados em seu conjunto de dados e criar gráficos, gráficos e painéis interativos de dashboard. Nesta guia, iremos nos concentrar no aspecto de visualização de dados de Excel. ## **Criando Gráficos em Excel** Para começar, abra o Excel e navegue até o 'Inserir' na faixa de opções. Lá, você encontrará uma ampla gama de gráficos disponíveis para uso. ### **Gráfico de Cascata** Para criar um gráfico de cascata, basta duplicar-clicar no 'Gráfico de Cascata'. Nom locale o gráfico como desejado, por exemplo, "Modelo de Cascata Cascata". Aqui, você será dado o relatório de vendas periódico por subcategorias. - A linha verde indica um crescimento lento nas vendas. - A linha vermelha indica uma queda nas vendas (que não é aplicável no cenário dado). - O total (geral subcategorias) é exibido no final. ### **Gráfico de Faixa** Para criar um gráfico de faixa, duplicar-clicar no 'Gráfico de Faixa' ou 'Gráfico em Lápis Costura' opção. Nom locale o gráfico como desejado, por exemplo, "Faixa Ribbon". Este gráfico mostra o desempenho de um produto específico em tempo real. - Para rastrear o desempenho mensal de produtos, escreva "Mês de Pedido" nos dados. - As cores diferentes representam os diferentes meses. ## **Grafico Escatola** Para criar um gráfico escatola, simplesmente duplicar-clicar no 'Scatter' opção, verifique a grafia (s c a t e r plot) e cole "Desconto" e "Lucro" nos campos apropriados. Este gráfico ajudará a lidar com números, como oferecimento de descontos em todos os produtos e analisando o lucro em função da oferta de desconto. ### **Pipa Gráfico** Para criar um gráfico pizza, duplicar-clicar no 'Pipas Gráfico' e nomeie o gráfico como desejado, por exemplo, "Pipas". Este gráfico é útil para visualizar as vendas por região. - Usando um gráfico de pizza facilita facilmente determinar qual região fez a venda mais alta baseado no tamanho das peças da pipa. ### **Gráfico Donut** O gráfico de donut é semelhante ao gráfico de pizza. Você pode usar o mesmo dado para criar um gráfico de donut. ### **Gráfico de Mapa** Gráficos de mapa são úteis quando seu conjunto de dados contém dados geográficos, como cidade, país, continente, etc. Para criar um mapa, duplicar-clicar no 'Mapa' opção e escolha a cidade desejada de dados geográficos, por exemplo, "Vendas de País". ### **Cartões e Gauge** Gráficos de cartas e medidores são semelhantes uns aos outros. Para criar estes gráficos, simplesmente duplicar-clicar no 'Cartão' opção e nome que desejar o cartão, por exemplo, "Cartão". Para um painel de controle verdadeiro-tempo, você pode ter 3-4 cartões no painel. ### **Gráficos Multilinha de Cartas e KPIs** Um cartão multilinha permite adicionar várias categorias e subcategorias. Para criar um cartão multilinha, simplesmente duplicar-clicar no 'Cartão' opção e escolha a opção de cartão multilinha. Os KPIs e tabelas são semelhantes uns aos outros. Eles fornecem números reais em tempo real para seu painel de controle, como o número de produtos vendidos, total de vendas, total de lucro, e total de descontos. Para criar um KPI, simplesmente duplicar-clicar no 'KPI' opção e cole os dados desejados. ### **Seletores** A diferença entre o Excel e o Power BI consiste justamente nesse processo de conexão de relatórios. Conforme mudaremos de provedor, poderá ser que seja necessário conectar-se a uma fonte de dados externa. Emните MSSQL, por exemplo, será necessário ir à Página de Fonte de Dados, adicionar a fonte de dados e escolher a tabela desejada. Para isto, acesse o assistente de consulta. Mas se você fizer clicar em uma determinada seleção, tais como país, todos os gráficos dependentes serão ligados a essa seleção e fornecerão informações em tempo real. Com isso, você aprendeu a criar vários tipos de gráquicos em Excel. Por integrar todos estes gráficos em uma página ou painel de controle, você irá criar um painel de controle verdadeiro-tempo. **Lições Extraídas**: - As seleções dependentes permitem que os gráficos sejam conectados e forneçam informações em tempo real em Power BI. - Cards e gauge charts are similar to each other. - While Microsoft Excel is primarily known as a data storage tool, it offers more than just data storage. It can also perform exploratory data analysis on your data set and create impressive charts, graphs, and interactive dashboards. - Map charts are useful when your data set contains geographical data, such as city, country, continent, etc. - Using a pie chart helps to easily determine which region made the highest sale based on the size of the pie pieces. - Simplifying long formulas can greatly improve the performance of charts and dashboards in Excel. - To create a scatter plot, input "Discount" and "Profit" in the appropriate fields. - Scatter plots are useful when dealing with numbers, such as providing discounts on all products and analyzing the profit against the discount offer. - Trendlines can be added to any chart to help understand the linearity of data. - AmChart is a popular JavaScript library for data visualization, and it integrates well with Excel. - For a real-time dashboard, you can have 3-4 cards on the dashboard. - To add trendlines to a chart, click on the 'Chart Design' tab and go to the 'Add Chart Element' section. Select Trendline and open the options to customize. - A donut chart provides a more spacious representation of data compared to a pie chart. - Cartoon characters can add an engaging interactive element to your dashboards. - Multi-row cards allow you to add multiple categories and subcategories to your dashboards. - Simply Learn is an educational platform that offers a variety of courses on cutting-edge topics, including data science, cloud computing, cyber security, AI, machine learning, and digital marketing. They offer certification programs in partnership with leading universities and top corporations and are delivered by industry experts. - KPI charts provide direct real-time numbers for your dashboard, such as the number of products sold, overall sale, overall profit, and overall discount. - Slicers enable real-time drill-down functionality in Excel dashboards, allowing users to explore data interactively. - To create a pie chart, simply double-click on the 'Pie' option and name the chart as desired, e. g. , "Pie. " - To create a donut chart, use the same data as the pie chart but instead use the "Donut" option. - To create a multi-row card, double-click on the 'Card' option and choose the 'Multi-Row Card' option. - A card multi-row card allows you to add multiple categories and their subcategories to your dashboard. - To find a program tailored to your experience and interests, please check out the link in the description below. # Observações finais Espero que este tutorial tenha ajudado a compreender a forma de criar gráficos e dashboards interactivos em Excel. Continue a explorar as distintas opções de gráficos ecompile um dashoard de informações relevantes para bailar separá-los a real-time. **Observação**: o texto original encontra-se correto em relação à regex, formatação, ortografia, gramática, e ponto de interpretação do texto para criar esta resposta. **Ligação**: [Simply Learn](https://www.simplylearn.io/) # Excel Data Visualization: Criando Gráficos e Visualizações Este guia vai mostrar-lhe como criar vários gráficos em Excel usando data visualization, tornando mais fácil para você entender seus dados. Certifique-se de que os seus dados estejam formatados e limpos antes de prosseguir. ## Gráfico de Waterfall Os gráficos de waterfall são úteis para demonstrar valores positivos e negativos numa série de transações financeiras, onde a soma dos valores positivos e negativos resulta na quantidade final. 1. Primeiro, selecione o conjunto de dados que deseja visualizar como um gráfico de waterfall. 2. Navegue até a `Inserir` e selecione `Gráficos Recomendados`. Os tipos de gráfico disponíveis são automaticamente gerados com base no seu conjunto de dados. 3. Escolha o Gráfico de Waterfall das opções disponíveis. ! [Exemplo de Gráfico de Waterfall](waterfall_chart_example. png) A Legenda no fundo do gráfico fornece uma visão geral de o que cada parte do gráfico representa. Você pode modificar as definições do gráfico, fundo e tipografia clicando no gráfico e selecionando `Ferramentas do Gráfico -> Design`. ## Gráfico de Sparkline Os gráficos de sparkline são uma forma compacta de linha ou barras útil para demonstrar a tendência de série de dados individuais ao longo do tempo. 1. Selecione o conjunto de dados que deseja criar um gráfico de Sparkline. 2. Navegue até a `Inserir` e selecione `Gráficos Recomendados`. 3. Escolha o tipo Sparkline de linha ou coluna das opções disponíveis. ! [Exemplo de Gráfico de Sparkline](sparkline_chart_example. png) Você pode criar gráficos de Sparkline para várias séries de dados e alinhá-los em linhas ou colunas únicas para melhor visualizar tendências ao longo do tempo. ## Mapa de Calor Os mapas de calor são usados para representar pontos de dados em formato gráfico, onde a intensidade da cor reflete o valor dos dados. 1. Selecione o conjunto de dados que deseja criar um mapa de calor. 2. Navegue até a `Início` (Home), depois clique em `Formatos Condicionais`, e selecione `Escala de Cores`. 3. Escolha uma escala de cores de mapa de calor de seu gosto. ! [Exemplo de Mapa de Calor](heat_map_example. png) ## Gráfico de Funnel Os gráficos de funnel são usados para visualizar de forma sequencial o number de usuários ou itens durante o processo e ajudar a estimar a taxa de conclusão de um processo. 1. Selecione o conjunto de dados que deseja criar um gráfico de funnel. 2. Navegue até a `Inserir` (Insert), depois selecione `Gráficos Recomendados`. 3. Escolha o Gráfico de Funnel das opções disponíveis. ! [Exemplo de Gráfico de Funnel](funnel_chart_example. png) ## Mapa de árvore Os mapas de árvore ajudam a ver dadosada hierárquica como um conjunto de retângulos não encontram-se, onde o tamanho de cada retângulo representa a proporção de dados que ela representa. 1. Selecione o conjunto de dados que deseja criar um mapa de árvore. 2. Navegue até a `Inserir` (Insert), depois selecione `Gráficos Recomendados`. 3. Escolha o mapa de árvore das opções disponíveis. ! [Exemplo de Mapa de árvore](tree_map_example. png) ## Gráfico de Area vs Linha Ambos os gráficos de área e a linha exibem tendências ao longo do tempo, mas a diferença principal é que os gráficos de área usam áreas preenchidas para representar valores positivos ou negativos em relação a uma base, enquanto que os gráficos de linha apenas indica tendências com linhas. 1. Selecione o conjunto de dados que deseja criar um gráfico de Área ou Linha. 2. Navegue até a `Inserir` (Insert), depois selecione `Gráficos Recomendados`. 3. Escolha o tipo Gráfico de Área ou Linha das opções disponíveis. Exemplo: ! [Exemplo de Gráfico de Área](area_chart_example. png) ! [Exemplo de Gráfico de Linha](line_chart_example. png) Visualização de Dados com Excel Este tutorial aborda vários tipos de visualização de dados usando o Excel. ## Gráficos de Barras e Gráficos de Colunas Para identificar qual região teve o desempenho mais forte, utilize um gráfico de barras ou um gráfico de colunas. O gráfico de coluna é recomendado nesse cenário, mas um gráfico de barras também pode ser utilizado ao invés. Esses gráficos apresentam os dados em termos de alturas (gráfico de coluna) que representam grupos (regiões). ``` Aqui está um exemplo de gráfico de caixa e bigorna utilizado para comparar as variações individuais de desempenho de um conjunto de dados estudantil: Este gráfico mostra o maior Mark a 92 e o mínimo a 75. Observação: - Cada cor representa um dos alunos (azul para o aluno 1, laranja para o aluno 2, e assim por diante). - Você pode criar este gráfico selecionando o conjunto inteiro de dados e ir para a opção "Inserir", depois descolar para "Todas as gráficas" e escolher "Caixa e Bigorna". ``` ## Gráficos de Mapas Os gráficos de mapas permitem que você crie um mapa físico que mostra a densidade populacional de um estado específico. Por exemplo, se você tiver dados para os Estados como a primeira coluna e população como a segunda coluna, será possível selecionar todo o conjunto de dados e criar um mapa físico quea mostra a densidade populacional desse estado específico. A cor mais clara representa a menor densidade populacional e a cor mais escura representa a maior densidade populacional. ``` Aqui está um exemplo de um gráfico de mapas: Neste exemplo, o estado de California é o mais populoso, enquanto o estado de Montana é um dos menos populosos. ``` ## Gráficos de Dispersão Os gráficos de dispersão mostram uma Natureza esparsa e podem ser utilizados para exibir dados de chuva, entre outras coisas. Os dados são apresentados com números séricos descrevendo a localização, e o local com o maior desempenho pode ser exibido utilizando um gráfico de dispersão. ## Gráficos Combinationados Gráficos Combinationados são uma combinação de vários tipos de gráficos, como gráficos de coluna agrupados, gráficos Combinationados e linha. Neste tutorial, vamos utilizar um gráfico Combinationado para nossa Antes exemplo. Você pode selecionar todo o conjunto de dados e ir para a opção "Inserir", depois escolher "Todas as gráficas" e selecionar o gráfico Combinationado que preferir. Aqui está um exemplo de um gráfico Combinationado com uma coluna agrupada e linha: ``` Isso foi o último gráfico para o tutorial de visualização de dados com o Excel. Se quiseremos criar mais teacherions sobre visualização de dados, por favor, nos peça comentários no local de entrada abaixo, e entraremos com novos teacherions no assunto. Se você tiver alguma dúvida ou precisar de ajuda com DSS ou o PBDS utilizados durante a sessão, por favor, nos avise nos comentários abaixo, e o nosso time de expertos estará feliz para ajudar você nos genéricos e nos PBDS em breve. Assim que terminamos, obrigado e acompanhe de perto para mais de nós de aprendizagem. Gostaria de ver mais? Veja nosso website: <https://www.youtube.com/watch?v=1Z_f6jkjprM> - Para mais informações sobre o modelo de dados em Power BI, veja nossa tutoria sobre "Modelo Dimensional e Relacional de Dados no Power BI". ``` # Power BI: Criando Modelos Relacionais para Visualização de Dados Este guia demonstra como criar e gerenciar vários tipos de relacionamentos em Power BI para melhor visualização de dados. ## Importação de Dados-Mestra P riormente, precisamos importar dados-mestra essenciais. Neste exemplo, iremos importar: 1. A tabela `clientes`, que contém dados dos clientes, chave do cliente, nome, sobrenome, data de nascimento, estado civil e género. 2. A tabela `produtos`, que apresenta a chave do produto, subcategoria, SKU do produto, nome do produto, nome do modelo, descrição do produto, cor, tamanho, etc. ## Exame de Relacionamentos Agora que os nossos dados básicos estão carregados, vamos examinar os relacionamentos entre as tabelas: 1. **Clientes > Pedidos (Uma-Para-Muitos)**: Um cliente pode enviar muitos pedidos. Power BI tem automaticamente detectado este relacionamento. Você pode confirmar o estado do relacionamento clicando duas vezes no botão `Junção` no painel `Campos`. 2. **Produtos > Pedidos (Muitos-Para-Muitos)**: Um produto pode estar envolvido em muitos pedidos. Um relacionamento muitos-para-muitos é detectado, mas lembre-se de que neste cenário ocorrerá ambiguidades se nenhuma coluna contiver valores únicos. Você pode personalizar a direção do relacionamento (um-para-muitos ou ambos) conforme precisar no painel de gerenciamento de relacionamentos. ## Filtragem Transversal A filtragem transversal é um meio de filtrar dados com base em relacionamentos entre tabelas. Em Power BI, você pode escolher entre filtragem uni-direcional ou filtragem bidirecional: 1. **Filtragem uni-direcional**: Somente os dados de uma tabela são filtrados em função da outra tabela. Por exemplo, se você quiser encontrar produtos que foram encomendados por um cliente específico, poderá criar uma filtragem uni-direcional de clientes para produtos porque o cliente pode ter muitos pedidos, mas um produto não pode ter um cliente associado. 2. **Filtragem bidirecional**: Os dados de ambas as tabelas são filtrados em função da outra tabela. Isso significa que quando uma tabela for filtrada, a outra tabela se ajustará de acordo. No entanto, a utilização da filtragem bidirecional poderá levar a problemas de desempenho para grandes conjuntos de dados. Assegure-se de utilizar a direção de filtragem transversal apropriada na sua análise, em seus relatórios. ## Relacionamento Um-Para-Um Pode haver situações em que encontre um relacionamento um-para-um, onde uma chave em uma tabela corresponde exatamente a uma linha em outra tabela. Power BI também deteta estes relacionamentos automaticamente. ## Relacionamentos adicionais Você pode continuar adicionando relacionamentos conforme necessário, como associação de territórios, de retornos ou de dados de outras transações à suas tabelas-mestra. Power BI é uma ferramenta interessante para a criação de modelos dimencionais, pois facilita o gerenciamento de relacionamentos entre tabelas e oferece uma ampla variedade de opções para visualização de dados. Com esta compreensão, poderá criar relatórios poderosos, claros e fáceis de entender para toma de decisão baseada em dados. Não hesite em conferir o [tutorial de Visualização de Dados em Python da Simplilearn](https://www.youtube.com/watch?v=Nt84_TzRkbo) se estiver interessado em explorar a visualização de dados adicionalmente, usando Python e bibliotecas relacionadas como Matplotlib e Seaborn. Feliz análise! 🚀 Não esqueça de formatar o texto corretamente. Não se esqueça de respeitar o formato Markdown (# ** ` [] () etc). Fique à vontade para me perguntar se tiver alguma dúvida ou tens um texto diferente para traduzir. Kind regards! 🇵🇹 🇧🇷 🇪🇺. # Biblioteca Bokeh em Python para Gráficos Interativos Este tutorial te guiará pela biblioteca Bokeh, uma ferramenta poderosa para a criação de gráficos interativos em Python. Vamos abordar diferentes tipos de gráficos e como implementá-los para resultados amigos do usuário e interativos. ## Introdução à Biblioteca Bokeh A biblioteca Bokeh é uma biblioteca de desenho aberto-source utilizada para a criação de gráficos 2D e 3D. Proporciona tipos de desenho ricos e é uma ferramenta útil para a visualização de dados. ### Básicos da Biblioteca Bokeh - Tipos de gráficos - Gráficos de barras - Histogramas - Gráficos de dispersão - Gráficos de linha - Pizza charts - Gráficos de área - Gráficos e subgráficos - Adição de um gráfico dentro de outro gráfico (Parâmetros do Gráfico) - Título - Etiquetas - Legenda - Gráficos de linha - Tipos de linha - Cores - Transparência - grade do canvas e limites do eixo - Gráficos 2D (Scatter, Step, Bar, Fill between, Carta polar, Histogram, Contorno, Imagem, Superfície 3D, Imagem) ! [Exemplo de Treino: Pizza Chart](pie-chart. png) ### Ponto de Partida Para iniciar, vamos estudar a biblioteca Matplotlib e o código Python. #### O que você obtém? - Entenda a Biblioteca Matplotlib - Tipos de gráficos - Gráficos e subgráficos - Parâmetros de gráficos (Título, Etiqueta, Legenda, Gráficos de linha, Tipos de linha, Cores, Transparência, grade do canvas, e limites do eixo) ## Bokeh Library vs Library Matplotlib Embora ambas as bibliotecas tenham por objetivo a mesma finalidade, há algumas diferenças: - Bokeh é projetado para a criação de ferramentas de visualização interativas, sendo adequado para aplicações web e painéis de instrumentos. - Matplotlib suporta tipos de gráficos 2D e 3D, criando visualizações estáticas e an Jahnimated e é excelente para a personalização de elementos de gráfico. ## Exemplo de Treino: Pizza Chart Aqui está um exemplo de treino para te ajudar a começar: ```python import pandas as pd from bokeh. plotting import figure, show from bokeh. samples. data. night_mode_data_('') as samples data = samples['pie'] pie = figure(x_axis_type="category") pie. pie(data['values'], labels=data['labels']) show(pie) ``` Este exemplo cria e exibe um gráfico de pizza por meio do Bokeh, com etiquetas para as secções e as respectivas quantidades. Referências: - [Documentação da Biblioteca Bokeh](https://docs.bokehplot.com/) - [Documentação da Biblioteca Matplotlib](https://matplotlib.org/) - [Dados em Modo Noturno](https://docs.bokeh.org/en/latest/source/examples/people/night_mode_data.html) # Matplotlib Subplots: Adicionando Eixos e Ajustando Tamanho Este tutorial guiará-o através da criação de subplots, do ajuste de seu tamanho e da adição de eixos em Matplotlib. ## Criando Subplots Primeiro, vamos importar as bibliotecas essenciais e inicializar o subplot. ```python import matplotlib. pyplot as plt import numpy as np # Criar um figura com um número especificado de linhas e colunas fig = plt. figure() ax = fig. add_subplot(1, 2, 1) # (número de linhas, número de colunas, subplot index) ``` Neste código, importamos as bibliotecas necessárias, `matplotlib. pyplot` e `numpy`. Em seguida, criamos uma figura e adicionamos um subplot à ela, usando a função `fig. add_subplot()`. Neste exemplo, criamos uma figura com uma única linha e duas colunas, e o primeiro subplot dentro da primeira linha. ### As variáveis 'fig' e 'ax' - `fig`: Representa a tela ou figura no Matplotlib. - `ax`: É comumente usado para referir-se aos subplots dentro da figura. ## Desenhar Dados nos Subplots Agora, vamos desenhars a um gráfico simples no subplot que acabamos de criar. ```python x = np. linspace(0, 10, 101) y = np. sin(x) ax. plot(x, y, cor='vermelho') ``` Neste exemplo, geramos 101 pontos de espaçamento uniforme entre 0 e 10, e criamos uma onda seno usando esses pontos. Usamos a função `ax. plot()` para desenhars a onda seno no nosso subplot. ## Adicionando Eixos e Ajustando Seu Tamanho Podemos criar vários eixos dentro de uma figura, cada um com propriedades únicas, como limites x e y e customizações de espaçamento customizado dos eixos. ```python # Configurar os subplots fig = plt. subplots(2, 2, figsize=(8, 8)) para i, j em range(fig. axes. total): j. plot(x, y, cor='vermelho') j. set_title(f"Subplot ({i//2+1}, {j%2+1})") ``` Aqui, criamos uma figura com 2 linhas e 2 colunas e customizamos o tamanho da figura usando o argumento `figsize`. Em seguida, itero sobre cada subplot e desenhars uma onda seno em cada um deles, com um título customizado para identificação mais fácil de cada subplot. ## Ajustando as Propriedades dos Eixos Para ajustar propriedades de eixos, como distância entre eixos, razão de aspecto e rótulos de eixos, pode-se usar a função `tight_layout()`, método do eixo ou outras propriedades de eixos como precisar. ```python fig. tight_layout() plt. show() ``` Este código fará com que os subplots sejam ajustados automaticamente para que as aparência seja uniforme e organizada. Com esta conhecimento básico de Matplotlib's subplots, poderá criar gráficos mais complexos e visuais com seu dado de forma mais eficiente. # Gráficos e Subgráficos ## Definindo a DPI Definir a DPI como 150 produzirá um gráfico grande e claro para visualização fácil. ## Criando Gráficos Vamos criar três gráficos: 1. x versus x + 1 (gráfico linear) 2. x + x + 2 (gráfico de ponto) 3. x x + 3 (gráfico de eixos de ponto) Estes gráficos serão utilizados para um setup de vizinhos mais próximos ou para ilustrar como os dados estão localizados e as linhas são desenhadas entre os vizinhos mais próximos. ## Controlando o Alpha Podemos controlar o valor Alpha dos gráficos, o que afeta a transparência. Definir o Alpha como 0, 5 dará um efeito de transparência semi-clara, permitindo que outras cores sejam vistas. ## Mudando a Cor Podemos mudar a cor das linhas especificando o parâmetro de cor. O símbolo # pode ser usado para referenciar cores específicas. Por exemplo: ``` color = '#155ddd' # Azul color = '#ff0000' # Vermelho ``` ## Definindo o Alpha Podemos definir o valor Alpha para controlar a transparência das linhas. Por exemplo: ``` alpha = 0, 5 ``` ## Ajustando os Pontos de Interação Para tornar os pontos de interação mais visíveis, podemos elevar o gráfico ao quadrado ou ao potêncio. Por exemplo: ``` y = x ** 2 ``` ## Exemplo Aqui está um exemplo de como criar um gráfico com três linhas coloridas, definir o valor de Alpha e tornar os pontos de interação mais visíveis: ``` import matplotlib. pyplot as plt # Criar três linhas x = range(10) y1 = x y2 = x + 1 y3 = x + 2 # Definir o valor Alpha alpha = 0, 5 # Definir a cor das linhas cores = ['r', '#155ddd', '#ff0000'] # Criar o gráfico fig, ax = plt. subplots() # Definir os limites do gráfico ax. set_xlim(0, 10) ax. set_ylim(0, 10) # Desenhar as linhas por cada i em range(3): ax. plot(x, y1[i], cor=cores[i], alpha=alpha) # Mostrar o gráfico plt. show() ``` ## Conclusão Este tutorial abordou os fundamentos da criação e customização de gráficos em Matplotlib. Aprendemos a criar e colorir linhas, controlar a transparência das linhas e tornar os pontos de interação mais visíveis. Na próxima seção, exploraremos diferentes gráficos e um problema de desafio. --- ### Limites Podemos limitar os dados em nossos gráficos usando as funções `ax. set_xlim()` e `ax. set_ylim()`. Isso é útil quando queremos focar em uma faixa de valores específica. --- ### Subgráficos Podemos criar múltiplos gráficos no mesmo figura utilizando a função `subplots()`. Por exemplo, para criar uma grade de 2x2 de gráficos: ``` fig, axs = plt. subplots(2, 2) ``` Cada subgráfico pode ser acessado usando o array `axs[]`. ``` axs[0, 0]. plot(. . . ) # Primeiro subgráfico axs[0, 1]. plot(. . . ) # Segundo subgráfico axs[1, 0]. plot(%). . . # Terceiro subgráfico axs[1, 1]. plot(. . . ) # Quarto subgráfico ``` Além disso, podemos definir o tamanho do figura usando a função `figure()` e especificando o comprimento e altura como tupla: ``` plt. figure(figsize=(10, 5)) ``` Abaixo está o código original, corrigido e formatado com Markdown: ```markdown # Plotando gráficos 2D em Python Utilize em vez disso, podemos iterar por eles mas são apenas um array, portanto é um array de comprimento zero é ainda os eixos das primeiras duas e vamos plotar linhas de `x`, `x^2`, `x^3` com 2. Assim, vamos passar diretamente e somente plotar dois gráficos um sobre o outro sem fazer múltiplas plantas nesta. Aqui vamos fazer `grid=True` para facilitar a visualização. Execute-o e veja aqui nosso dois gráficos com a variável `x` passando à direita. Agora vou fazer algo semelhante, por `axis=0` então teremos uma planota de `x`, `x^2`, `x^3` com 2. Neste momento, vamos fazer um limite a `y`. Isto é, `ylim=(0, 60)`, onde 0 e 60 são apenas números que estão sendo utilizados. Adicionei ainda os limites de `x=(2, 5)` para limitarmos aos dados nesta faixa. Execute-o e veja agora o eixo de `y=0` a 60. Nota adicional: você pode facilmente limitar seu gráfico e re-shape-lo em qualquer momento. Também podemos adicionar o grid se desejarmos. ## Outros gráficos 2D Vamos iniciar neste célula marcando como código Markdown, então corremos a célula e teremos uma boa legenda para isto. Criaremos agora algumas variáveis com um array de numpy que vai do 0 até 5: ```python import numpy as np x = np. linspace(0, 5, 100) ``` Agora temos 4 tipos comuns de gráficos 2D que vamos apresentar lado a lado. Criaremos primeiro uma `figure` e definiremos `axes=subplots(1, 4)` e `figure_size=(12, 14)`. Veja abaixo: ```python figure, axs = plt. subplots(1, 4, figsize=(12, 14)) ``` ### Scatter Plot Primeiramente, adicionaremos uma planeta de dispersões. Isto é, podemos adicionar `scatter(x, y, c='blue')` no primeiro quadro. Os demais quadrados devem ter um `pass` para eles fiquem em branco. Agora, nossa código deveria ser algo como: ```python # Scatter plot axs[0]. scatter(x, y) # Restantes quadrados não têm ação ``` ### Step Plot A seguir, vamos plotar um plot de passo. Isto é, basta adicionarmos o seguinte: ```python # Step plot axs[1]. step(x, y, where='mid') ``` ### Bar plot A seguir, vamos tentar um gráfico em barras. Para isto, basta adicionarmos o seguinte: ```python # Bar plot axs[2]. bar(x, y) ``` ### Histogramas Agora, vamos ver um gráfico histórico. Isto é, podemos adicionarmos o seguinte: ```python # Histograms axs[3]. hist(y) ``` Veja agora se todos os tipos de gráficos aparecem lado a lado: ```python plt. show() ``` Note que os `import` podem ser realizados no final do código, conforme a ordem desejada. No entanto, se você tiver alguns problemas com as importações, como linhas de código não encontradas, considere verificar a ordem de inicialização das bibliotecas. Note também que no texto do tradução, mantenho a primeira letra de cada frase maiúscula para manter a legibilidade do texto traduzido. No original, os títulos de seção apresentam a letra minúscula inicial. Estas mudanças são apenas para garantir que o texto não perca fluência ao traduzir. # Cartas de Contorno e Mapas 3D Este tutorial vai lhe guiar a criar cartas de contorno e mapas 3D usando Python e Matplotlib. ## Cartas de Contorno ### Pré-processamento de Dados Para criar uma carta de contorno, precisamos primeiramente preparar dados com três valores diferentes (x, y e z). Aqui está o código Python para gerar esses dados: ```python import matplotlib. pyplot as plt import numpy as np import matplotlib. cm as cm # Gerar dados para a carta de contorno delta = 0. 025 x = np. arange(-3, 3, delta) y = np. arange(-3, 3, delta) X, Y = np. meshgrid(x, y) Z1 = np. exp(-(X**2 + Y**2)) Z2 = np. exp(-5 * (X**2 + Y**2)) Z = Z1 - Z2 * 2 ``` Neste código, importamos as bibliotecas necessárias, geramos uma grade para x e y, e defínimos duas áreas Z1 e Z2. Em seguida, usamos uma função exponencial para criar nossos valores z-values. ### Criando Carta de Contorno Agora, vamos criar uma figura e usar o `contour` para plotar contornos: ```python fig, ax = plt. subplots(figsize=(14, 6)) cs = ax. contour(X, Y, Z) ax. set_title("Carta de Contorno") ax. set_xlabel('X') ax. set_ylabel('Y') ax. clabel(cs, inline=True, fontsize=10) plt. show() ``` Aqui, criamos uma figura e subplot, introduzimos nossos dados X, Y e Z (gerados anteriormente) no contour function, criamos um título e rótulos para as eixos x e y, e, finalmente, mostramos a figura. ### Entendendo a Carta de Contorno Uma carta de contorno exibe linhas de contornos constantes de elevação como contornos na superfície, tornando mais fácil visualizar os dados. Neste caso, imagine-se vem a escalada de montanhas em que as elevações variadas representam diferentes alturas. Por exemplo, a linha zero representa o nível do mar, seguido por linhas de contorno 0. 5, -1, e assim por diante, que representam alturas decresentes ou aumentantes conforme se avança na montanha ou num vale. ## Mapas 3D Para criar um mapa 3D, utilizaremos o módulo mpl_toolkits. mplot3d, que nos permite trabalhar com imagens 3D. ### Preparação dos Dados Para criar um mapa 3D, precisamos de dados 3D. Como já preparámos os dados anteriormente para a carta de contorno, podemos reutilizá-lo aqui. ### Criando o Mapa 3D Agora, vamos criar uma figura 3D, definir os limites das eixos e parâmetros de projeção, e plotar os dados: ```python from mpl_toolkits. mplot3d import Axes3D fig = plt. figure(figsize=(14, 6)) ax = fig. add_subplot(111, projection='3d') ax. plot_surface(X, Y, Z, rstride=4, cstride=4, alpha=0. 8) plt. show() ``` Neste código, importamos `Axes3D` do módulo mpl_toolkits. mplot3d, criamos uma figura 3D, adicionamos um subplot usando add_subplot, e plotamos a superfície dos dados usando plot_surface. Com estas etapas, aprendemos a criar cartas de contorno e mapas 3D usando Python e Matplotlib. Ajustando-os os parâmetros de acordo com as suas necessidades específicas, irá ajudar-lhe a entender e visualizar com maior eficiência conjuntos de dados complexos. ## Exemplo de Prática Agora, experimente a criar um gráfico de disco de um atendimento por atendimento dos linguagens de programação, como mostrado neste tutorial. Isso irá desafiar suas novas habilidades e fornecer experiência prática com as capacidades de plotagem avançadas de Matplotlib. Boa sorte, e felizes a visualizar! 📊 # Visualização de Dados com a biblioteca C-Bond em Python Este tutorial mostra como visualizar dados e extrair insights com diferentes gráficos e gráficos usando a biblioteca C-Bond. A biblioteca C-Bond é uma biblioteca de visualização de dados popular em Python, construída sobre Matplotlib e frequentemente usada para tarefas de ciência de dados e aprendizado de máquina. ## Pré-requisitos Para seguir este tutorial, você precisará das bibliotecas a seguir instaladas: - NumPy - Pandas - Matplotlib - C-Bond - Seaborn ## Datasets Neste tutorial, utilizaremos dois conjuntos de dados: 1. Conjunto de Dados Cache Vazio 2. Conjunto de Dados de Flores de Iris ## Inicio Inicie um notebook de Jupyter para esta demonstração. Digite agora o notebook como `cbon_demo`. Agora é possível importar as bibliotecas necessárias. ``` import numpy as np import pandas as pd import matplotlib. pyplot as plt from matplotlib. pyplot import sungolsun import matplotlib. image_colormaps as cmap import seaborn as sns from cbon import * ``` ## Conjunto de Dados de Carros com Combustível Vazio Usaremos o conjunto de dados Carros com Combustível Vazio para demonstração. O conjunto de dados Carros com Combustível Vazio é um arquivo CSV que contém informações sobre o consumo de combustível e 11 aspectos diferentes de design e desempenho de 32 carros. ``` # Importando o dataset usando pandas empty_cars = pd. read_csv('caminho_para_seu_conjunto_de_dados_de_carros_sem_combustível. csv') # Imprimindo as primeiras 5 linhas do dataset print(empty_cars. head()) ``` ## Gráfico de Barras Criamos um gráfico de barras mostrando o número de cilindradas vs mpg. ``` # Criando um gráfico de barras com seaborn res = sns. barplot(x='cilindradas', y='mpg', data=empty_cars) # Exibindo o gráfico plt. show() ``` ## Gráfico de Contagem Criamos um gráfico de contagem mostrando o número total de veículos para cada categoria de cilindradas. ``` # Criando um gráfico de contagem com seaborn res = sns. countplot(x='cilindradas', data=empty_cars) # Exibindo o gráfico plt. show() ``` ## Tipos de Gráficos Adicionais Para técnicas de visualização de dados mais avançadas usando a biblioteca C-Bond, você pode consultar a documentação da biblioteca e recursos online como [paletas de cores de seaborn](https://seaborn.pydata.org/library/tutorial/color_palettes.html). Title: Plots Horizontais e Agrupados de Contagem, Mapa de Aquecimento, Plots de Dispersão e Diagrama de Pares utilizando a Biblioteca c-bond em Python ===================================================================================================================================================================================================================================================================================================== Resumo ------ Aprenda a criar plots horizontais de contagem, plots agrupados de contagem, mapas de aquecimento, plots de dispersão e diagrama de pares utilizando a biblioteca c-bond em Python. ### Plot de Contagem Horizontal Criando um plot de contagem horizontal utilizando a função `sns. countplot()`: ```python # Defina a etiqueta do eixo y (gear) y_label = 'gear' # Carregue os dados de carros vazios data = empty_cars # Defina a paleta palette = 'rocket' # Execute o plot sns. countplot(x=y_label, palette=palette, data=data) ``` **Nota**: Compare este plot de contagem horizontal com o vertical (existente acima) para observar a diferença na alinhamento dos barras. ### Plot de Contagem Agrupado Criando um plot de contagem agrupado utilizando o parâmetro `hue`: ```python # Agrupe o plot de contagem pelo número de cilindradas type_plot = 'countplot' x_axis = y_label # Execute o plot agrupado sns. {type_plot}(x=x_axis, hue='cylinder', data=data, palette='set1') ``` ### Mapa de Aquecimento Criando um mapa de aquecimento utilizando a matriz de correlação do conjunto de dados `empty_cars`: ```python # Crie um mapa de aquecimento de correlação type_plot = 'heatmap' # Execute o mapa de aquecimento sns. {type_plot}(data=empty_cars, cmap='coolwarm', cbar=True, linewidths=0. 5) ``` ### Plot de Dispersão Criando um plot de dispersão para mostrar a relação entre duas variáveis contínuas utilizando o conjunto de dados integrado `iris`: ```python # Carregue o conjunto de dados iris iris = sns. load_dataset('iris') # Defina os eixos x e y x = 'comprimento do pétalo (cm)' y = 'comprimento do sépalo (cm)' # Execute o plot de dispersão sns. scatterplot(x=x, y=y, data=iris) ``` ### Diagrama de Pares Criando um diagrama de pares para mostrar as relações entre várias variáveis utilizando o conjunto de dados integrado `iris`: ```python # Carregue o conjunto de dados iris iris = sns. load_dataset('iris') # Execute o diagrama de pares sns. pairplot(data=iris) ``` **Nota**: Você pode converter os diagramas diagonais em diagramas de densidade de kernel e os restantes diagramas de dispersão utilizando o parâmetro `hue` para classificar cada tipo de flor. ### Plot de Regressão LM Criando um plot de regressão LM para mostrar a relação linear determinada através da regressão para variáveis contínuas: ```python # Carregue o conjunto de dados iris iris = sns. load_dataset('iris') # Defina os eixos x e y x = 'comprimento do pétalo (cm)' y = 'largura do pétalo (cm)' # Execute o plot de regressão LM sns. lmplot(x=x, y=y, # Usando Regressão Linear em Python com o Dataset do Iris de Flores Este documento lhe guiará através da criação de uma relação linear entre diferentes tipos de flores utilizando o dataset do Iris e a linha de regressão. Utilizaremos a biblioteca CBND em Python. ## Regressão Linear para estabelecimento de uma relação linear Comecemos pela criação de uma relação linear entre os diferentes tipos de flores utilizando a linha de regressão. ```python # Dito por mim este marcador de seta irá continuar e executei acontece que sim disporá agora de três linhas de regressão linear diferentes e as setas verdes em cor azul representam sêtotas as estrelas amarelas representam flores versicolor e as triangulações representam virgínicas, portanto é assim que se cria uma relação linear entre diferentes tipos de flores utilizando a linha de regressão claro ``` ## Função final de representação gráfica Após criarmos a linha de regressão, vamos dar uma olhada na função final de representação gráfica, onde vamos criar uma caixa para representação gráfica. Uma caixa para representação gráfica, também conhecida como box and whisker plot, representa a distribuição de dados quantitativos. ```python # Função caixa gráfica vamos olhar para a função final de representação gráfica onde criaremos uma caixa para representação gráfica uma caixa para representação gráfica, também conhecida como box and whisker plot, representa a distribuição de dados quantitativos a caixa representa as quartis dos dados de conjunto as branquinhas representam o resto da distribuição, excepto os outliers # Caixa gráfica para especies de flores baseados em sua largura de sepália Agora vejamos a distribuição de cada uma das espécies de flores baseados em sua largura de sepália ``` ```python # Criar caixa gráfica sns. boxplot(x="espécie", y="largura de sepália", data=iris, palette="hls") ``` ## Interpretação da Caixa gráfica Na caixa gráfica resultante, você pode ver a caixa para sêtotas em azul, orange para flores versicolor e verde para virgínicas. A linha dentro da caixa representa a média para cada espécie. Você pode comparar a média de largura de sepália para cada uma das flores a partir do eixo y. As linhas nas extremidades de cada caixa representam os valores mínimos e máximos de largura de sepália para cada espécie. Os pontos fora da caixa são chamados de fora da ordem e as linhas extendidas (branquinhas) representam o resto da distribuição dos dados, excepto os foras da ordem. ## Biblioteca CBND e Bokeh Após a caixa gráfica, vamos explorar a biblioteca CBND e Bokeh, que nos ajudará a criar visualizações interativas para navegadores web modernos usando HTML e JavaScript. ### Introdução a Bokeh O Bokeh é uma biblioteca de Python que nos permite criar gráficos altamente interativos. Este é alcançado por usar HTML e JavaScript, fazendo com que seja um poderoso ferramento para aplicativos de desenho e custom charts para gráficos web. O Bokeh é uma biblioteca em Python para criar visualizações interativas para navegadores web modernos. Ajudá-lo a criar gráficos belos, que se irão do simples gráfico para os complexos dashboards com conjuntos de dados de streaming. Com o Bokeh, é possível criar gráficos JavaScript # Análise de Jogo Espacial ## Introdução Durante um jogo particular, este conjunto de dados fornece insights sobre várias áreas do jogo, incluindo duração total, expulsões, sabotagens, tarefas concluídas, mudanças de posição, entre outros. ### Painel do Jogo Este conjunto de dados nos dá a seguinte informação: 1. `Game Length`: Nos dá a duração total do jogo, em minutos. 2. `Ejected`: Indica se o jogador foi expulso ou arremessado do navegador espacial. Valores: **True** ou **False**. 3. `Sabotage`: Se refere ao impostor dentro do jogo, que pode criar sabotagens. A missão dos tripulantes é corrigi-las. Nos dá o número de sabotagens que foram corrigidas por este tripulante em particular. 4. `Task Completed`: Nos dá a duração que os tripulantes demoraram para concluir todas as tarefas. 5. `Rank Change`: Nos dá a mudança de posição após vitória ou derrota do jogo. 6. `Região/Código do Jogo`: Nos dá o servidor e o código do jogo. ### Distribuição dos Dados Vamos que começar a ver como a distribuição dos dados: 1. `Contagem por Coluna`: Nos mostra a quantidade de instâncias de cada coluna. A maioria das colunas tem a mesma quantidade de instâncias, exceto para `Rank Change`, que tem algumas falhas. 2. `Valores Únicos`: Nos dá a quantidade de valores únicos em cada coluna. A coluna `Time` terá 2 valores únicos (Crewmate ou Imposter), `Outcome` terá 2 valores únicos (Win ou Lose), `Task Completed` terá 12 valores únicos, `Status dos Dados` ( Alt, Completed, Murdered) terá 3 valores únicos, e `Kills do Impostor` terá valores únicos variáveis. ### Transformação de Dados Agora, vamos descompactar o dados ainda mais: 1. Converter `Game Length` em `Minutos`: Vamos dividir a coluna Game Length e converter-a em minutos, então criará uma coluna separada de `Minutos`. 2. Modificar a coluna `Murdered`: Vamos substituir os valores **No** por **Não Morto**, os valores **Yes** por **Morto**, e traços simples por **Faltando**. Esta alteração será feita no lugar, afetando o nosso dataframe principal. 3. Atualizar o dataframe: Vamos tirar um olhar em nosso dataframe atualizado. Temos a coluna `Game Length`, `Minutos`, e a coluna `Murdered` modificada. A coluna `Murdered` não tem mais falhas ou traços; todos os valores são representados como dados categoriais. ### Visualização de Dados Agora, vamos plotar uma Pi Chart utilizando a coluna `Time` para visualizar a proporção deImposters versus Crewmates. 1. Obter a contagem dos valores únicos em cada valor único na coluna Time: Vamos fazer isso com a ajuda da função `value_counts()` que Pandas fornece. 2. Plotar Pi Chart: Vamos fazer isso com a ajuda da função `plot_bokeh()` e definimos o tipo de gráfico como um Pi Chart. vamos lhe dar o título como "Quota de Impostores versus Crewmates. " # Gráficos de Barras vs Histogramas Gráficos de barras e histogramas são dois diferentes métodos de visualização de dados, cada um com suas características únicas. ## Gráficos de Barras No gráfico de barras, você representa dados categóricos. Ele utiliza caixas para representar a quantidade de dados, mas quando as caixas estão armazenadas uma sobre a outra, é chamado de gráfico de barras apiladas. Aqui está um exemplo de um gráfico de barras: ```python # task_completed = ["completed", "completed", "completed", "not completed", "not completed", "completed", "not completed", "completed", "completed", "completed", "not completed", "not completed", "completed", "not completed", "not completed", "not completed", "completed", "not completed", "not completed", "not completed", "completed", "not completed", "completed", "completed", "not completed", "not completed", "not completed", "completed", "not completed", "completed", "completed", "completed", "completed", "not completed", "not completed"] import plotly. graph_objects as go fig = go. Figure() fig. bar(x=task_completed, orientation='h') fig. show() ``` No gráfico de barras acima, `task_completed` é dados categóricos, e os contadores nos dizem quantos contadores de valores cairam em cada categoria. ## Gráficos de Barras Apiladas Para criar um gráfico de barras apiladas, você precisa modificar os dados para indicar que as barras devem ser apiladas. Aqui está um exemplo de um gráfico de barras apiladas: ```python # imposters_win = 216 # crewmates_win = 981 # imposters_lose = 780 # crewmates_lose = 205 import plotly. graph_objects as go fig = go. Figure() fig. bar(x=["Imposters", "Crewmates"], y=[imposters_win, crewmates_win], nome="Vitórias", marcador=dict(cor='azul')) fig. add_bar(y=[imposters_lose, crewmates_lose], nome="Derrotas", marcador=dict(cor='vermelho')) fig. show() ``` No gráfico de barras apiladas acima, você pode ver que os tripulantes de bordo têm vencido significativamente mais vezes do que o número de vezes que os mimimimimimetas têm vencido. ## Gráficos de Barras Verticais Para um gráfico de barras vertical, você precisa ajustar a orientação para 'v'. Aqui está um exemplo de um gráfico de barras vertical: ```python # df_vbar = … # df_vbar['tarefas_não_concluídas']. replace(['yes', 'no'], ['Tarefa Concluída', 'Tarefa Não Concluída']) # df_vbar['Tarefa Não Concluída'] = df_vbar['Tarefa Não Concluída']. apply(lambda x: x if x == 'none' else 0) import plotly. graph_objects as go fig = go. Figure() fig. bar(x=df_vbar['resultado'], y=df_vbar['tarefas_concluídas'], orientação='v') fig. show() ``` No gráfico de barras vertical acima, você pode ver quantas tarefas estão concluídas e quantas tarefas ainda não estão concluídas para cada resultado. ## Gráficos de Barras Bidirecionais Para criar um gráfico de barras bidirecionais, você precisa de valores positivos e negativos, com o centro em zero. Aqui está um exemplo de um gráfico de barras bidirecionais: ```python # dataframe_bidirectional = … # dataframe_bidirectional['derrotas'] = -dataframe_bidirectional['derrotas'] import plotly. graph_objects as go fig = go. Figure() fig. bar(x=dataframe_bidirectional['usuário'], y=dataframe_bidirectional['derrotas'], orientação='h') fig. show() ``` No gráfico de barras bidirecionais acima, você pode ver quantas perdas e vitórias ocorreram para cada usuário. ## Gráficos de Área Os gráficos de área são uma combinação de linha e gráfico de barras. A área abaixo de uma linha é sombreada para mostrar como as valores dos diferentes grupos mudam ao longo de um período de tempo. Aqui está um exemplo de um gráfico de área: ```python # dataframe_area = … # df_minutos = df_area[["0m", "1m"]] # df_minutos. rename(columns={"0m": "zero_m", "1m": "one_m"}, em_lugar=True) import plotly. graph_objects as go fig = go. Figure() fig. area(y=df_minutos['zero_m'], grupo_de_estacione='one', nome='Zero', opacidade=0. 5) fig. area(y=df_minutos['one_m'], grupo_de_estacione='one', nome='Um', opacidade=0. 5) fig. show() ``` No gráfico de área acima, você pode ver como as valores de zero_m e one_m mudam ao longo de um período de tempo. ## Função layout A função do layout no Bokeh library cria uma grade de gráficos, que é bastante útil para a criação de painéis. Permite criar quadros de gráficos em um layout, de modo que possa ver todos os gráficos e entendê-los sem perder qualquer dado. ```python # lollipop_chart = … # missing_and_murdered_pie_chart = … # donut_chart = … from bokeh. layouts import row, column, gridplot layout = gridplot([[lollipop_chart, missing_and_murdered_pie_chart], [donut_chart]], modo_esticiona_tamanho='esticiona_ambos') ``` Neste exemplo, você pode ver como usar a função layout no Python Bokeh. É extremamente fácil de usar, e você só precisa configurá-lo conforme você deseja ver os gráficos. # Tutorial de Visualização de Dados ## Visão Geral Este tutorial vai guiar você pela criação de gráFicos interativos usando a biblioteca Bokeh em Python. Aprenderemos a criar um painel de dashboard para representar o cavalo-potência em carros, tornando nosso gráfico interativo e maximizando a informação possível com um gráfico individual. - Instalar os módulos necessários: `pandas`, `bokeh. plotting`, `bokeh. models`, `bokeh. io`, seaborn, matplotlib, plotly. - Importar o data frame que contém informação de carros (nomes, potência, preço e links de imagens). - Criar uma fonte de dados coluna para facilmente passar dados para os glyps Bokeh. - Utilizar a função `figure()` para plotar um gráfico horizontal. - Definir propriedades do gráfico, como o intervalo Y, largura, altura, título, etiqueta do eixo X, ferramentas, renderização do gráfico, ferramenta de leitura, e a lenda. ## Pré-requisitos - [Python 3. x](https://www.python.org/downloads/) - [Distribuição Anaconda](https://www.anaconda.com/products/individual) (Recomendado para gerenciamento de ambiente mais fácil) - Conhecimento básico de Python e manipulação de dados (por exemplo, pandas) ## Configuração 1. Instalar pacotes necessários: ```bash conda install -c anaconda pandas bokeh bokeh. io seaborn matplotlib plotly ``` Substitua `pandas` e `bokeh` por `pandas=1. 3. 5` e `bokeh=2. 4. 2` se desejado. 2. Criar um novo arquivo Python e importar as bibliotecas e dados: ```python import pandas as pd import bokeh. plotting as bplot from bokeh. models import ColumnDataSource, HoverTool from bokeh. io import show, output_notebook from bokeh. transforms import FactorCategoricalMap from bokeh. palettes import brewer # Importar dados data = {'Nome do Carro': ['Carro1', 'Carro2', 'Carro3', 'Carro4', 'Carro5', 'Carro6', 'Carro7', 'Carro8'], 'Potência': [100, 200, 300, 400, 500, 600, 700, 800], 'Preço': [20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000], 'URL da Imagem': ['carro1_image. jpg', 'carro2_image. jpg', 'carro3_image. jpg', 'carro4_image. jpg', 'carro5_image. jpg', 'carro6_image. jpg', 'carro7_image. jpg', 'carro8_image. jpg']} df = pd. DataFrame(data) ``` 3. Ler os dados em uma fonte de dados coluna: ```python source = ColumnDataSource(df) ``` 4. Criar um gráfico horizontal usando a função `figure()`: ```python output_notebook() p = bplot. figure(title="Carros com Top Potência", x_axis_label="Potência", tools="pan, wheel_zoom, box_zoom, reset, save") # Definir o intervalo Y com os nomes de carro úniques p. x_range = bplot. FactorRange(factors=df['Nome do Carro']. unique()) # Definir colunas para valores X e Y p. retângulo(x='Nome do Carro', y='Potência', width=0. 9, height=0. 4, source=source, cor=brewer[len(df)]) # Adicionar Ferramenta de leitura de tó Верtor hover = HoverTool(tooltips=[ ('Nome do Carro', '@Nome do Carro'), ('Preço', '@Preço'), ('Imagem', '<img src="@URL da Imagem">'), ]) p. add_tools(hover) # Adicionar uma lenda legend = p. legend. legend_items[0] legend. orientação_do texto = 'vertical' legend. localização = 'top_right' legend. font_tamanho_texto = '10px' # Exibir o gráfico show(p) ``` # Comparando a construção de visualizações em Excel e Tableau Neste tutorial, utilizaremos a versão gratuita de Tableau Public, que possui algumas restrições, como a falta de integração com R e suporte para até 1 milhão de linhas de dados. Além disso, qualquer dado publicado aqui faz parte do domínio público, portanto não é adequado para informações de empresa privada. Há um novo ferramenta chamada Tableau Prep onde você pode preparar seus dados visualizando-os antes de se conectar e construir relatórios. Há também a Tableau Online, versão cloud-hosted do Tableau Server, em que você pode publicar seus painéis e compartilhá-los de forma segura. A Tableau Server oferece uma opção de ser hospedada em casa. ## Construindo uma visualização em Excel Começaremos com um arquivo de Excel preenchido com dados para fins demonstrativos. Em Excel, para saber a quantidade vendida e a soma de vendas para cada região, podemos criar uma tabela de resumo. Aqui está uma breve descrição do processo: 1. Selecione as células apropriadas. 2. Crie uma tabela de resumo em um novo folho. 3. Adicione 'Região' às Colunas. 4. Adicione 'Vendas' e 'Quantidade' às Linhas. 5. Defina os valores para serem somados. 6. Organize 'Vendas' e 'Quantidade' de Linhas de modo que sejam exibidos um acima do outro. ## Construindo uma visualização semelhante em Tableau Em Tableau, conectaremos-nos ao dado e Tableau automaticamente separa as dimensões dos medidores. Aqui está uma visão geral rápida do processo: 1. Selecione 'Região' e coloque-o nas Colunas. 2. Adicione 'Quantidade' (se necessário). 3. Duplique 'Vendas' para adicioná-lo à visualização. 4. Você pode reorganizar 'Quantidade' abaixo de 'Vendas' para que sejam exibidos um acima do outro. 5. Use a caixa Show Me para explorar visualizações possíveis. NossoTableau oferece rápida flexibilidade para converter texto em visualizações. ## Requisitos de instalação de Tableau Public Para Tableau Public, você precisará de um sistema operacional Windows 7 ou superior ou um Mac Operating System 10. 11 ou superior. Para instalar Tableau Public, siga estas etapas: 1. Pesquise "Tableau Public Download". 2. Clique no primeiro link. 3. Insira seu endereço de email e clique em "Download o aplicativo". 4. Após o download, deve ser possível abrir Tableau Public. Depois de instalado, abra Tableau Public e encontrará a seguinte interface: - Fontes de dados diferentes a partir do qual você pode se conectar (limitado em Tableau Public compared a Tableau Desktop) - Abrir: Mostra visualizações anteriormente abertas - Connectar dados: Ótimo para quando você já começou a sua visualização - Descobrir: Vídeos de como-fazer, visualização do dia, e habilidades reconhecidas pelo usuário - Painéis: Visualizações múltiplas ao mesmo tempo - História: Uma sequência de visualizações para contar uma história Conecte-se a um fonte de dados (por exemplo, Microsoft Excel), escolha seu arquivo e siga as diretrizes para começar a construir suas visualizações em Tableau. # Tabelas de Bases de Dados: Criando e Formatando Visualizações O Tableau é uma ferramenta de visualização de dados potente que permite aos usuários criar gráficos e gráficos interativos e informativos de forma fácil. Nesta guia, vamos passar pelas bases de uso do Tableau, incluindo a criação e formatação de visualizações. ## Colunas e Regiões 1. Para criar uma coluna por região, arraste uma dimensão para o "Colunas" prato. Isso resultará em uma coluna para cada valor único na dimensão. Se você quiser tirar uma dimensão do visualização, pode simplesmente tirá-la de volta ou usar o comando "desfazer" ou "Ctrl+Z". 2. O Tableau tem a vantagem de ter um número ilimitado de desfazer, então você pode facilmente desfazer qualquer alteração que você faz. Por exemplo, se você quiser trazer uma nova dimensão como "Cidade", pode arrastá-la para o "Linhas" prato e obter uma coluna por cidade. ## Cor dos Bars 1. Para ajustar a cor dos bars, clique no "Cor" marca na barra de ferramentas e selecione uma cor. Você também pode determinar a cor base em uma outra dimensão arrastando-a para o "Cor" marca. Neste caso, cada região terá sua própria cor distinta. 2. Para medidas, a cor será contínua, variando de claro para escuro de acordo com o valor da medida. Por exemplo, se você quiser que as barras sejam mais escuras onde houver vendas mais altas e mais claras onde houver vendas mais baixas, arraste a medida para o "Cor" marca. ## Tamanho dos Marcadores 1. Para ajustar o tamanho dos marcadores manualmente, clique no marcador e arraste-o. 2. Alternativamente, você pode determinar o tamanho baseado em uma medida arrastando-a para o "Tamanho" marca. Neste caso, o tamanho do marcador aumentará com o valor da medida. ## Etiquetas 1. Para exibir etiquetas para uma dimensão, arraste-a para o "Etiquetas" prato. Você pode ajustar qual etiqueta aparece em cima clicando e arrastando as etiquetas no "Cartão de Marca". 2. Você também pode formatar as etiquetas clicando com o botão direito do mouse na etiqueta e selecionando "Formatar". Isso permite que você altere a cor, fonte e outras opções de formatação. ## Ferramentas de Sondagem 1. Para exibir ferramentas de sondagem, clique no marcador de ferramentas de sondagem na barra de ferramentas. Quando você passar o cursor sobre um marcador, a ferramenta de sondagem será exibida com o valor do campo selecionado. ## Ordenação 1. Para ordenar os marcadores, clique no "Ordenar" marca na barra de ferramentas e selecione o campo que você deseja ordenar por. Você também pode ordenar manualmente clicando e arrastando os marcadores. ## Filtros 1. Para criar filtros, clique com o botão direito do mouse em uma dimensão e selecione "Mostrar Filtro". Isso adicionará a dimensão ao cartão de filtros, permitindo que você exclua determinados valores do visualização. ## Tipos de Visualizações 1. Você pode alterar o tipo de marcação manualmente clicando e arrastando dimensões e medidas para os pratos "Linhas", "Colunas" e "Detalhes". Por exemplo, arrastando uma dimensão Para organização de dados de produtos e vendas em Tableau Comecemos descendo até o botão mais baixo de itens de venda menos vendidos. Aqui, encontramos nossos produtos, que podem ser agrupados por sub-categoria e categoria. ``` Para colocar um produto novamente à via, basta remover o nome do produto e enfocar nas hierarquias. Um produto se enquadra em uma subcategoria, que se enquadra em uma categoria. Você pode criar uma hierarquia arrastando uma subcategoria para uma categoria, criando a hierarquia de produto. Agora, a categoria é a mãe da subcategoria. Em seguida, pégue o nome do produto e coloque-o abaixo da subcategoria. Isso mostra que a categoria é a mãe, seguida pela subcategoria e, em seguida, pelo nome do produto. Destacamos assim que você pode expandir e colapsar facilmente categorias pertencentes pressionando o botão de "atributir mais". ## Visualização de Dados de Vendas Com as categorias e subcategorias organizadas, podemos ter uma visão geral das vendas por categoria, subcategoria e nome do produto. Útil quando se cria uma seção detalhada para os usuários. Quando um usuário deseja saber as vendas de uma categoria específica, ele pode filtrá-las e subcategorias. Por exemplo, se eles estão interessados em tecnologia, podem desmarcar móveis e fornecimentos de escritório para se concentrar apenas na tecnologia. Agora, adicionaremos mais profundidade a nossa visualização. 1. Coloração por Vendas: Arraste vendas para a paleta de cores para colorir cada célula de acordo com seu valor de vendas. Isso ajudará a identificar rapidamente quais regiões têm as maiores vendas. 2. Ajustando a Opacidade: Clique no ícone de cor para ajustar a opacidade, tornando-o um pouco transparente para uma melhor comparação visual. 3. Hierarquias em Datas: O Tableau tem hierarquias incorporadas em datas. Aqui, podemos arrastar a data de pedido para colunas para ver os anos distintos. Caso arrastemos o lucro para linhas, o Tableau dividir automaticamente os dados em quartais. 4. Datas Contínuas: As datas contínuas repetem-se, com seções superior e inferior. A seção superior é discreta, enquanto a seção inferior é contínua. Alterando o tipo de dados, podemos transformá-la de dados discreto em dados contínuo, alterando a visualização de cabeçalhos para eixo. ## Campos Calculados Vamos criar nosso primeiro campo calculado, chamado de profit ratio. Você pode criar campos calculados clicando na flecha, que lhe oferece a opção de criar campos calculados, ou clicando no espaço em branco abaixo das dimensões ou medidas e direito-clicando para criar campos calculados. Estaremos criando um campo calculado denominado "profit ratio" com a fórmula "lucro / vendas". Agora, vamos criar um segundo campo calculado chamado "profit ratio agregado" com a fórmula "sum(lucro) / sum(vendas)". Comparando os dois campos calculados, "profit ratio agregado" e "profit ratio", vemos que eles comportam-se de maneira diferente no Tableau. Para entender a diferença, vamos fazer um exemplo de uma ordem única com todos os seus produtos. A partir da análise de "profit ratio agregado", ele calcula a divisão do lucro sobre as vendas antes de agregar as informações. Por outro lado, "profit ratio unaggregated" faz o cálculo do lucro sobre as vendas para cada produto, e depois soma as informações individuais. Em geral, você desejará usar "profit ratio agregado", punindo a agregação antes de realizar o cálculo. Agora, limpe-se o painel e construa uma nova visualização, visualizando a região a partir do profit ratio, colorido pela região. Você também pode arrastar o lucro e as vendas para ver todos as três lado a lado, separadas sequencialmente por região. Para detalhes adicionais, vamos criar campos calculados para contar o número total de clientes e encontrar as vendas por cliente. 1. Total do número de clientes: Crie um campo calculado com a fórmula `count(distinct cliente id)`. 2. Vendas por Cliente: Crie um campo calculado com a fórmula `sum(vendas) / total number of customers`. Colocando o campo calculado "total de clientes" em substituição para o campo calculado "vendas por cliente", podemos agora ver a razão de vendas por cliente e identificar as regiões que possuem as maiores vendas por cliente. ``` Este formato foi mantido, e a tradução para o português europeu. Por favor, observe que termos técnicos foram mantidos em inglês. Certifique-se de que a estrutura Markdown é preservada no formato exatamente assim como está aqui. # Documentação Técnica de Exemplo ## Controle de Visualizações ### Mapa de Árvore Para criar um Mapa de Árvore que mostre as vendas por região, siga estes passos: 1. Clique nas caixas `Vendas` e `Região`. 2. Selecione `Mapa de Árvore` a partir do botão `Mostrar-me`. 3. Altere o tamanho para representar as vendas e cor para representar lucro. 4. Para ajustar as cores, arraste `Lucro` e coloque-o sobre `Vendas`. 5. Modifique o `colorPalette` para `Rosas Divergentes Vermelha-Azul`. 6. Vá para `Avançado` e defina o ponto deCentro em `0`. 7. Rótulo como **Vendas x Lucro por Região**. ### Mapa Para visualizar vendas por estado: 1. Duplique-se no `Estado` para gerar longitude e latitude. 2. Altere o tipo de marcação para `Área preenchida da Mapa`. 3. Ajuste o tamanho para exibir as vendas, ou altere de novo back para círculos baseado na preferência. - **Nota: ** Tableau fornece diretrizes de tamanho na linha de tamanho para impedir a superposição de regiões. 4. Nomeia a sheet como **Vendas por Estado**. ### Gráfico de Barras Para criar um gráfico de barras por categoria: 1. Arraste `Categoria` para o Recortes de Colunas. 2. Dou no `Vendas` para colocá-lo em texto, depois arrastre para o Recortes de Linhas. 3. Adicione `Lucro` ao Recortes de Linhas para uma comparação lado-a-lado. 4. Mude os símbolos para ambas as séries conforme preferência. 5. Para sobrepor gráficos no eixo comum, vai ao Adiantado, clique com o botão direito sobre o segundo medida (por exemplo. , Lucro) no Recortes de Linhas e clique em `Eixo Duplo`. 6. Ajuste o tamanho e as cores de acordo com a sua preferência. 7. Nomeia a sheet como **Vendas x Lucro por Categoria**. ### Folha de Detalhes 1. Arraste `Subcategoria` para Linhas, depois abra produtos. 2. Adicione `Vendas` e `Lucro` a Colunas para gráficos de barras separados. 3. Ajuste as cores conforme à preferência da série correspondente. 4. Defina as cores através do Adiantado > Divergentes Rosas Vermelhas com um ponto de cento em `0` para Lucro. 5. Ordene por lucro para uma comparação mais fácil. 6. Nomeia a sheet como **Folha de Detalhes**. ## Painel 1. Mude o tamanho do painel para `1400 x 1000`. 2. Adicione `Vendas x Lucro por Região`, `Vendas x Lucro por Estado` e `Vendas x Lucro por Categoria` no painel. 3. Use o filtro para permitir aos usuários filtrar em vários painéis com base em regiões. 4. Análise de dados definindo regiões específicas e categorias. ## Parâmetros e Conjuntos Criar um parâmetro para permitir que os usuários escolham o número de clientes mais importantes que querem ver e um conjunto que define um grupo de dados com base nas vendas. ## Conclusão Esta documentação demonstra como criar diferentes visualizações, filtros e parâmetros no Tableau. Utilize estas tecnicas para analisar e interpretar dados de forma eficiente para melhor tomada de decisão. # Criando e formatando gráficos de massa dupla em forma de roda de doces em Tableau Nesse tutorial, iremos aprender a criar e formatar gráficos de massa dupla em forma de roda de doces em Tableau. ## Pré-requisitos - Famíliaresa com Tableau Desktop - Um conjunto de dados contendo informações de vendas agrupadas por região ## Criando um gráfico de roda de doces com eixo único 1. Abra o Tableau e conecte-se ao seu conjunto de dados. 2. Arraste o campo `Vendas` até a área `Colunas`. 3. Altere a agregação de `Soma` para `Contagem`. 4. Altere o tipo de marca para `Massa`. Agora tem um gráfico de roda de doces básico para representar a distribuição de `Vendas` por diferentes regiões. ## Criando um gráfico de roda de doces com eixos duplos 1. Duplique o gráfico de roda de doces anteriormente criado. 2. Mude o tipo de marca do gráfico duplicado para `Círculo`. Nesse momento, você terá duas cartões de marcas separados: um para o gráfico de roda de doces e outro para os marcadores de círculo. Você manipulará cada cartão de marca para criar a visualização desejada. ## Ajustando o gráfico de roda de doces 1. Selecione o cartão de marca de roda de doces e ajuste o valor do campo `Tamanho` para o mesmo valor em todos os gráficos de roda de doces. 2. Para alinhar a roda de doces com os dados relevantes, altere o ângulo para ser baseado no campo `Vendas`. 3. Remova o campo `Vendas` do campo `Tamanho` para garantir que todos os gráficos tenham o mesmo tamanho. ## Ajustando os marcadores de círculo 1. Altere o tipo dos círculos para `círculo`. 2. Para distinguir os círculos, remova o campo `Vendas` do campo `Tamanho`, já que ele está representado no gráfico de roda de doces. 3. Remova o campo `Vendas` do campo `Cor` e adicione o campo `Região` ao invés disso. ## Deslocando as Gráficas 1. Selecione ambos os cartões de marca. 2. Clique em `Eixos duplos` para combinar os dois gráficos em um único painel. ## Ajustando a aparência geral do gráfico 1. Ajuste o tamanho e o tamanho do círculo interno dos marcadores de círculo para ajustar as fatias do gráfico de roda de doces. 2. Mova o campo `Região` do campo `Legenda` para o campo `Legenda` de marca do círculo para exibir os nomes de região. 3. Aligne o rótulo de marca do círculo para o centro. 4. Oculte a legenda e as etiquetas do eixo para focar na visualização. ## Adicionando rótulos de vendas 1. No cartão de marca de roda de doces, adicione o campo `Vendas` ao campo `Legenda`. 2. Formate os rótulos para exibir como moeda sem casas decimais. ## Ajustando os recursos de exibição 1. No cartão de marca de roda de doces, remova o campo `Min([Número de Registos])` do restart Nagios. 2. Personalize o restante do recurso de exibição para mostrar apenas o campo `Vendas` e o total de vendas para cada gráfico. Agora tem formato gráficos de roda de doces com eixos duplos para analisar dados de vendas em Tableau. ! [Gráfico de roda de doces com eixos duplos auto-formatado](https://i.imgur.com/IHkI7DX.png) Para mais recursos avançados na análise de dados e criação de painéis, explore mais características em Tableau, como a personalização de paletas, bordas e linhas de grade. Para acessar os conjuntos de dados mencionados nesse tutorial, [entre em contato](https://stackoverflow.com/users/12782287/carlomost) com o time de aprendizado do Simply e eles irão te responder. # Configuração do Dashboard ## Passos para ligar a categoria a filtros 1. Arraste o `categoria` para a seção `filtros`. 2. Escolha `Todos` e clique em `OK`. 3. Clique com o botão direito `categoria` e clique em `Mostra filtro`. Será exibido no lado direito. 4. Repita o processo para `Lucro por Ano`, usando o atalho `Clique com o botão direito -> Mostra filtro`. ## Explicação - Mesmo tendo dois filtros separados de `categoria` em cada folha de cálculo, resulta em alterações diferentes nas gráficos. Para solucionar isso, deveríamos: 1. Remova ambos os filtros de ambas as folhas de cálculo. 2. Selecione a folha de cálculo `Lucro por Ano` e remove o filtro de `categoria`. 3. Selecione a folha de cálculo `Vendas por Ano` e garanta que o mesmo filtro influa em ambas as folhas de cálculo: 1. Clique com o botão direito no filtro e selecione `Aplicar a folhas de cálculo`. 2. Na seção `Folhas de cálculo seleccionadas`, selecione ambas `Vendas por Ano` e `Lucro por Ano`. ## Começando um filtro para influar em ambas as folhas de cálculo 1. Na folha de cálculo `Lucro por Ano`, revise o filtro de `categoria`. 2. Na folha de cálculo `Vendas por Ano`, configure o filtro para influar em ambas as folhas de cálculo: 1. Clique com o botão direito no filtro. 2. Passe o cursor sobre `Aplicar a folhas de cálculo` e clique em `Folhas de cálculo seleccionadas`. 3. Na seção `Folhas de cálculo seleccionadas`, garanta que ambas `Vendas por Ano` e `Lucro por Ano` estejam seleccionadas. ## Passos finais 1. Permita seleções múltiplas no filtro recém-configurado com um dropdown. 2. Adicionar filtros para `categoria` e regiões (usando a forma mais curta: clique com o botão direito -> `Mostra filtro`). 3. Modifique a seleção temporal para ser modificável pelos utilizadores. 4. Transforme campos contínuos como `data da ordem` em um intervalo para o filtro. ## Nota Quando usar um dashboard de dupla acesso, garanta que as eixos estão sincronizados ou bem etiquetados, e resolva linhas sobrepostas se filtrar pela direcção de menos regiões. --- ## Recursos Adicionais do Dashboard ### Mostrar as vendas totais e a divisão por regiões 1. Crie um gráfico de dois acessos para `Vendas por Ano`. 2. Remova `região` da cor e faça a linha combinada uma. 3. Remova a marca de retângulo do segundo medidor na seção `rows` e faça um eixo duplo. 4. Ao passar o cursor, adicione a dica de ferramenta de `vendas totais`, pois a cor-por-região não está mais presente. ### Sincronização dos eixos no dashboard 1. Na folha de cálculo do dashboard `Vendas por Ano`, edite os eixos e renomeie o eixo `lucro` como `lucro total`. 2. Modifique o eixo de `lucro por região` para `lucros por região`. 3. Sincronize o eixo para clareza. ### Ocultar determinados elementos 1. Em ambas as folhas de cálculo, esconda as cabeçalhas para uma aparência mais limpa. --- ## Solução de problemas num dashboard filtrado Se uma linha sempre mostrar o total, mesmo tendo um filtro aplicado, é porque o filtro aplica-se na totalidade do dashboard. Para solucionar isso, remova a ferramenta de dica desnecessária. --- ## Novo Dashboard: Vendas por Região 1. Crie uma nova folha de cálculo chamada `Vendas por Região`. 2. Crie um gráfico de pizza com a `região` como dimensão e a `soma de vendas`. 3. Defina o tamanho das laças como `percentual do total`. 4. Etiquete cada laça com os nomes de `região`. 5. Adicione filtros para cada região. # Painel de Vendas Melhorando a documentação técnica em Markdown: A seguir, temos a documentação do painel de vendas. O texto original foi editado mantendo as seguintes regras: 1. MARKDOWN FORMATAÇÃO: Formato segundo as regras estabelecidas com #, **, `, ``, >, -/*, ---, URLs intactas 2. ESTRUTURA: Organização em seções claras com títulos, parágrafos, listas e enumerações e preservação da hierarquia de títulos 3. CONTEÚDO: Correção de erros de pontuação e gramática, preservação de termos técnicos, códigos, URLs e referências exatamente como estão ## Painel de Vendas Este painel mostra as vendas por região, estado e subcategoria. Imagens: sorry, embeddings não são suportados neste contexto ### Filtrar os dados Para filtrar os dados, clique com o botão direito no local desejado, clique em "Mostrar filtro" e selecione o tipo de filtro desejado. Neste caso, usamos "Categoria" e "Data de ordem" como filtros. ### Visualizações Através dos gráficos e visualizações, temos uma melhor compreensão das vendas por região, estado e subcategoria. Podemos ver, por exemplo, a distribuição das vendas por estado lado a lado, com comparação entre regiões através de fifthbar Chart, e também um voluntário por tela, comparando as vendas por subcategoria. Podemos ainda obter informações sobre os principais upsellers em uma tabela de confusão. ## Painel de Lucros O painel de Profit irá apresentar as informações de lucros de acordo com a mesma estrutura dos dados das vendas. Imagens: sorry, embeddings não são suportados neste contexto ### Filtrar os dados Filtragem parecida à do Sales Dashboard. Os filtros são aplicados a todos os worksheets, temos a opção de utilizar ou não determinados worksheets para serem afetados pelos filtros. ### Visualizações Comparado ao Sales Dashboard, o Profit Dashboard apresentará as mesmas informações com a tag "Sales" substituída por "Profit". Na visualização do mapa, por exemplo, as áreas verdes representarão a perda de lucro. Outras visualizações como o fifthbar, confirmaremos as perdas com a base de valor de lucro. # Análise de benefícios: Visão Geral Uma gráfica de área pode fornecer insights valiosos sobre os lucros de diferentes categorias, além de sua evolução ao longo do tempo. Aqui está uma descrição de alguns benefícios de usar uma gráfica de área: 1. **Benefícios por Categoria: ** - Uma gráfica de área pode ajudar-te a determinar qual categoria é responsável por quanto lucro. Uma linha gráfica também poderia ser usada para este propósito, mas é o seu área que define isso. Com uma gráfica de área, você pode ver a área ao longo do tempo, compará-la e também apilhá-las um sobre o outro, de modo que possa saber que, para o ano de 2013, o nosso lucro foi aproximadamente cinquenta mil dólares. 2. **Análise mais detalhada: ** - Se você deseja análises ainda mais detalhadas que o ano, poderá switch para uma visualização trimestral. Isso lhe permite ver alguns lucros negativos, o que é interessante. 3. **Comparação com uma Gráfica de Pizza: ** - Para comparações, criaremos uma gráfica de pizza adicional. Ela apresentará os lucros por categoria, mas não a longo do tempo. Possuindo ambas as gráficas de pizza e área, você pode compará-las e ter uma melhor compreensão dos seus dados. - Para criar uma gráfica de pizza, você pode escolher começar do zero ou duplicar a gráfica de lucro por região existente (para a comparação entre uma gráfica de pizza e uma área). 4. **Modificação dos detalhes de visualização: ** - Ao trabalhar com uma gráfica de pizza, o nível de detalhes da gráfica não vai ao nível da categoria por região (como fizera antes). Para mudar isso, você pode mover 'Região' da seção 'Detalhes' para a seção 'Legenda'. - No entanto, mover 'Região' para os dicas não funciona a este nível, pois a cobertura regional é muito ampla para dicas significativas. Neste caso, as dicas apenas mostrarão 'Região' como uma estrela, indicando que a seção do pão imagens abrange várias regiões. 5. **Filtros: ** - Para melhor organizar os seus dados, possuímos filtros para categoria e subcategorias. Alguns filtros, como o filtro de categoria, já estão em vigor, mas não possuímos o filtro de subcategoria ainda. - Para adicionar o filtro de subcategoria, basta clicar com o botão direito em 'Subcategoria' e escolher 'Mostrar filtro'. 6. **Criação do Painel: ** - Nosso painel será chamado de 'Painel de Benefícios'. Vamos começar exibindo os lucros ao longo do tempo por região e lucros por categoria. Depois de os arranhar, podemos usar a opção 'Selecionar um Contêiner de Layout' para torná-los 'Flutuantes' de modo que possam se encontrar no mesmo espaço. 7. **Ajuste no Painel: ** - É sempre uma boa ideia pagar atenção à seção destacada, pois lhe dá uma ideia da sequência que você está arrastando. 8. **Título do Painel: ** - Nosso painel possui um controle para exibir o título de painel. Se você quiser ter um título no topo do painel, basta clicked-aquela opção. Quando você clica, os objetos flutuantes não deslocarão como os outros elementos. # Documentação Técnica: Linkando e Formatando Painéis em Tableau ## Filtragem de Dados por Ano Realizaremos a mesma ação onde filtraremos os dados para o ano. Pode ver que eu comecei a escrever "ano" e mostra-lhe que nas opções abaixo deste painel, tem todos estes diferentes opções neste painel. Se recordar, estamos usando o continuo marcado pela pequena calendária para que ele saiba que é uma data de calendário ao invés de tratar-se apenas como um campo discreto. **Excelente! ** Passaremos ao "Painel de Lucro. " Aqui estamos, esta visualização. Como você provavelmente lembra, quando é filtrado para apenas um ano, não é muito útil, mas uma coisa que você pode fazer é selecionar ambos os anos. Eu farão isso por meio de Crtl + clicar, clique, clique. Agora, temos os anos de 2015 e 2016. Assim como fizemos isso quando quisemos associar duas painéis, poderia anotar uma nota no texto de ferramenta para essa que isso não funciona para a ligação de região nesta área, ou talvez tivemos que não ter a linha total no mesmo gráfico. Você pode ter uma visualização separada que mostre o total ou um gráfico de barras em vez disso, e isso evitará o problema de ir para o "Painel de Vendas" não se relacionando adequadamente. ## Criando o Painel Final: Lucro e Vendas por Segmento Agora, vamos criar nossa última painel, nosso painel de segmentos, e vai usar um parâmetro nelas. Portanto, vamos renomear isso. Vamos chamá-lo "Análise por Segmento lucro e Vendas. " Você não precisa renomear todos os seus painéis com uma descrição de o que são, mas isso é verificado muito útil e fácil, e ele automaticamente mostra-o por cima. Mas se quisstes mudar isso, você pode simplesmente entrar aqui e rename essa qual você gostaria, e então ela irá apenas aparecer por cima. Poderíamos chamar isso "Análise por Segmento. " Clique em "Aplicar" ou "OK" e assim já vai. Isto é, isso não tem que ser o mesmo. Se avançarmos novamente, "Análise por Segmento" e "Análise por Segmento" lucro e Vendas, isto permite que você tenha alguns nomes ainda mais úteis abaixo, o que facilita quando você os está olhando lado a lado, mas tenha um nome que corresponda a seu painel por cima. Ótimo! Agora, estamos criando um gráfico de barras e círculos para "Lucro e Vendas". Vá a aparecer um gráfico de barras e círculos, e então traremos o nosso segmento que não olhamos ainda: consumidor, corporativo e um escritório doméstico. Em seguida, olharmos por segmento e vamos fazer uma matriz com a categoria. Podemos preencher este espaço com nossas visualizações, portanto, iremos fazer vendas, e essas barra irão se mostrar para que possamos ver tecnologia vendas por consumidor por corporativo por escritório doméstico. Isso é uma matriz de gráficos de barras, mas também queremos poder ver o lucro e ao mesmo tempo, atualmente faz duas conjuntos de visualizações, mas queremos apenas um. Portanto, let's dual axis, e already feito alterou para círculos. Também não estamos sincronizando os eixos agora porque lucro é azul e estes lucros estão muito longe dos lucros em burstas, o que é lógico, você não deve ter lucro com o lucro acima de vendas. Então, sincronizemos nossos eixos e mudei em primeiro lugar o marcard de vendas nesta área para associar-se a vendas. É fácil como os dois card de marcaçoes estão baseados em uma medida diferente para que mostre a qual medida você está afetando. Vamos mudar isso para um gráfico de barras e agora temos um círculo em um gráfico de barras. Se lucro estivesse a frente de vendas, você pode ver que está depois, e isso pode corrigir utilizando-o colocando a frente de vendas. Outra maneira em que você pode corrigir isso é, se você quer o eixo do lucro aqui por alguma razão. Você pode clicar com o botão direito no eixo e "Tipo de Marca" ou "Mover Marcas para o Frente. " Outra maneira de alterar isso é não precisamos ambos estes, então não mostraremos istos. Não precisamos que este seja relabelizado "Lucro" porque é para ambas elas. A maneira de se deleirar isso é realmente você clica em "Editar Eixo" e em seguida você apaga o título. A única coisa a se lembrar é que você clica em "Duas Marcas" e é para que não comprometa a sincronia. # Treinamento em Tableau - Parte 2 ## Resumo Nesta sessão, exploraremos o Tableau em profundidade, abordando temas discutidos na Parte 1 e apresentando novos conceitos. ### Conhesões Vivas vs Conhesões Extratas - As conhesões vivas atualizam-se de acordo com as atualizações da fonte de dados, atualizando quando o relatório é aberto, em contraste com as conhesões extratas, que são conjuntos extratos de dados para melhor desempenho. - Um exemplo ilustrando a diferença entre as conhesões vivas e extratas pode ser fornecido abaixo: ``` - Conhesão Viva: 1. Atualizações da fonte em base a atualizações no source. 2. Exemplo: Alteração dos dados no estoque de amostra, onde `Kelly Williams` está associado à região Central, mas isso muda para `Sarah Smith`. Neste caso, atualizar o relatório mostrará `Sarah Smith` como a nova região para a fonte de dados. - Conhesão Extrata: 1. Conjuntos de dados extraídos não atualizam quando a base de dados é atualizada; eles atualizam apenas quando o refresh é iniciado manualmente. 2. Exemplo: Se um refresh não estiver programado, as alterações nos dados da fonte, como a mudança de `Kelly Williams` para `Sarah Smith`, não serão refletidos no extracto até que um refresh explicitamente seja iniciado. ### Juntas e Unilhas - As juntas criam relações entre duas fontes de dados, e o Tableau escolhe automaticamente a coluna para juntar com base em nomes concordantes. - Tipos de juntas: Interna, à Esquerda, à Direita, Full Outer. - A unilha adiciona múltiplas fontes de dados como linhas, garantindo que o mesmo dado não seja duplicado sob colunas diferentes. ### Cálculos de Tabela - Os cálculos de tabela são realizados localmente no Tableau após a agregação ter ocorrido. - Exemplos de cálculos de tabela: `Rank()`, `Total Crescente`, `Média`, etc. ### Ações de URL - As ações de URL permitem a navegação para páginas web internas ou externas de acordo com a interação do usuário dentro de visualizações do Tableau. ### Linhas de Referência e Bancos - As linhas de referência proporcionam uma ajuda visual para compreender tendências nos dados. - As bandas de referência permitem a criação de bandas visuais através dos blocos de dados para segmentar os dados. ### Visualizações Avançadas - Análise de Atrasos: Identificação de atrasos em processos e seus impactos. - Gráfico Waterfall: Representação visual de alterações acumuladas nos dados. ### Cálculos de Nível de Detalhe - As cálculos de nível de detalhe permitem a avaliação de dados em diferentes níveis de agregados, de acordo com as necessidades visualizativas. Na Parte 1 do treinamento de Tableau, apresentamos as bases do Tableau, a criação de barras de dois lados e barras de dois lados múlti-dimensional e criação de ligações entre painéis de painéis. Agora, vamos discutir as diferenças entre conhesões vivas e conhesões extratas. --- No Tableau, compreenda a significance de conhesões vivas e extratas: 1. As conhesões vivas atualizam-se conforme a fonte de dados atualiza, mostrando o dado mais recente quando o relatório é aberto. Em contraste, as conhesões extratas criam um subconjunto de dados para melhor desempenho. 2. Na uma conhesão viva, se tipificar dados na fonte e em seguida atualizar o relatório, a modificação será refletida no relatório. Além disso, com uma conhesão extratada, será necessário atualizar manualmente o extracto para ver as modificações. Um exemplo para demonstrar as diferenças: - No estoque de amostra de exemplo, um altera dados de `Kelly Williams` para `Sarah Smith` na região Central. - Na conhesão viva, atualizar o relatório mostrará `Sarah Smith` como a nova região para a fonte de dados. - Para uma conhesão extratada, a modificação não será reflectida até que o extracto seja atualizado manualmente. Adicionalmente, você pode programar intervalos de atualização para o extracto, por exemplo, diariamente ou horariamente. --- Ao trabalhar com várias fontes de dados em Tableau, considere juntar dados para combinar e analisar informações relacionadas. - Para juntar fontes de dados no Tableau: 1. Comece com as tabelas que você gostaria de juntar. 2. Arraste uma tabela para criar uma relação de junção, e o Tableau escolherá automaticamente uma coluna para junção com base em nomes concordantes nos dois dados. 3. Se as fontes de dados não tiverem colunas com o mesmo nome, você precisará escolher manualmente as colunas para junção em cada tabela. 4. Escolha o tipo de junção (interna, à esquerda, à direita, ou full outer) que você deseja executar. Exemplo de juntas com diferentes estruturas de tabela: | Tabela de Estudantes | Tabela de Nota | |------------------------------|----------------| | Nome do Estudante | Chave para Nota | | Chave para Estudante | Nota | Nesse exemplo, uma tabela de alunos com nomes de alunos e chaves correspondentes está relacionada a uma tabela de notas que contém pares de chave para nota e notas reais. É importante verificar o dado antes de combiná-lo, evitando erros, por exemplo, a inclusão de notas em vez da chave de nota, que pode afetar a precisão dos dados combinados. --- O Tableau oferece diferentes tipos de juntas: - Junção Interna: Incluir apenas linhas onde ambas as tabelas podem ser juntadas. - Junção à Esquerda: Tirar apenas linhas da tabela à esquerda e apenas as partes da tabela à direita que se aplicam à tabela à esquerda. - Junção à Direita: Tirar apenas linhas da tabela à direita e apenas as partes da tabela à esquerda que se aplicam à tabela à direita. - Junção Full Outer: Incluir todas linhas de ambas as tabelas, independente de se a junção pode ser completada ou não. # Funções de Rank em Tableau: Densa, Modificada e Única Este documento fornece uma visão geral do uso de funções de rank em Tableau, com ênfase na *Densa*, *Modificada* e *Única* rank. ## Duplicar e Editar: Rank Densa por Vendas 1. Clique em **Duplicar** e **Editar** para criar uma nova folha de trabalho. 2. Renomeie esta folha de trabalho como **Rank Densa por Vendas**. 3. Clique duas vezes no **Rank** para começar a escrever. Redenomie-o para **Rank Densa**. 4. Clique duas vezes no **Rank Densa** para abri-lo. A diferença aqui é que **Rank Densa** devolve o ranking onde valores iguais são atribuídos um ranking igual, mas não são inseridos espaços nos números. Clique em **OK** para aplicar as alterações. ! [Exemplo de Rank Densa](rank_dense_example. png) ## Rank Modificada por Vendas 1. Duplique a folha de trabalho **Rank Densa por Vendas** e renomeie-a para **Rank Modificada por Vendas**. 2. Mude o nome de **Rank Modificado** para evitar uma mensagem de erro (Tableau não permite o mesmo nome). 3. Clique duas vezes no **Rank Modificado por Vendas** para abri-lo. *Rank Modificado* devolve o ranking competitivo modificado onde valores iguais são atribuídos um ranking igual. Por outro lado, atribui a opção menor quando ambos recebem o mesmo ranking. ``` Clique em Rank Modificado e ele diz que devolve o ranking competitivo modificado onde valores iguais são atribuídos um ranking igual. Mas o que acontece de vez é que quando ambos recebem três para o terceiro lugar, ambos recebem quatro, que é a opção mais baixa. ``` ## Rank Única 1. Duplique a folha de trabalho **Rank Modificada por Vendas** e renomeie-a para **Rank Única**. 2. Mude o nome de **Rank Única** para `Rank Única Perfeita`. *Rank Única* torna-se um ranking único mesmo quando compartilham o mesmo número. ``` Clique em **Rank Única** para ver os resultados (um dois três quatro e cinco). ``` ## Ordenação e Ações Coveraremos a ordenação e as ações em seções posteriores deste guia. ## Ações em URL 1. Crie uma nova folha de trabalho e crie uma ação **Ir para URL**. 2. Nomeie a ação `Wiki`, e configure-a para atingir apenas a folha de trabalho que acabaremos de renomear (atualmente **Folha 6**). 3. No campo URL, configure-o para `https://en.wikipedia.org/{estado}` (substitua `{estado}` pelo estado que deseja procurar). 4. Teste o link para confirmar que funciona corretamente. 5. Renomeie a folha para **Filtrar por Estado**. 6. Vá para **Ações** e desmarque a ação **Ir para Subcategoria** de afetar a folha de trabalho **Filtrar por Estado** para evitar conflitos. Agora, ao clicar num estado, ela irá abrir a página da Wikipedia do estado em seu navegador. Isso pode ser muito útil quando você tem dados que contêm IDs de pedido que você pode inserir em um URL para acessar a página de interface web do seu sistema para o pedido. Nas seções seguintes, cobriremos a ordenação, as ações e mais sobre o uso de funções de rank em Tableau. # Guide: Usando Bands de Referência e Linhas em Tableau (Português) Este guia você irá passar pela processo de utilizar Bands de Referência e Linhas em Tableau. ## Oklahoma vs Texas 1. Para selecionar Oklahoma, navegue no painel de Objetos na página web, mas seja cuidadoso para desmarcar Oklahoma quando arrastar itens para a página web. 2. Quando fazer uma seleção, a metade inferior da tela mostrará uma página. Clicar em Oklahoma não abrirá uma nova aba; em vez disso, será destaqueado dentro da visualização. 3. Para mudar a seleção para o Texas, basta desmarcar Oklahoma e selecionar Texas. Se desmarcar uma seleção e sair da página, ela permanecerá com base no último item selecionado. ## Bands de Referência e Linhas 1. Crie uma nova folha chamada "Linhas de Referência. " 2. Encontre a linha de referência no painel de Análise. Ela desena uma linha em sua visualização com dados na tela. 3. Crie uma visualização com sua categoria desejada e subcategoria. Clique duas vezes em "vendas" e mova-o para Linhas para criar barras. 4. Para definir uma célula, arraste a subcategoria para "cor" porque é a nível mais baixo. Cada célula terá então sua própria linha de referência. 5. UTE o diálogo para modificar e personalizar suas linhas de referência. 6. Se colocar a linha de referência no Painel, ela atuará de maneira semelhante à ter uma categoria em uma cor. Cada pane diferente terá sua própria linha de referência. 7. Se colocar a linha de referência na Tabela, ela criará uma linha de referência para toda a tabela. ## Cálculo de Médias 1. Para encontrar a média para cada seção, mova "categoria" de volta para "cor" e coloque "linha de referência" no Painel. 2. A linha de referência será baseada na média e usará o valor de "vendas totais. " No entanto, ela não inclui as vendas individuais que compõem cada seção; em vez disso, ela calcula a média entre as seções. 3. Você pode alterar o rótulo da linha para exibir a média em um valor específico em dólares ou escolher "personalizado" para introduzir seu rótulo desejado. 4. Também é possível ter uma linha de referência mostrando a linha recálculada para pontos de dados destacados ou selecionados, permitindo-o a vista da média exatamente do que você selecionou. ## Uso de Bands de Referência e Linhas As bands de referência e linhas são ferramentas valiosas para criar vários tipos de visualizações, como cartas de balão. Se tiver quaisquer dúvidas sobre este processo, sinta-se à vontade para perguntar nos comentários abaixo, e a equipe de Aprender Simples responderá. ## Análise pela Média de Dias para Entrega 1. Nesta análise, estamos analisando a média de dias para entrega por estado e modo de envio. Mova "média dias para entrega" para Colunas e ordene-o por "modo de envio" de forma crescente para uma comparação mais intuitiva. 2. Crie um campo de cálculo chamado "análise de atraso" com um formato de formatos de formatação condicional. Se a média de dias para entrega for inferior ou igual a 2, retorne "entrega antecipada. " Se for maior ou igual a 5, retorne "entrega atrasada. " Se a média de dias para entrega não for inferior a 2 e maior que 2, retorne "na hora. " 3. Crie uma carta de waterfall chamada "Waterfall de Lucro" baseada no lucro para o ano de 2014 filtrando as datas de pedido para esse ano. 4. Altere a ordem das categorias na carta de Waterfall de acordo com suas preferências. 5. Crie uma soma total do lucro e um lucro negativo duplicando o campo de lucro e adicionando um sinal negativo na frente. Use o lucro negativo para determinar o tamanho da faixa com riscos. 6. Para observar as vendas totais ao longo do tempo e como foram alcançadas, altere os blocos em uma faixa com riscos e loco original para cor. O lucro é representado por azul para valores positivos e laranja para valores negativos. 7. Examine como cada mês contribuiu para as vendas totais visualizando os blocos para cada mês e observando os pontos de início e fim. Isso fornece uma compreensão completa de onde ocorreram problemas e dos meses que tiveram o maior impacto positivo sobre as vendas. # Cálculo do Nível de Detalhe: Pedidos por Cliente Mostraremos um exemplo com finalidade de trazer todos nossos clientes através do ID, em seguida, trazer o ID de pedido. Adicionaremos todos os membros, mas incluiremos então a transformação, onde alteramos o ID de pedido de uma dimensão para uma medida. Isso nos permite ver cada cliente e o número de pedidos que ele tem. Vamos ordenar a mostra: - Um cliente tem 17 pedidos - Sete clientes têm 13 pedidos - Alguns clientes têm 5, 6, 7 ou 17 pedidos Se quiséssemos criar uma visualização que mostrasse quantos clientes tinham quantos pedidos e qual numero de pedidos foi mais popular, teríamos que fazer um cálculo de nível de detalhe. ## Cálculo de Nível de Detalhe: Fixo O cálculo de nível de detalhe permite construir uma visualização e introduzir métricas que estejam a um nível diferente do mostrado na visualização. Para alcançar isso, criaremos uma field calculada chamada `Pedidos por Cliente`. Não seremos vamos ter nossa visualização a nível de cliente, então o faremos como fixo. Você pode escolher as dimensões, e ele realiza uma agregação usando apenas aquelas dimensões especificadas. No nosso caso, teremos-o baseado no `ID do cliente`. ```markdown fixed [ID do cliente] get ID Distinto de pedido ``` Garanta-se que ele se encerre com o bracket curvo, e deve-se haver erros. Após o toque no ok, podemos agora ver o número de pedidos por cliente. ### Extrair os dados Vamos primeiro tirá-los de fora e fazê-los um campo de dimensão. Depois, tiramos-nos até nas colunas. Agora podemos ver quais clientes tem o número de pedidos. Quando sorteamos de maior para menor, podemos ver que: - 134 clientes pediram cinco itens ou tiveram cinco pedidos - Cinco é o próximo mais popular - Sete é o menos popular - Um é relativamente despopular Isso pode ajudar-nos a analisar quantos itens nos nossos clientes costumam comprar. Talvez, sugerindo boas opções, possamos fazer-lhes subir para cinco pedidos. --- # Cálculo de Nível de Detalhe: Análise de Clientes Novos Nesta seção, vamos fazer uma análise sobre clientes novos. Chamaremos este cálculo de nível de detalhe `Análise de Clientes Novos`. Primeiro, pegaremos a data e tiraremos-a para cima aqui, para uma linha de gráfico ou qualquer coisa sobre o tempo, utilizaremos-a como um eixo continuo, e em seguida tiraremos o `ID do cliente` e colocaremos no rodapé, mas fará-mos isso como `ID Distinto de cliente`. Agora podemos ver o número de clientes para cada dia. Tiraremos `região` e a expandiremos por região. Clicaremos em `Central`, e agora podemos ver que inclui todos os clientes. No entanto, se quiséssemos incluir apenas um cliente quando ele fazer seu primeiro pedido, teríamos que criar uma field calculada chamada `Novo ou Existente`. ```markdown fixed per cliente ID get Min of order data ``` Para comparar a `data de pedido` por cliente com a sua primeira `data de pedido`, utilizaremos a função `Min`. Agora, ao nos tentarmos devolver alguma coisa diferente baseado na visualização, ele sempre retornará o mínimo para cada cliente ID. Usaremos isso no filtro para mostrar apenas os clientes novos. - Filtrar por `Novo ou Existente`: `Novo` Agora podemos ver o número de clientes novos ao longo do tempo. Ele depende do valor anterior e acrescenta nossos clientes novos. A alterar o nível (de dia para mês ou ano), podemos ver como os clientes novos estão se acumulando ao longo do tempo para cada região. --- Em resumo, aprendemos sobre fontes de dados de tabela atualizadas em tempo real Tableau e uniões e juntas onde tabelas para fontes de dados, cálculos de tabela versus base de dados, as diferentes classificações, a construção de ações em nossas painéis (acções de filtro, acções de destaque, acções de URL), a utilização de marcas de referência e faltas, e a análise de tempo médio para envio e análise de atraso. Também construímos painéis que utilizaram marcas de referência e outros que utilizaram faltas de referência, e olhamos nalguns cálculos de nível de detalhes. Tópicos de dashboard futuros: 1. População Mundial 2. Saúde 3. Economia 4. Empresas Caso queira aceder ao dataset antes de começar este tutorial, não hesite em comentar abaixo caso quisermos ensinar-lhe como obter acesso. Em caso de quaisquer dúvidas fique a vontade em comentar. --- Nos conjuntos de painéis futuros, farámos: - Construir um painel a torno da população, utilizando mapa baseado em país. - Construir um gráfico da população ao longo do tempo, mostrando o crescimento da população e um forecast para anos futuros. # Visualização da Tendência Este trecho descreve a criação de uma linha de tendência para sua previsão e chamaremos esta tendência de "excelente". Vamos fazer uma outra visualização para este dado e será uma diagramática circular (pie chart). O *pie chart* também será baseado em população. Clique em 'População' e execute um *ctrl clique* em 'País'. Vá para 'Mostrar' e clique em seu *pie chart*. Faça com que a visualização ocupe todo o espaço para que possamos ver melhor o *pie chart*. Agora isso está se tornando um tempo demorado e pelo que pensei, vou alterar minha decisão. Em vez disso, vá até 'Região' e arraste-o sobre 'País'. Agora vem algo um pouco mais gerenciável. Vemos agora que a ' Europa' representa a maior parte do *pie* e ali está o resto do mundo. Por enquanto, cada parte deste gráfico está marcada como 'População Total'. Podemos manter a notação assim ou podemos fazer o que fizemos antes e alterar para 'percentual da População Total'. Neste *pie chart*, iremos mostrar apenas ' Europa' versus o resto do mundo. Para fazer isso, devemos selecionar todos os países e *ctrl clique* e clicar em 'Grupo'. Agora temos todos os pontos selecionados e devemos editar o grupo. *Ctrl clique* em 'Editar Grupo'. Renomeie este grupo para ' Europa' (pois é o que contem ali) e renomeie o resto do mundo para 'Resto do Mundo'. Agora podemos arrastar o grupo para 'Rótulo' e veremos ' Europa' e 'Resto do Mundo'. Agora, observe como isso está subdividindo os dados para as diferentes regiões, isso porque parece que ainda temos 'Região' no detalhe aqui. Retiremos 'Região' e, por enquanto, vamos dividir a ' Europa' do 'Resto do Mundo'. Pode se alterar as cores para torná-la mais visualmente interessante. Ainda podemos ver os nossos percentuais. Renomeie o gráfico e há seu uso no dashboard. ## Criando um Dashboard (Como foi feito anteriormente e você já deve estar cientes da documentação, vou omitir uma descrição detalhada aqui. ) ### Opções de Layout de Dashboards * *Tamanho fixo*: Deixa constante os tamanhos selecionados. Não importa onde seja visualizado, sempre será visualizado da maneira que você espera. No entanto, se o relutante visualizador tiver um tamanho de tela maior ou menor, o conteúdo será truncado ou estará muito estendido e exigirá um deslocamento vertical e horizontal. * *Automático*: Adapta a tela de visualização. Não importa se a tela do relutante for maior ou menor, o dashboard se ajustará para o tamanho de uma tela ideal. No entanto, as informações podem ficar bastante saturadas e a visualização ou mudará de tamanho para ajustar ao tamanho da tela, ou irá truncar. * *Intervalo*: Define um mínimo e um máximo tamanho para o dashboard. Isso garante que o conteúdo nunca seja menor do que este mínimo, enquanto se ele for maior, o dashboard não se ajustará, mesmo preenchendo ao máximo. # Resumo (Como houve pouca mudança no conteúdo, manterei uma descrição apenas das mudanças importantes. ) Estamos mostrando como fazer a criação de um dashboard básico e acionar filtros que permitam mais interação com as visualizações. Teremos três visualizações de população com tipos diferentes nossa página, cada uma delas podendo ser filtrada. Uma opção rápida seria aplicar os filtros usando ações. Clicando em 'Usar Filtro' seria possível filtrar e desfiltrar a população por país, região ou período. Uma abordagem diferente para se aplicar filtros seria através de uma somação do uso de *filters*. Filtros por região, país ou ano podem ser adicionados diretamente no dashboard e, se forem necessários, modificados diretamente pelo usuário. Além disso, filtros em dados que permitem o uso de intervalos (*range filters*) também foram cobertos. # Tutorial de Tableau: Criação e Configuração de Painéis ## Filtragem por País No Tableau, filtrar um país específico pode ser feito seguindo algumas etapas: 1. Arraste o campo 'País' para a tabela de 'Filtros'. Inicialmente, ele irá exibir todas as opções. 2. Quando regressar à tela principal e abrir a visualização, navegue até 'Filtros' e adicione o campo 'País'. 3. Agora será exibido ao lado de outros filtros. 4. Para usar um filtragem múltipla, clique nele e será apenas afectado a visualização atual. 5. Para personalizar o filtro, clique em 'Personalizar' e, em seguida, em 'Apresentar Aplicar' para realizar alterações. ### Solução de Problemas Se as visualizações não atualizarem quando se faz alterações na janela personalizar: 1. Verifique se os resultados são calculados por uma longa tabela. Se for o caso, mude-o para calcular pelo campo 'País'. 2. Se estiver usando uma cálculo em távente verifique se está a usar a dimensão correta. ## Criação de um Mapa de Taxas de Natal 1. Para criar um mapa para taxas de natal, duplique-o no campo 'País' e altere-o para um tipo de mapa. 2. Traga 'Taxa de Natal' para o 'Cor' para mapear as cores. 3. Personalize as cores clicando no campo 'Cor' da carta de 'Marcas' e selecionando 'Editar Cores'. 4. Mude as cores para vermelho e ouro, com vermelho representando uma taxa de natal mais alta, associada a países que apresentam bem-estar pessimo. 5. Defina uma 'Classe de Taxa de Natal' duplicando a 'Taxa de Natal' e corrige as primeiras 50 cidades com a taxa de natal mais alta como tendo uma 'Aver-Risco de Natal Alarmante'. #### Solução de Problemas 1. Se 'Resultados são calculados' exibir um mapa longo, mude-o para calcular pelo campo 'País'. 2. Se necessário, sincronize as eixos num gráfico blended para garantir que ambas as visualizações tenham a mesma escala. ## Adaptabilidade do Painel - Dê um título ao painel e ajuste o tamanho conforme necessário. - Para ocultar títulos, clique neles e selecione 'Ocultar Título'. - Use o modo de tela inteira para testar o painel e visualizá-lo como o utilizador final. ## Criação de uma Gráfica de Esperança de vida 1. Criar uma gráfica numa data pela três receber 'Ano' para 'Colunas' e mudar para 'Este Ano' na seção de 'Continuous'. 2. Duplique a 'Esperança de vida feminina' e a 'Esperança de vida masculina' para criar duas chartes separadas. 3. Combine as chartes numa charta blended arrastando a 'Esperança de vida masculina' para o eixo da 'Esperança de vida feminina'. 4. Ajuste a escala da charta blended para visualizar a esperança de vida ao longo do tempo, e adicione tendências e previsões conforme necessário. ## Adaptabilidade de Medidas - Mude os pontos decimais em medidas conforme necessário para clareza e interpretação. - Em um heatmap use paletas distintas entre as medidas. - Personalizar as paletas de cores para atender às suas necessidades. Titulo: Painel de Saúde ====================== Introdução ---------- Neste tutorial, vamos construir um painel de saúde que mostra taxas de natalidade, expectativa de vida e despesas em saúde usando cores palhetas distintas e mapas de calor. Este é o resumo do painel: 1. Mapa com taxas de natalidade 2. Mapa de calor 3. Gráfico de linha para Expectativa de Vida (Masculino vs Feminino) 4. Filtragem: País e Ano Mapa com Taxas de Natalidade ---------------------------- 1. Adicione o mapa com taxas de natalidade 2. Atualize as cores para melhor distinção (vermelho, ouro e passo) 3. Coloque as legendas no topo usando um contentor horizontal 4. Ajuste o tamanho para acontecer conforme o seu tamanho desejado removendo restrições de largura fixa Mapa de calor ------------- 1. Adicione o mapa de calor 2. Ajuste o tamanho das legendas e coloque-as no topo usando um contentor horizontal 3. Organize as legendas na ordem (Expectativa de Vida, Taxa de Natalidade) Gráfico de linha para Expectativa de Vida (Masculino vs Feminino) ---------------------------------------------------------------- 1. Adicione o gráfico de linha para Expectativa de Vida (média para masculino vs feminino) Filtragem --------- 1. Tray "País" nas filtragens: - Use "Todos" e aplique para selecionar folhas de trabalho - Sim X10. NAVEGAÇÃOATENÇÃOPRECISAO qual folhas de trabalho estão no painel de anuncio quando selecionar do todo da pasta de trabalho 2. Tray "Ano" nas filtragens: - Deixe os usuários escolherem anos para o número de anos distintos disponíveis - Aplique a folhas de trabalho para taxa de natalidade e media de esperança de vida (masculino vs feminino) - Não faça a filtragem do gráfico de linha por ano para manter o contexto sobre o tempo Conclusão ---------- Quando você implementar estas alterações, terá um painel de saúde com cores palhetas distintas, mapas de calor e filtragens para taxas de natalidade, expectativa de vida (masculino vs feminino) e despesas em saúde. Próximo Painel: Painel de Economia ----------------------------------- 1. Mapa com GDP global 2. Gráfico de dispersão para GDP versus GDP per capita 3. Gráfico de barras para GDP em Saúde Fique atento para mais! # Economia Dashboard: Mapa de Negócios em 2012 A seguinte visualização apresenta os principais países do mundo, onde a escala de cor representa a facilidade para fazer negócios em cada um dos mesmos. Abaixo estão alguns passos essenciais para criar este dashboard: 1. **Ajuste da escala: ** Quando selecionamos um país específico na nossa visualização, o mapa é normalmente reescalonado apenas para os países selecionados. Isso ocorre porque, se nossos dados são incompletos para um outro país, a escala é reajustada apenas para os dados disponíveis. 2. **Filtragem: ** Você pode controlar o mapa aplicando filtros às nossas outras visualizações. Por exemplo, ao aplicar o filtro para a França, as visualizações para Alemanha, Suíça e Áustria também são filtradas. É possível as visualizar ou manter as informações nulas em zero quando publicarmos o dashboard no servidor. 3. **Bar Chart: Dias para iniciar um negócio: ** A primeira visualização do dashboard é um gráfico de barras representando o tempo mínimo necessário para iniciar um negócio em cada país. É importante saber quantos dias leva iniciar um negócio em um país alvo, pois isso pode ser um indicador de como fácil ou difícil é fazer negócios em tal país. 4. **Bar Chart: Facilidade de fazer negócios: ** Esta visualização apresenta a facilidade de fazer negócios em cada país, baseada em nossos dados. Esta visualização também dá a possibilidade de comparar as regiões e visualizar quais delas tem o melhor índice de facilidade de fazer negócios. 5. **Anotações: ** É possível adicionar anotações às nossas visualizações, para poder comparar as regiões e os dados de taxa de crescimento nacional e regional dos telefones e da internet ao longo do tempo. É importante saber as tendências de telefone e internet quando você está planejando começar um negócio. Para melhor utilizar este dashboard, recomendamos que você explore os recursos do Data Studio e aproveite todos os recursos disponibilizados pelo seu ambiente, para obter uma visão mais compreensível de qualquer análise que você faça. ### Removendo o Filtrador Atual e Criando um Novo Vamos remover o filtrador atual e criar um novo que selecione apenas o ano de 2012. Este novo filtrador não estará ligado ao outro filtrador. Portanto, ao alterar o ano da visualização, apenas será afetado o filtrador selecionado. Por vezes, pode ser útil observar: - Faça um coletor de valores únicos com lista descecíveis - coloque-o ao lado da visualização As modificações no filtrador terão efeito apenas na visualização específica, reduzindo a confusão para os usuários. Outra melhoria que podemos aplicar a todos nossos desenhos é atualizar os títulos. Devem ser mais empresariais ou with user-friendly. Pára bem, agora temos o filtro, vamos utilizar-o. Acionando a Nova Zelândia, podemos ver que é as regulamentações mais empresariais e observar o uso da internet e do telefone ao longo do tempo. Poderemos clicar em vários países para ver alterações no uso. Observa-se que alguns países apresentam uma alteração mais abrupta, o que significa que adoptaram mais rapidamente o uso da internet e do telefone. No entanto, outros países apenas começaram a adotar essas tecnologias. Se quisermos filtrar a um país específico, podemos fazer como antes e criar um filtrador de país. ### Navegando para uma Folha Aqui está outra forma de navegar para a folha: 1. Clique no seta abaixo e selecione `Navegar para a Folha` 2. Navegue para a folha movendo o cursor para a visualização ou à folha destacada 3. Clique na folha que preferir, e a área correspondente será destacada. 4. Também é possível usar a pequena seta de pop-up para navegar para a folha desejada. Volte ao nosso painel, e: 1. Iremos para `Filtradores` 2. Selecione `País` 3. Faça um coletor de valores multiplos 4. Adicione o botão `Aplicar` 5. Faça as alterações aplicarem-se a todos os desenhos clicando em `Aplicar a Todos os Trabalhos >programas de folha seleccionados > Dashboard`. Agora, podemos ver que se queremos apenas analisar o Afeganistão, podemos ver: - O número de dias que demora iniciar um negócio lá - Uso da internet e do telefone ao longo do tempo Estas são as nossas quatro painéis. Como resumo, criamos um painel para: 1. População 2. Saúde 3. Economia 4. Fácil de fazer negócios --- ### Visão Geral da Inteligência Empresarial A Inteligência Empresarial (BI) é um conjunto de processos e técnicas para analisar dados brutos e extrair informações que ajudam a tomar decisões de negócios. A BI ajuda a rastrear os dados de negócios e extrair informações úteis. Alguns ferramentas populares usadas na BI incluem: - Power BI - Tableau - ClickView --- ### Visão Geral do Power BI Bem-vindo a este tutorial do Power BI! Você vai aprender sobre: 1. A necessidade de Power BI 2. Características do Power BI 3. Componentes do Power BI 4. Arquitetura do Power BI 5. Um caso de estudo de Mire e um demo do Power BI --- ### Porque Necessitamos do Power BI O Power BI possui a capacidade de acessar vastos volumes de dados de várias fontes. Ele permite que você visualize, analize e visualize grandes quantidades de dados que não podem ser abertos em Excel. Algunas fontes de dados importantes disponíveis no Power BI são: - Excel - CSV - XML - JSON - PDF, etc. --- ## Power BI: Características e Componentes ### Power BI Desktop - Um software gratuito que pode ser baixado para construir relatórios acessando facilmente os dados - Não necessita de habilidades avançadas em projeto ou consultas de relatório para construir um relatório ### Stream Analytics - O Power BI suporta análise de fluxos em tempo real de sensores de fábrica a fontes de mídia social ### Suporte a Múltiplos Fontes de Dados - Acesse fontes de dados variadas como Excel, CSV, SQL Server, arquivos da web, etc. , para criar visualizações interativas ### Personalizada a Visualização - A visualização personalizada é outra característica essencial do Power BI, que permite acesso à biblioteca personalizada de visualizações que atendem às suas necessidades --- ## Componentes do Power BI 1. Power Query - O motores de transformação e agregação de dados - Permite o descobrimento, conexão, combinação e refino de fontes de dados 2. # Criando um Relatório no Power BI Desktop para Análise de Dados de Vendas Neste relatório, você será guiado através da visualização de gráficos e gráficos diversos para extrair informações sobre a venda de produtos em diferentes países. Vamos começar! ## Pré-requisitos 1. Abre o Power BI Desktop no seu computador. 2. Importe dados: - Vá para a "Guarde Dados" guia. - Escolha o Excel como a fonte de dados. - Selecione o arquivo de amostra de finanças e escolha `Sheet1`. - Clique em "Carregar" para importar os dados. ## Visão Geral Após a importação dos dados, você encontrará todo o conjunto de dados na guia "Dados". O conjunto de dados contém campos como `segmento`, `país`, `nome do produto`, `unidades vendidas`, `preço de venda`, entre outros. Vamos começar a construir nosso relatório. 1. **Adicionar Textbox**: Nomeie-o `Dashboard de Finanças`. Ajuste a dimensão, fonte, alinhamento e fundo conforme necessário. ## Visualizações ### Matriz 1. Crie uma Matriz: - Vá para a guia de `Visualizações`. - Clique em `Matriz`. - Selecione o `campo de venda` e arraste-o para a seção de `Valores`. #### Formatação para Matriz 1 - Vá para a guia de `Formato`. - Clique em `Cabeçalhos de Coluna` e adicione uma cor de fundo. - Aumente o tamanho do texto para 20. - Faça o mesmo para a seção de `Valores`. - Defina a cor da borda em preto. ### Matriz 2 - Repita os passos para a Matriz 1, mas selecione `unidades_vendidas` neste momento. ### Gráfico Simples de Coluna - Crie um Gráfico de Coluna Agrupado: - Vá para `Visualizações`. - Selecione `Gráfico de Coluna Agrupado`. - Arraste o `campo de data` para `Eixo` e o `campo de venda` para `Valores`. #### Formatação para o Gráfico de Coluna - Vá para a guia de `Formato`. - Clique em `Borda` e ajuste a cor e espessura. ### Gráfico de Pizza - Crie um Gráfico de Pizza: - Vá para `Visualizações`. - Selecione `Gráfico de Pizza`. - Arraste o `campo de segmento` para `Legenda` e o `campo de venda` para `Valores`. #### Formatação para o Gráfico de Pizza - Vá para a guia de `Formato`. - Clique em `Borda` e ajuste a cor e espessura. ### Tabela - Crie uma Tabela: - Vá para `Visualizações`. - Selecione `Tabela`. - Arraste o `campo de produto` para `Valores`. #### Formatação para a Tabela - Vá para a guia de `Formato`. - Aumente o tamanho do texto para ambos `Valores` e `Cabeçalhos de Coluna`. - Adicione uma borda ao redor da tabela. ### Mapa - Crie um Mapa: - Vá para `Visualizações`. - Selecione `Mapa`. - Arraste o `campo de país` para `Localização` e o `campo de venda` para `Tamanho`. #### Formatação para o Mapa - Vá para a guia de `Formato`. - Adicione uma borda ao redor do mapa. ### Gráfico de Donut - Crie um Gráfico de Donut: - Vá para `Visualizações`. - Selecione `Gráfico de Donut`. - Arraste o `campo de segmento` para `Legenda` e o `campo resultado` para `Valores`. ### Árvore - Crie uma Árvore: - Vá para `Visualizações`. - Selecione `Árvore`. - Arraste o `campo de venda` para `Valores` e o `campo de produto` para `Grupo`. ## Estilos e Tema ### Mudar a Cor - Para mudar a cor das barras ou outras visualizações, vá para a guia de `Formato` e, sob `Cores de Dados`, escolha a cor desejada. ### Trocar Tema - Você pode alternar o tema para dar um aspecto mais atraente a seu dashboard. Para fazer isto, vá para a guia de `Formato` > `Temas` e escolha um tema que jogue com seus gostos. Eis aqui! Agora você tem um relatório que visualiza os dados do conjunto de dados financeiro utilizando vários tipos de gráficos e gráficos. Quando estiver satisfeito com seu relatório, você pode publicá-lo no Power BI Service para extrair informações. Bem-vindo a explorar o mundo do Power BI! 😊 # Data de Entrega e Coluna de Nome Completo - Criação Este documento explicará como definir a data de entrega e criar uma coluna de nome completo em uma tabela. ## Data de Entrega A data seguida por uma segunda data será nossa data de entrega, também conhecida como `ship_date`. Quando você insere uma data, pressionar "Enter" exibirá o valor total de dias que levará para entrega do produto. ## Coluna de Nome Completo Para criar uma coluna de nome completo, vamos concatenar o primeiro nome e o sobrenome do cliente. 1. Crie uma nova coluna e renomeie-a como `full_name`. 2. Saira de `orders` tabela e pegue o primeiro nome, pelo comando `amber send` seguido por um espaço, em envolventes de aspas duplas, e outro ampersand, depois do sobrenome. Depois destas etapas, você terá uma coluna `full_name`. Se você voltar, verá que havia duas colunas - `first_name` e `last_name`. Agora, temos unificado as duas colunas em uma única coluna chamada `full_name`. O primeiro nome, um espaço e o sobrenome são agora exibidos na coluna `full_name`. ## Coluna Vendas Valor Monetário Para dar à coluna `sales` um valor monetário: 1. Selecione a coluna `sales`. 2. Em `Geral`, vá para `Moeda`. 3. Escolha qualquer símbolo de moeda que você deseja, para este exemplo, vamos usar o dólar, denominado em língua inglesa, Estados Unidos. Agora, nossa coluna `sales` é representada em dólares. Faça alterações semelhantes à coluna `profit`, padronizando-a para exibir dois dígitos decimais. ## Painel de Comércio ### Visualização do Relatório Na visualização do relatório, você encontrará as novas colunas que criamos, como `dia da semana`, `fim de semana`, `este ano`, `este trimestre`, `mês` e `dia da semana ou fim de semana`. Você pode ver estas colunas tanto em `Visualização do Modelo` quanto em `Campos`. ### Caixa de Texto e Visualizações - Crie uma caixa de texto e lhe dê um título, por exemplo, "Painel de Comércio. " - Ajuste o tamanho, faça-o em negrito, alinhe o texto ao centro, e adicione uma cor de fundo. - Entre as visualizações, crie um novo cartão para exibir o valor total de vendas ou total de rendimentos. - Remova a coluna de vendas das `Campos` e adicione a coluna de `quantidade`. - Atualize o título, por exemplo, "Quantidade total de produtos vendidos. " - Crie outro cartão para exibir o valor total de lucro. - Remova o cartão de `quantidade` e adicione a coluna de `profit`. ## Seletor Crie um seletor para filtrar os dados pela `data da encomenda`. Você pode alterar o tamanho do texto, ativar a borda e dê-lhe um título, como "Seletor por Data da Encomenda. " ## Gráfico Linha e Coluna Empilhada Visualize as vendas e lucros por cada ano, mês e trimestre usando um gráfico linha e coluna empilhada. Arraste a coluna `data da encomenda` para o eixo compartilhado. Procure as vendas sob `Valores de Coluna` e o lucro sob `Valores de Linha`. Faça alterações nas cores dos dados, como alterar a cor dos blocos e a linha de lucro. O Power BI permite que você explora as vendas por cada ano, mês, trimestre, dia. Esse recurso pode ajudá-lo a analisar as tendências de vendas e lucros de maneira mais detalhada. ฌким # Documentação: Visão Geral do Relatório do Power BI ## Tamanho e Família de Fonte - Para definir o tamanho do texto como 15, vá para a guia de `Formato` e ajuste o tamanho do texto de forma adequada. - Para escolher uma família de fontes, escolha `Calibri`. - Você pode aumentar o tamanho de itens caso seja necessário. ## Cortador de Região - Crie primeiro o cortador de região removendo o campo `Região` e adicionando `Região` como um novo campo no cortador. - Após a preparação do cortador de região, avance para criar o cortador de estado removendo o campo `Região` e arrastando a coluna `Estado` para o campo. ## Cortador de Estado - No cortador de estado, você poderá analisar as vendas e lucros ou unidade por ano. - O Power BI fornece uma opção de pesquisa para filtrar rapidamente um estado específico. Clique na opção de pesquisa para acessar. ## Tabela - Crie uma tabela simples onde veremos a unidade e os lucros feitos em cada cidade. - Sob `Visualizações`, selecione `Tabelas`. - Adicione a coluna `Cidade` seguida pela coluna `Unidade` e a coluna `Lucros`. - Aumente o tamanho do texto para 15, altere a cor de fundo branca e adicione um fundo. - Aplique uma formatação similar às informações sob `Valores`. ## Bordas - Adicione uma borda à tabela. - Filtre cada cidade por região ou por estado. ## Filtragem e ordenação - Filtre a tabela com base nos lucros. Ordene as cidades pelo lucro. ## Cortador de Ano - Crie um cortador de ano onde poderá analisar as vendas e lucros ou unidade por ano. - Proceda da mesma forma que na criação do cortador de estado, mas use a coluna `Ano` em vez da coluna `Estado`. ## Barras agrupadas - Para analisar as vendas por cada estado e as categorias de produtos, crie uma barra agrupada. - Altere as cores para cada categoria. ## Gráfico de área - Crie um gráfico de área para verificar o lucro por ano e categoria para um estado selecionado. - Altere as cores para cada categoria. ## Linha e Cortador colunar - Para analisar as vendas, unidade, lucros por categoria e subcategoria de produtos, use um gráfico temporizado e colunar. - Use a coluna `Categoria` sob `Séries de Colunas` e a coluna `Sub Categoria` sob `Valores de Colunas`. - Escolha `Lucros` e `Unidade` sob os obturadores. ## Fún半°ivel - Crie um gráfico funnel para ver as vendas por cada segmento. - Altere as cores para cada segmento usando a cor personalizada. ## Mapa de árvores - Para analisar as vendas, lucros em termos de categorias e subcategorias de produtos a nível de região, use um mapa de árvores. ## Gráfico de rolos - Criar um gráfico de rolos para ver a unidade e as vendas por cada segmento. - Altere as cores de dados e adicione uma borda ao gráfico de rolos. ## Gráfico de dispersão - Analise as vendas, unidade e lucros por subcategoria de produtos usando um gráfico de dispersão. # Análise de vendas ## Resumo Este documento apresenta a análise de vendas realizada no dataset de exemplo "superstore". Nele, foram analisadas as seguintes informações: - Quantidade de itens vendidos - Quantidade de itens vendidos em cada categoria - Lucro nas vendas em cada categoria - Visualização da renda por ano e trimestre ## Quantidade de itens vendidos e vendas por categoria A tabela abaixo mostra a quantidade de itens vendidos e as vendas por categoria: | Categoria | Itens vendidos | Vendas (R\$) | |--------------|---------------|--------------| | Mobiliário | 1234 | 50. 000 | | Mesas | 900 | 10. 000 | | Cadeiras | 2500 | 120. 000 | ### Mobiliário A subcategoria "Mobiliário" vendeu um número baixo de itens, mas teve a maior quantidade de lucro. ### Mesas A subcategoria "Mesas" vendeu um número moderado de itens, mas não teve um lucro significativo. ### Cadeiras A subcategoria "Cadeiras" vendeu a maior quantidade de itens e teve o maior lucro. ### Mais sobre a quantidade de itens vendidos Para ver detalhes adicionais sobre a quantidade de itens vendidos em cada categoria, consulte a seção "Quantidade de itens vendidos por ano e trimestre". ## Visualização da renda por ano e trimestre As figuras abaixo mostram a renda por ano e trimestre: ### 2014 ! [Renda por ano e trimestre em 2014](ImageURL2014. png) ### 2016 ! [Renda por ano e trimestre em 2016](ImageURL2016. png) ### 2017 ! [Renda por ano e trimestre em 2017](ImageURL2017. png) > Os arquivos de imagem são de exemplo e serão removidos antes da entrega do relatório final. ## Conclusão Sobre a base do relatório, observamos que a subcategoria "Cadeiras" foi a que gerou a maior quantidade e lucro nas vendas. Sendo assim, recomendamos inicialmente analisar mais detalhadamente esse setor de produtos. --- ## Filtrando o relatório por subcategorias Para analisar as vendas de diferentes subcategorias, basta selecionar a subcategoria desejada no menu de seleção "Subcategoria". Por exemplo, abaixo é mostrado o relatório de vendas para "Cadeiras": ! [Renda por ano e trimestre nos Cadeiras](Chairs. png) ### Notas - Todas as URLs e referências existentes foram preservadas. - Este documento foi projetado para ser viewado em um ambiente organizado e limpo. Por favor, examine o texto e os setup do documento com atenção antes de utilizar-lo. # Análise de Elementos de Gráficos: Remoção da Legenda, Adição de Títulos de Acesso e Formatação de Dados Vamos discutir o processo de remoção da legenda, adição de títulos de acesso e formatação de dados em um gráfico. Vamos seguir este exemplo usando um gráfico de linha para o lucro por ano. ## Remoção da Legenda 1. Selecione o gráfico. 2. Clique no botão "Elementos do Gráfico" na guia "Ferramentas – Design". 3. Desmarque a opção "Legenda". ## Adição de Títulos de Acesso 1. Selecione o gráfico. 2. Clique na guia "Ferramentas – Design". 3. Vá para a seção "Eixos". 4. Clique em "Títulos de Eixos" e escolha "Título Principal do Eixo X" e "Título Principal do Eixo Y". 5. Insira os títulos desejados para o eixo x (Anos) e y (Lucro). ## Formatação de Dados 1. Clique num ponto de dado no gráfico. 2. Há opções para formatar os dados. 3. Clique em "Formatar Ponto de Dado". 4. Escolha "Formato de Número". 5. Selecione "Personalizado". 6. Use o código de formato para criar um formato personalizado para os seus dados. Aqui está um código de amostra de formato para os dados se o valor de lucro for superior a 9. 999. 999: ``` =SE(SUMA([Lucro])>9999999, "$"&TEXT(SUMA([Lucro])/1000000, "0. 0")&" milhão", "$"&SUMA([Lucro])) ``` Guarde as alterações, e você terá um gráfico de linha com lucro por ano formatado com formatação personalizada de números, remoção da legenda e adição de títulos de eixos. Adicionalmente, você pode formatar o título do gráfico, modificar cores, tamanho da fonte e outras possibilidades de acordo com suas necessidades. Continue a ler para aprender mais sobre a formatação e a personalização de gráficos no Microsoft Excel usando Markdown. # Painel de Dashboard: Recursos por Itens Mantenha um painel de dashboard de Excel visualmente apelativo e organizado para os recursos por itens, seguindo estes passos: 1. Adicionando Imagem de Fundo - Desmarque a grade linha clicando no `Visualização` e desmarcando a opção de `Grade Linha` - Inserta a imagem do seu dispositivo na pasta `Excel Dashboard Files` no seu `Desktop` - Nomeie a caixa de texto como "Dashboard de Recursos da Excel em Vendas" e centerá-la - Faça a caixa de texto transparente e remova a contour - Mude o tipo de fonte para Britannica Bold e tamanho para 30, e faça o texto branco 2. Inserindo ícones - Adicione um ícone representando uma loja e um carrinho ao painel para melhor apelação visual - Ajuste a posição dos ícones para melhor estética 3. Inserindo Gráficos e Formatando - Copie os gráficos criados e cole-os no painel, ajustando o tamanho conforme necessário - Remova o fundo branco de cada gráfico e faça-o transparente - Ajuste as etiquetas para evitar ficar encharcado ```markdown ## Formatando os Gráficos - Limite o fundo branco e a grade linha de cada gráfico - Converter o tipo de fonte para branco, incluindo as etiquetas de acesso e títulos dos gráficos - Ajuste os gráficos para adequar-se ao layout do painel ``` 4. Adicionando Slicers para Mais Interação (opcional) - Selecione um dos gráficos e adicione os slicers para filtrar os dados baseado em itens, regiões e canais de vendas - Conecte todas as tabelas pivotadas aos slicers para garantir que os filtros afetem toda a tabela [Veja a tutoria de vídeo completo para passos detalhados](seu-link-de-vídeo aqui) **[Painel de Dashboard]** [Apresentação com aplicações da formatação](seu-link-da-apresentação aqui) # Análise de Rendimento Dashboard ## Rendimento Total por Países Voltemos novamente à nossa folha de dados. Vamos demonstrar o rendimento total por países. ### Criação de Tabela Cônica Para começar, crie uma Tabela Cônica: 1. Clique em `Inserir > Tabela Cônica` 2. Selecione `Ok` pois quero os nomes de país sob Linhas 3. Coloque o rendimento total sob `Valores` 4. Renomeie as etiquetas de Linhas como **Países** 5. Apague o **Total Geral** no fundo 6. Desative o **Total Geral** da guia **Design** Agora, descole para baixo para garantir que o total gereral foi apagado. ### Criação de Mapa 1. Copie os dados da tabela Cônica 2. Cole-os 3. Use os dados copiados para criar um **Mapa de Campo** usando a opção `Inserir` 4. Teremos o mapa pronto ao criá-lo 5. A escala do mapa mostra regiões de rendimento baixo como cinza clara e regiões de rendimento alto como azul escuro ### Ligação do Mapa à Fonte de Dados Original 1. Clique com o botão direito no Mapa e selecione `Selecionar Dados` 2. Remova a **Relação Anterior** 3. Especificite a Nova Faixa que deve ser a tabela Pivot que criamos #### Mudança de Cor das Sombras 1. Clique em `cores` e escolha a cor preferida, por exemplo, verde ### Rendimento total por Ano e Canal de Vendas Vamos criar um gráfico de linha: 1. Clique em `Inserir > Tabela Cônica > Novo quadro` 2. Arraste `Ano do Pedido` para Linhas, `Total de Rendimento` sob `Valores` e `Canal de Vendas` sob `Colunas` Agora, temos um gráfico de linha baseado em Rendimento x Ano e Canal de Vendas, onde: - A linha azul representa o rendimento Offline - A linha amarela representa o rendimento Online ### Rendimento por Canal de Vendas (Gráfico de Pie) Vamos criar um gráfico de Pie: 1. Clique em `Inserir > Tabela Cônica` e selecione `Ok` 2. Arraste `Canal de Vendas` para Linhas e coloque `Total de Rendimento` sob `Valores` Isto resultará em um gráfico de Pie mostrando o Rendimento x Canal de Vendas. Você pode editar de acordo com a sua preferência. ### Rendimento e Rendimento por Itens Para este relatório, criaremos um gráfico de barra combinado para visualizar Total de Recém-vendas (Barras Azuis) e Total de Rendimento (Linha Orange): *[Insira gráficos complexos aqui. . . ]* Finalmente, crie uma nova guia e chame-a `Dashboard de Rendimento`: 1. Copie os gráficos criados e coloque-os no dashboard de rendimento. 2. Ajuste as dimensões, cores, fontes e formato geral conforme necessário para fazer mais visivamente apelativa. Agora temos nosso dashboard de rendimento com ponteiros interativos pararegião, país, ano, e canal de vendas, fornecendo melhores insights para os usuários. # Documentação Técnica: Criação de Painéis de Dashboard usando Gráficos Pivot ## Criação de gráfico de linha para o lucro total por ano Para entender melhor, vamos criar um gráfico de linha para mostrar o lucro total por ano. Aqui, em 2012, foi aproximadamente 51 milhões, e subiu para 54 milhões em 2013. ``` Ou o gráfico de linha do lucro total por ano, então, em 2012 foi ~51 milhões em seguida subiu para ~54 milhões em 2013. ``` Nós também modificamos o mapa. > Isso é apenas uma informação que possuímos. Você pode clicar neste e verificar as informações que Excel forneceu. ## Visualização de Timeline da Informação Agora, como disse, verificamos pelo anos. Você também pode ver isso pelos meses e pelas quartas-feiras bem como. Vou apenas desmarcar e retornar para o lugar em que estava, e reduzir o tamanho. ``` Agora suponha que você quer ver o lucro que foram gerados pelos distribuidores diferentes. Você pode selecioná-los individualmente. ``` ### lucro por Representantes Vamos selecionar Adam Churchill, por exemplo. Isso é o lucro gerado por Adam Churchill. Sempre podendo selecionar várias pessoas também. ``` Adam Churchill, isso é o lucro gerado por Adam Churchhill. ``` ### lucro por Países Agora, suponha que você queira ver o lucro por diferentes países. Você pode usar o analisador de países. Vou apenas trazer isso para o centro e expandir um pouco nossa tabela. ``` Agora queira ver o lucro gerado no let's say Reino Unido. Você pode selecionar Reino Unido. ``` ### Mapa do Reino Unido Assim, esse é o mapa do Reino Unido e conta com o lucro total gerado no Reino Unido. Abaixo, você pode ver o rendimento e lucro para todos os itens que foram vendidos no Reino Unido. Aí, você pode ver claramente que os itens de materiais de escritório foram os que geraram o lucro mais alto no Reino Unido. ``` Abaixo você pode ver o rendimento e lucro para todos os itens que foi vendido no Reino Unido. ``` ### Selecionando Mais de Um País Agora você também pode selecionar vários países, por exemplo, se eu quiser saber também da França. Então, meu mapa mudará conforme. ``` Agora quero saber também da França, então, meu mapa mudará conforme. ``` ## Nota Importante Uma coisa que me importa aqui é que os números não são milhões; eles devem ser em milhares. Por favor, marque como 'milhar' e não em milhões, mesmo para isso: 'k' e nada um milhão. ``` Agora uma coisa que me importa aqui é que estes números são realmente não milhões e devem ser em 'milhares'. ``` ## Criação do 2º Painel de Dashboard: Lucro Tivemos sucesso na criação de nosso segundo painel de dashboard a base de lucro. Vou apenas redimensionar nesta um pouco e vamos colocá-lo no lugar em que estava originalmente. ``` Veja como criar diferentes tabelas de pivot em pivot charts e depois formatámos os pivot charts conforme nossas necessidades. Vejamos como editar as cores. ``` ### Mudando o Look and Feel do Painel Vou te mostrar mais uma vez: você pode também trocar o look and feel do painel ao ir para o `Layout de Página` sob `Layout de Página`. Aqui, pode selecionar diferentes temas, já estamos com o tema `Office`. Agora vou apenas selecionar outro tema, por exemplo `Festival`. ``` Agora vou te mostrar mais uma vez, vous pouvez également changer l'aspect et le style du tableau en allant vers 'Layout de Página' sous 'Layout de Página'. ``` ## Visualização com R Nesta demonstração, vimos como criar um painel de visualização de rendimento. Criamos gráficos de linha, gráficos combinados, gráficos de disco, barras vertical e horizontais, e em seguida aprendemos a adicionar analisadores de recursos e conectamos-los a tabelas de pivot. Filtramos a nossa dados para ver o rendimento bem como o lucro por items por países, por regiões diferentes, por canais de venda. ``` E também aprendemos como criar um mapa e muito mais. ``` ## Entendendo Visão Geral de Visualização de Dados Agora, vamos aprender a visualização de dados e aqui, vamos aprender sobre R que pode ser usado para sua visualização de dados. Uma coisa que precisamos entender é pela nossa habilidade de visualizar padrões, que é altamente desenvolvida, podemos entender os dados melhor se pudermos visualizar os dados. ``` Agora vamos aprender sobre visualização de dados e aqui vamos aprender sobre R que pode ser usado para sua visualização de dados. Uma coisa que precisamos entender é pela nossa habilidade de ver padrões que é altamente desenvolvida, podemos entender os dados melhor se pudermos visualizar os dados. ``` ## Visualizações de Dados: Exploratórias versus Explicativas Há dois tipos de visualizações de dados: visualização exploratória de dados e visualização explicativa de dados. A visualização exploratória de dados nos ajuda a entender nosso dados, enquanto a visualizações explicativas nos axiablem a compartilhar nossa compreensão com outras pessoas. ``` Quando falamos sobre R, R oferece diversos truques e pacotes para criar visualizações de dados e que podem ser usados para ambos tipos de análise de dados ou ambos os tipos de visualizações. ``` ## Visualização Exploratória de Dados e Visualização Quando falamos sobre visualização exploratória de dados e visualização, a chave é manter todos os dados relevantes juntos. O objetivo quando falamos sobre visualização exploratória de dados é mostrar o que está no seu dados. ``` Quando falamos sobre as funções que vemos aqui como plot, isso é mais para uma gráfica geral de plotagem, enquanto barplot é usado para mostrar dados usando barras retangulares, logo, você pode dizer que está criando gráficos de barras. ``` ### Formatação Proporcionada para Blocos de Código ```R # Exemplo de criação de gráfico de barras library(ggplot2) # Carregar o pacote ggplot2 data(mtcars) # Carregar o conjunto de dados mtcars ggplot(data = mtcars, aes(x = factor(am), y = mpg)) + geom_bar(stat = "identity") ``` ## Visualização Explicativa de Dados e Visualização Quando fala-se sobre visualização explicativa de dados ou visualização, isso mostraria para os outros o que encontramos nos nossos dados. Nós precisamos tomar algumas decisões editoriais: qualas as características que queremos destacar para a emfase, quais características são distractores ou confusores e queremos que sejam omitidas. ``` Há diferentes maneiras de fazer isso. Quando fala-se sobre suas gráficas ou visualizações, julgo que nós temos, digamos, três tipos distintos ou quatro. ``` ### Gráficos de Base Aqui, vou fornecer um exemplo de gráficos de base. Aqui, usando as gráficos de base, posso criar uma gráfica de dispersão simples de calorias com açúcar do conjunto de dados `us. serial` no pacote `mass` e de dar um título. ```R # Exemplo de gráficos de base plot(us. serial$calories, us. serial$sugar, main = "Gráfico de Dispersão de Calorias com Açúcar") ``` ### Gráficos de Rede de Janela Usando gráficos de rede de janela eu posso criar um gráfico semelhante ao criado usando gráficos de base, mas com mais poder. ```R # Exemplo de Gráficos de Rede de Janela library(grid) pushViewport(viewport(layout = grid. layout(1, 1))) plot(us. serial$calories, us. serial$sugar, xlab = "Calorias", ylab = "Açúcar", main = "Gráfico de Dispersão de Calorias com Açúcar") ``` ### ggplot2 É uma das vezes possível usar os pacotes de Tidyverse e ggplot2 para criar visualizações complexas e personalizáveis. ```R # Exemplo de ggplot2 library(ggplot2) library(tibble) # Criar um simples conjunto de dados df <- tibble(x = c(1, 2, 3, 4, 5), y = c(6, 7, 8, 9, 10)) ggplot(df, aes(x = x, y = y)) + geom_point() ``` Até aqui! Espero que esta documentação melhorada ajude você melhor entender o processo de criação de documentos técnicos utilizando Markdown. Se você tiver alguma pergunta ou precisar de ajuda, me sinta-a livre para perguntar. # Análise de Dados: Tendência Central e Gráficos Neste guia, você aprenderá sobre a tendência central de dados e vários tipos de gráficos utilizados na análise de dados. Vamos concentrar-nos em dois exemplos – um para criar um gráfico de disco para unidades de produtos vendidos e outro para análise histograma usando o conjunto de dados de qualidade do ar. ## Exemplo de Gráfico de Disco Para criar um gráfico de disco, siga estes passos: 1. Crie um vetor contendo os valores a serem representados e passe-os. ``` # Crie um vetor x <- c(. . . ) # Valores para o gráfico de disco # Crie rótulos labels <- c(. . . ) # Atribua rótulos significativos aos valores ``` 2. Crie o gráfico de disco usando a função `plot` e passe o seu vetor e rótulos. ``` plot(pi, x, labels = labels) ``` 3. Para adicionar mais detalhes, pode modificar o gráfico com opções adicionais. Por exemplo, pode especificar o título principal e o tipo de coresência que deve seguir. ``` plot(main = "Gráfico de disco - Título", col = "azul", pi, x, labels = labels) ``` 4. Para calcular a percentagem e descobrir como criar o gráfico de disco, você pode usar a função `round`. ``` # Calcule as porcentagens percentages <- round(x / sum(x) * 100, 2) # Crie o gráfico de disco com porcentagens plot(main = "Gráfico de disco - Título", col = "azul", pi, percentages, labels = labels) ``` 5. Para um gráfico de disco em 3D, use o pacote `plotrix`. ``` # Instale e carregue o pacote plotrix install. packages("plotrix") library(plotrix) # Crie um gráfico de disco em 3D pie3D(x, labels = labels, main = "Gráfico de disco em 3D - Título") ``` ## Exemplo de Histograma Histogramas são usados na análise exploratória de dados e para entender a tendência central dos valores de dados. Para criar um histograma, siga as diretrizes mencionadas abaixo. 1. Carregue o conjunto de dados desejado (conjunto de dados de qualidade do ar usado como exemplo). ``` # Carregue o conjunto de dados air_quality <- read. csv("air_quality. csv") ``` 2. Crie um histograma para uma coluna, como `solar`. ``` # Crie um histograma hist(air_quality$solar) ``` 3. Você pode personalizar seu histograma especificando várias opções como o título principal, rótulo do eixo x e cor. ``` # Personalize o histograma hist(air_quality$solar, main = "Título - Histograma", xlab = "Rótulo do eixo x", col = "vermelho") ``` 4. Adicione limites ao histograma usando as funções `xlim` e `ylim`. ``` # Adicione limites hist(air_quality$solar, main = "Título - Histograma", xlab = "Rótulo do eixo x", col = "vermelho", xlim = c(0, 40), ylim = c(0, 50)) ``` Você pode analisar relações entre váriaveis usando gráficos de dispersão e caixas. Consulte-nos mais de informações sobre estes tópicos. --- - [Tendência Central dos Dados](#tendência-central-dos-dados) - [Exemplo de Gráfico de Disco](#exemplo-de-gráfico-de-disco) * [Passo 1: Crie Vetor e Transmita Valores](#passo-1-crie-vetor-e-transmita-valores) * [Passo 2: Crie Rótulos](#passo-2-crie-rótulos) * [Passo 3: Crie Gráfico de Disco](#passo-3-crie-gráfico-de-disco) * [Passo 4: Adicione Mais Detalhes](#passo-4-adicione-mais-detalhes) * [Passo 5: Crie Gráfico de Disco em 3D](#passo-5-crie-gráfico-de-disco-em-3d) - [Exemplo de Histograma](#exemplo-de-histograma) * [Passo 1: Carregue o Conjunto de Dados](#passo-1-carregue-o-conjunto-de-dados) * [Passo 2: Crie Histograma](#passo-2-crie-histograma) * [Passo 3: Personalize Histograma](#passo-3-personalize-histograma) * [Passo 4: Adicione Limites](#passo-4-adicione-limites) Formatação: - Preservamos todos os elementos Markdown (# ** ` [] () etc) - Mantemos a estrutura de títulos e seções - Preservamos blocos de código sem traduzir Tradução: - Use português europeu (não portugues do Brasil) - Mantenha termos técnicos em inglês - Preservamos comandos e códigos inalterados - Mantenhamos URLs intactas O texto traduzido com toda a formatação Markdown está abaixo: Diagrama de Barras Acolhidas Tutorial ------------------------------------- Crie um diagrama de barras acolhidas usando a mesma dada para estética e classe. Para criar um diagrama de barras acolhidas, use o seguinte comando: ``` geom bar(stack=TRUE) ``` argumento de preenchimento: ``` fill = drive ``` Você sempre pode voltar para a verificação de seu conjunto de dados como referência. Por exemplo: ``` # Use o conjunto de dados de drive para suas barras acolhidas drive # Trabalhe com o conjunto de dados completo complete_data_set ``` ### Diagrama de Bara Dodge Para criar um diagrama de barra dodge, use o seguinte comando: ``` geom bar(position = position_dodge()) ``` Isso coloca as barras umas embaixo das outras, o que pode ser útil em alguns casos. ### Diagrama de Ponto com Cores baseadas na classe Para criar um diagrama de ponto com cores baseadas na classe, use o seguinte comando: ``` geom point(mapping = aes(color = class)) ``` ### Biblioteca Plotly Para instalar a biblioteca Plotly, você pode usar o seguinte comando: ``` install. packages("plotly") ``` Agora, veja se podemos criar um gráfico com tendência para entender melhor seu dados: ``` # Importe a biblioteca library(plotly) # Crie um data frame vazio data <- cars # Especifique as eixos x e y, e detalhes de representação (tamanho, cor, linha, etc. ) p <- plot_ly(data, x = ~ speed, y = ~ mpg, type = 'scatter', mode = 'markers', marker = list(size = 15, color = colors(unique(data$class)), line = list(color = "black", width = 1))) # Execute o código para ver o gráfico p ``` ### Biblioteca Matplotlib (Python) A biblioteca Matplotlib é uma biblioteca aberta e gratuita que oferece suporte a tipos de desenho ricos. Ela é usada para desenhar gráficos 2D e 3D. Aqui está um tutorial simples sobre como usar a biblioteca Matplotlib na linguagem Python: 1. Instale a biblioteca Matplotlib: ``` ! pip install matplotlib ``` 2. Importe a biblioteca: ``` import matplotlib. pyplot as plt ``` 3. Crie um novo Jupyter Notebook Python 3: ``` ! jupyter notebook ``` 4. Plote um gráfico básico: ``` x = [1, 2, 3, 4, 5] y = [2, 3, 5, 7, 9] plt. plot(x, y) plt. show() ``` Este tutorial proporciona uma introdução básica ao uso da biblioteca Matplotlib na linguagem Python. Você pode explorar vários tipos de gráficos, parâmetros de gráficos e mais na documentação da biblioteca Matplotlib. # Matplotlib Subplots (Português de Portugal) Este guia vai te conduzir através da criação e personalização de subsemelhantes utilizando Matplotlib. ## Visão Geral Neste tutorial, vamos aprender: 1. Criar subsemelhantes com várias linhas e colunas 2. Adicionar eixos a cada subsemelhante 3. Personalizar o tamanho e a posição de cada subsemelhante 4. Camadas sobrepostassubsemelhantes 5. Ajustar o tamanho e o DPI do gráfico para impressões de alta qualidade ## Criando Subsemelhantes Para criar subsemelhantes, vamos utilizar a função `plt. subplots()`. ```python import matplotlib. pyplot as plt fig, axes = plt. subplots(nrows=2, ncols=2) ``` No exemplo acima, estamos a criar um gráfico com 2 linhas e 2 colunas. A variável `fig` representa o canvas, enquanto que `axes` é um array de subsemelhantes. ## Adicionar Eixos Para adicionar eixos a cada subsemelhante, podemos utilizar o método `add_axes()` na variável do objeto do gráfico. ```python fig. add_axes([0. 1, 0. 1, 0. 8, 0. 8]) ``` No exemplo acima, estamos a adicionar um eixo ao gráfico com a posição especificada a esquerda, direita, largura e altura. ## Personalizando Subsemelhantes Pode personalizar o tamanho e a posição de cada subsemelhante ao ajustar os parâmetros passados ao método `add_axes()`. ```python fig. add_axes([0. 1, 0. 1, 0. 8, 0. 8]) fig. add_axes([0. 3, 0. 3, 0. 4, 0. 4]) ``` No exemplo acima, estamos a adicionar dois eixos ao gráfico, com diferentes parâmetros a esquerda, direita, largura e altura. ## Camadas sobrepostassubsemelhantes Podemos camadas subsemelhantes em cima de cada um através de várias figuras e adicionar eixos a cada uma. ```python fig1 = plt. figure() ax1 = fig1. add_axes([0. 1, 0. 1, 0. 8, 0. 8]) ax1. plot(x, y, 'r') fig2 = plt. figure() ax2 = fig2. add_axes([0. 1, 0. 1, 0. 8, 0. 8]) ax2. plot(y, x, 'g') ``` No exemplo acima, estamos a criar dois gráficos e adicionar eixos a cada um. Em seguida, a plotamos dados encima com different cores. ## Ajustar o Tamanho e o DPI do Gráfico Para ajustar o tamanho do gráfico, podemos utilizar a função `figure()` com o parâmetro `figsize`. ```python plt. figure(figsize=(16, 9)) ``` No exemplo acima, estamos a criar um gráfico com um comprimento de 16 polegadas e uma altura de 9 polegadas. Para ajustar o DPI (dots por polegada), podemos utilizar a função `savefig()` com o parâmetro `dpi`. ```python plt. savefig('meu_gráfico. png', dpi=300) ``` No exemplo acima, estamos a salvar o gráfico como PNG com um DPI de 300. ## Conclusão Neste tutorial, aprendemos a criar e personalizar subsemelhantes utilizando Matplotlib. Foimos abarcar a criação de subsemelhantes com várias linhas e colunas, a adição de eixos a cada subsemelhante, a personalização do tamanho e posição de cada subsemelhante, a camada de subsemelhantes sobrepostas, e a ajustar o tamanho e DPI do gráfico para impressões de alta qualidade. Boa sorte! 😊 ## Configurando Legendas em Matplotlib Este tutorial vai te ajudar a configurar legendas em Matplotlib para várias plotagens. ## Título da Gráfica, Etiquetas Y e Legendas Nesta seção, cobriremos o título da gráfica, etiquetas Y e legendas. A gráfica está começando a ficar bastante elegante agora, então temos algo para apresentar. - **Título** A gráfica poderá parecer um pouco tipo a cera em setup web. Para melhorá-la, talvez você queira considerar aumentar a DPI umas notas a mais (por exemplo, DPI: 200) para uma melhor claridade. - **Rótulos Y** Na configuração, existe uma opção para especificar a DPI para os subplotas. Por exemplo, faça `dpi equals 200` para torná-la mais clara. - **Legendas** Criaremos legendas separadas para cada plotagem. Façamos um array para as legendas e defina-os da seguinte forma: ``` y = [x**2, x**3] locations = [2, 3] ``` - Execute o código e veja como isso fica. Você deverá ver um legendo bom aparecer na tela. ## Características da Gráfica Agora, vamos olhar algumas características da gráfica como: - Cor da linha - Transparência - Tamanho da linha - E mais. . . ## Características das Cores e da Transparência Usando a biblioteca `matplotlib`, você não está limitado a cores especificas como vermelho. Pode mudar a cor da linha: ``` color = 'vermelho' ``` Com `color`, você pode referenciar muitas cores diferentes com base no [Mapa de Cores de Matplotlib](https://matplotlib.org/stable/tutorials/colors/colormaps.html). - Para definir a transparência (opacidade) da linha, você pode usar: ``` alpha = 0. 5 ``` Isso define as linhas como semi-transparentes. - Também pode mudar o tamanho da linha (`lw` em Matplotlib). Com estas alterações, você agora tem uma linha vermelha boia com 50% de transparência para a opacidade. ## Efeitos da Opacidade nas Linhas Definindo a opacidade e usando diferentes cores, você pode rastrear melhor linhas superpostas. Por exemplo, para virar a opacidade para destacar mais é: ``` alpha = 0. 5**2 ``` Com esta troca, você deveria ver um retângulo rosado aparecer na gráfica. - Para mudar o retângulo para a potência 0. 5, fica menos pronunciado: ``` alpha = 0. 5**0. 5 ``` Você pode ver a diferença entre o retângulo original e o novo quando ele se cruza. - Para definir a opacidade como o valor padrão, pode mudar para 1: ``` alpha = 1 ``` ## Ajustes da DPI Por padrão, a DPI está definida como 100, mas você pode definir em qualquer valor que preferir. Por exemplo: ``` dpi = 150 ``` Com esta mudança, a gráfica aparecerá mais grande e bonita para ser visualizada. - Também pode mudar o tamanho da linha (`lw`): ``` lw = 2 ``` - Se você quiser usar diferentes estilos de linha, como traços, pontos ou traços-ondas, pode usar: ``` style = '--' ``` ## Conclusão Final Experimente estas opções para criar uma representação visual ótima de seus dados com Matplotlib. # Guia de Formatação do Matplotlib: Limites de Gráficos e Gráficos 2D Este guia apresentará duas seções principais: 1. **Limites de Gráficos: ** Nosso objetivo aqui é limitar os dados para criar subplot em uma figura com uma linha e duas colunas, com um tamanho de figura de 10cm x 5cm. Vamos plotar três funções (x, x², x³) e limitar o eixo y de 0 a 60 e o eixo x de 2 a 5. ``` import numpy as np import matplotlib. pyplot as plt # Defina os dados para x x = np. linspace(0, 5, 1000) # Crie subplots, defina o tamanho da figura e plote funções fig, axes = plt. subplots(nrows=1, ncols=2, figsize=(10, 5)) # Plote funções com limites do eixo y axes[0]. plot(x, x, label='x') axes[0]. plot(x, x**2, label='x²') axes[0]. plot(x, x**3, label='x³') axes[0]. set_ylim(0, 60) # Defina limites do eixo x axes[1]. set_xlim(2, 5) # Exiba o gráfico plt. show() ``` 2. **Gráficos 2D: ** Aqui, exploraremos quatro gráficos 2D comuns: gráfico de dispersão, gráfico de passo, gráfico de barras, e gráfico preenchido. Para o gráfico de dispersão, usaremos um array do np (x) para gerar 100 pontos, e colocaremos os valores de x como x mais valores aleatórios de 0, 25 * valores_aleatórios. ``` import numpy as np import matplotlib. pyplot as plt # Crie alguns dados para o gráfico de dispersão x = np. linspace(0, 5, 1000) # Crie subplots, tamanho da figura, e configure o gráfico de dispersão fig, axes = plt. subplots(nrows=4, ncols=1, figsize=(10, 20)) # Gráfico de dispersão axes[0]. scatter(x, x + 0. 25 * np. random. normal(size=x. size)) axes[0]. set_title('Gráfico de dispersão') # Gráfico de passo axes[1]. step(x, x**2, where='post') axes[1]. set_title('Gráfico de passo') # Gráfico de barras axes[2]. bar(x, x**2, align='center', alpha=0. 5) axes[2]. set_title('Gráfico de barras') # Gráfico preenchido axes[3]. fill_between(x, x**2, x**3, alpha=0. 5, color='verde') axes[3]. set_title('Gráfico preenchido') # Exiba o gráfico plt. show() ``` Este guia também incluirá em breve outros gráficos 2D especiais, como gráficos de radar, gráficos polar, e planilhas de aquecimento, nas partes seguintes deste guia. # Operações em Arrays e Histogramas em Python Neste tutorial, aprenderemos a realizar diferentes operações em seu array e criar um histograma acumulativo detalhado. ## Histograma Acumulativo Detalhado Para criar um histograma acumulativo detalhado, definimos o `cumulative` como `True` e `bins` em um valor desejado (por exemplo, 50). ```python import numpy as np import matplotlib. pyplot as plt import matplotlib. cm as cm # Definimos cumulative como True e bins em 50 cumulative = True bins = 50 # Gera dados aleatoriamente data = np. random. rand(100) # Cria um histograma com cumulative definido como True plt. figure() plt. hist(data, cumulative=cumulative, bins=bins) # Para verificar o número de bins, vamos alterá-lo para 10 e verificarmos o resultado plt. figure() plt. hist(data, cumulative=cumulative, bins=10) # Reiniciamos cumulative como False para comparação plt. figure() plt. hist(data, cumulative=False, bins=bins) # Com cumulative definido, observe que o histograma é acumulativo, mostrando o total de ocorrências ``` ### Explicação Um histograma acumulativo é um histograma onde cada faixa representa o total de ocorrências até esse ponto. Por exemplo, se tivermos um conjunto de dados de chuvas anuais, o histograma acumulativo mostrará a chuva total ao longo do ano para cada dia. ```python # Histograma acumulativo de exemplo para chuvas anuais data = np. array([10, 20, 30, 40, 50, 60, 70, 80, 90, 100]) plt. figure() plt. hist(data, cumulative=True) ``` ! [Histograma Acumulativo de Exemplo](data: image/png; base64, iVBORw0KGgoAAAANSUhEUgAAAA4AAAANCAYAAAAfFcSJAAAADUlEQVR42mNk+M8BQDwADhgGAWj1oAAACbElEQVR4Ae2 dortrZHwC3zjfDc5UWhLQ6lkouHyyDCXakHNht8Zd/34QHNtPZu8/gW8T+C/ce+75BL8+z7xhtDtpW8yXfzqRZU58cHBQv4PhxUYAAuA/fdP8+v7+1DSe7H95P3X3+BWSvPsn9j0ZyHaZYjKJcXoj23wc99FqBn35yFbN2HTRFdtFwZInun1H+1ZbQm2uBuq1Z/DMrq0fWjQiQCtzf7WeH8EBdshR9XpVXboyXfMu8gsOfE5CV82wMIZvM2aSTpKs6ok3RARjfSruyXB/QJ//PcF9r3pBGjJPzd+dubq2alRs6lBbdbq4MZanPHnj0swLBRFDZFqHwX4pwH7ZcYHpYR4b5Gi4aEGA+J9kJg+SG9pzJ79AtHRt3ZSa6PlLlk5CVbOCK/G4f3z2fWrwa/ewQdeDxn+mvjFv2xjS5EMXX7kubYaJl2AEw4ev6j1W2d2QOSYDz29uQcPPQpzg2x3ujD/vSpKPIJoqYdK6ulJY9dJlLp8N28pCVZDaFENk5wY3v9m9zcXgPgDJlAD9wSojFh+sQxh/2dluCFailrShA54fkobexs6MTN/qVQ6jkt/WBaIOZyL6RkBAgwMcn3ZQdkjp8JhEn35Gi4aEGA5aB7En35Ajr3v/sjJ5roCJ+LRokKRA0gE/RoDnYR4b5Gi4iZPz5do32nZATEkFkZJ/eX4K7J75v+v7+1DSe7H9vbCj/wUUeDeaduBru6d3LMAy9d671/NZ4tju/Z/zTt+DFnvE9z4P//bnZhXhK/fwNvuAtz/Waze3BgguNZcmPdeD7r09N1z37Uss7g4ka7g5ZvZ3igQaF+6I2mBdeNlJx37Oq+3AQ9W223um5Tica16Dbeq2442PeJv7r7lKkIqYG8x7jb+P4y3/67g223Lw9YXp+gkPB+BpxWrNM5bG/K8s9m7SP/sPBZ8mYs5HJ+rH8/9m2Te81m2d65+gk+D9vgPoMSP/mcbcTdg1Tr35EucpGoMSPTpOghN9MlGkM4NlJwXr7Cm/fEDS2fHw0rpOxt3MQ4qNx3zNaa3Z4w2aj0BHw5wJ75s8p/4d8NYPAx4feI9NvuAtz4eLXTts7EycvBW5j5hFC2fa+vN7v7OpNvuAtz4yj5hFa7C6hiM4NlIjwTQIPzfTygvSuppy6YQkkzH40HzsZRs1Owek8+nMostgqMD7+1Bz8–) Neste exemplo, o histograma acumulativo é mostrado para o array `data`. Cada faixa representa o total de ocorrências até esse ponto. ### Exemplo de Prática Escreva um programa em Python para criar um gráfico de disco do número de população de linguagens de programação. ```python import matplotlib. pyplot as plt import numpy as np # Dados languages = ['Python', 'Java', 'PHP', 'JavaScript', 'C#', 'C++'] popularity = [22. 2, 17. 6, 9. 8, 8. 8, 7. 5, 6. 3] # Cria cores para o gráfico de disco colors = [ '#35978f', '#f8c471', '#e4c495', '#1c84c6', '#fdc949', '#9746a1' ] # Plota o gráfico de disco fig, ax = plt. subplots() ax. pie(popularity, labels=languages, colors=colors, autopct='%1. 1f%%', startangle=90) # Mostra o gráfico plt. show() ``` Este código cria um gráfico de disco do número de população de linguagens de programação `Python`, `Java`, `PHP`, `JavaScript`, `C#`, e `C++`. Utiliza as cores especificadas para cada fatia do disco e etiqueta-as com os respectivos valores numerados de porcentagem em relação a cada fatia. A fatia começa em 90 graus para separar cada fatia pelo centro do gráfico. Aqui está a versão corrigida e formatada em Markdown do texto: ```markdown Por sua vez, vamos utilizar uma variável chamada `explode` e você verá que levamos seis variáveis aqui, o que corresponde a nossas seis categorias diferentes. Começaremos com "1. Um ponto" e depois "00001, 1" (Zero zero zero zero zero vírgulas um) na parte inferior do plot, isso fará com que a quadrícula saia, de forma que é uma característica muito interessante para destacar informações em um gráfico de pizza e isso é apenas ou `plt. pie` para plotar a popularidade. Aperte Enter e veja-o em funcionamento. Antes de adicionarmos todas as configurações de `explode` vamos executar esta parte e você verá que geramos um gráfico de pizza plano não muito interessante. Depois de adicionarmos todos os recursos de explode podemos expandir um dos valores para fora, assim tenhamos: Todas essas configurações são ajustadas de acordo com a estrutura Markdown especificada. Os pontos e vírgulas estão corretamente utilizados e a hierarquia de títulos também está em ordem. Para entender melhor os comandos e a sintaxe do Markdown, [clique aqui](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet) para algumas referências básicas da linguagem. Além dessa correção, utilizei visualmente o texto para separar os comandos a serem executados e aquelas que apenas descrevem a saída ou os resultados para que fique mais fácil para você ler. ``` Para obter uma melhor compreensão dos comandos e da sintaxe do Markdown, [clique aqui](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet) para algumas referências básicas da linguagem. Além dessa correção, utilizei visualmente o texto para separar os comandos a serem executados e aquelas que apenas descrevem a saída ou os resultados para que fique mais fácil para você ler. # Análise de Dados e Gráficos em R ## Conceitos Básicos Esta seção fornece uma visão geral dos diferentes tipos de gráficos e como criá-los. ### Gráfico de Pizza Um gráfico de pizza é um gráfico circular dividido em sectores para ilustrar as proporções. ```R # Crie um vetor com valores vector <- c(valor1, valor2, valor3, valor4) # Crie labels para os valores labels <- c("Label1", "Label2", "Label3", "Label4") # Crie o gráfico de pizza plot(pi, x = vector, labels = labels) ``` Você pode adicionar detalhes a seu gráfico de pizza, como o título principal, o esquema de cores, e detalhes da legenda. ```R # Adicione o título principal, o esquema de cores, e detalhes da legenda plot(pi, x = vector, labels = labels, main = "Título principal", col = "cor1", legend = TRUE) ``` ### Cálculo de Porcentagem para o Gráfico de Pizza Para fazer o gráfico mostrar porcentagem, você pode usar a função `round()` para calcular a porcentagem e atribuir ao `vector`. ```R # Calcule a porcentagem vector_percentagem <- round(vector / sum(vector) * 100, 2) # Crie o gráfico de pizza com porcentagens plot(pi, x = vector_percentagem, labels = labels, main = "Título principal", col = "cor1", legend = TRUE) ``` ### Gráfico de Pizza em 3D com o pacote `plotrix` É possível criar um gráfico de pizza em 3D usando o pacote `plotrix`. Primeiramente, você precisará instalar o pacote e carregá-lo em sua sessão. ```R # Instale e carregue o pacote plotrix install. packages("plotrix") library(plotrix) ``` Depois, é possível criar um gráfico de pizza em 3D com dados e labels. ```R # Crie dados para o gráfico de pizza em 3D x <- c(valor1, valor2, valor3, valor4) labels <- c("Label1", "Label2", "Label3", "Label4") # Crie o gráfico de pizza em 3D pie3d(x, labels, explode = 0. 1) ``` ### Histograma O histograma é uma representação gráfica da distribuição de variáveis. ```R # Crie um histograma hist(dados, xlab = "Dados à volta do eixo X", col = "cor1", border = "limite1") ``` Você pode incluir limites no histograma para melhor compreender a distribuição dos dados. ```R # Crie um histograma com limites hist(dados, xlim = c(limite_x_min, limite_x_max), ylim = c(limite_y_min, limite_y_max), xlab = "Dados à volta do eixo X", col = "cor1", border = "limite1") ``` ### Gráfico de Dispersão O gráfico de dispersão é usado para mostrar a relação entre duas variáveis. ```R # Crie um gráfico de dispersão plot(variável_x, variável_y, dados = dados, xlab = "Eixo X", ylab = "Eixo Y", col = "cor1") ``` ### Gráfico de caixa O gráfico de caixa é uma representação visual da distribuição de um conjunto de dados através de seus quartis. ```R # Instale e carregue o pacote ggplot2 install. packages("ggplot2") library(ggplot2) # Crie um gráfico de caixa ggplot(dados, aes(x = variável_factor)) + geom_boxplot() ``` Para mais detalhes sobre fatores e outras conceitos, veja as seções anteriores que abordam estes tópicos. # Aestética e Geom em R: Criando Visualizações com Dados ## Introdução Este tutorial fornece uma introdução simples para entender como criar visualizações com dados no R, focusando-se no conceito de aesthetics e geometry (geom) no pacote ggplot2. ## Pré-requisitos - Uma compreensão básica do programação em R - Instalado o software R Studio ## Conteúdo 1. Criando uma Barra de Acumulação Enstack 2. Utilizando Dodging para Barras Encostadas 3. Criando um Gráfico de Dispersão com Aesthetics Adicionais 4. Visualizando Dados com plotly ## 1. Criando uma Barra de Acumulação Enstack Neste exemplo, vamos criar uma barra de acumulação enstack para visualizar as informações de condução de um conjunto de dados específico. ```R # Carregando bibliotecas necessárias library(ggplot2) # Para visualização de dados library(plotly) # Para criação de gráficos interativos # Preparando dados data(cars) # Criando uma barra de acumulação enstack stacked_bar <- ggplot(cars, aes(x = drive)) + geom_bar(aes(y = . . prop. . ), fill = "drive", stacked = TRUE) + labs(título = "Barra de Acumulação Enstack: Informação de Condução", x = "Condução", y = "Percentual") + theme_minimal() # Exibindo a barra de acumulação enstack stacked_bar ``` ## 2. Utilizando Dodging para Barras Encostadas Para visualizar como as barras estão lado a lado em vez de enstacked, você pode utilizar a função `position = position_dodge()` dentro da função `geom_bar()`. ```R # Criando uma barra de acumulação encostada side_by_side_bar <- ggplot(cars, aes(x = drive)) + geom_bar(aes(y = n), position = position_dodge()) + labs(título = "Barra de Acumulação Encostada: Informação de Condução", x = "Condução", y = "Contagem") + theme_minimal() # Exibindo a barra de acumulação encostada side_by_side_bar ``` ## 3. Criando um Gráfico de Dispersão com Aesthetics Adicionais Agora vamos criar um gráfico de dispersão mapear e adicionar estéticas para a cor e marcadores. ```R # Criando um gráfico de dispersão com cor baseado na classe, e customização de marcadores scatter_plot <- ggplot(cars, aes(x = speed, y = dist, cor = factor(am))) + geom_point() + scale_cor_manual(valores = c("vermelho", "verde", "azul")) + labs(título = "Gráfico de Dispersão com Cor Baseada na Classe", x = "Velocidade", y = "Distância", cor = "Transmissão Automática") + theme_minimal() # Exibindo o gráfico de dispersão scatter_plot ``` ## 4. Visualizando Dados com plotly Para trabalhar com o pacote plotly, garanta-se que esteja instalado. Voce pode instalá-lo utilizando o seguinte comando: ```R install. packages("plotly") ``` Agora vamos explorar um exemplo de criação de um gráfico interativo utilizando o plotly. ```R # Instalando plotly # library(plotly) # Carregando bibliotecas necessárias library(dplyr) # Preparando dados data_plotly <- cars %>% mutate(transmissão = ifelse(am == 0, "Automática", "Mã나ual")) # Criando um gráfico com plotly plot_ly(data_plotly, x = ~speed, y = ~dist, tipo = "scatter", cor = ~transmissão, modo = "marcadores", informação_de_passagem = "texto", texto = ~paste(speed, " km/h, ", dist, " km")) ``` ## Avisos e Solução de Problemas Em alguns casos, você poderá encontrar avisos quando trabalhar com o pacote plotly. Eles podem ser ignorados. Se encontrar problemas ou precisar de ajuda, sinta-se à vontade para deixar um comentário. ## Recursos * Site oficial do R Studio: https://rstudio.com/ * Pacote ggplot2: https://ggplot2.tidyverse.org/ * Pacote plotly: https://plotly.r-graph-gallery.com/ ## **Grande Dados em 5 Minutos** Nesta seção, vamos discutir uma abrangência do grande dados, sua classificação e exemplos de suas aplicações. ### O Que É Grande Dados? * Sempre que se refere a grande dados, é sobre um volume vasto de informações estruturadas ou não estruturadas que os sistemas de processamento de computador tradicionais têm dificuldade paraprocessar, armazenar e analisar. ### Volume, Velocidade e Variedade * Volume: Dados massivemente gerados em diferentes fontes. * Velocidade: A velocidade na qual os dados são gerados, processados e analisados. * Variedade: A diversidade de tipos de dados, como dados estruturados, semi-estruturados e não estruturados. ### Exemplos de Aplicações do Grande Dados 1. Saúde: Análise de dados médicos para melhor detecção de doenças, melhor tratamento e redução de custos. 2. Mídia Social: Análise de dados de usuários para insights de marketing, análise de comportamento de clientes e criação de conteúdo. 3. Jogos: Análise de dados de jogos para melhor experiência do usuário, redução detaxas de abandono de usuários e refinamento de história de jogo. 4. Gestão de Desastres: Uso de dados de tempo-real para previsão e gestão de desastres naturais como furacões. ### Plataformas de Grande Dados * Hadoop: Um framework open-source para armazenamento e processamento de grande dados com um sistema de arquivos distribuído (HDFS). * Spark: Um motor rápido e eficiente de processamento distribuído de grande dados. ## **Visualização de Dados em R** Nesta seção, vamos discutir como criar vários tipos de visualizações de dados utilizando R. ### Gráficos Estatísticos Básicos 1. Gráficos de Dispersão 2. Barras 3. Histogramas 4. Box Plots 5. Pie Charts ### Visualizações Complexas 1. Suprimentos de Calor 2. Clouds de Palavras 3. Kernel Density Plots 4. Linhas ## **"Grande Dados em 5 Minutos" Teste de Conhecimento"** * O que é o corretor definitivo de grandes dados? 1. Dados que são grandes em volume 2. Dados que são velhos em idade 3. Dados que são de baixa qualidade 4. Dados gerados por celulares * Qual acção seguinte é incorrecta sobre HDFS? 1. HDFS é a camada de armazenamento de Hadoop 2. Os dados são armazenados em um modo distribuído em HDFS 3. HDFS executa processamento em vários nós de dados em paralelo 4. As pequenas camadas de dados são armazenadas em vários nós de dados em HDFS ## Referências * Tutorial de Grande Dados: https://www.youtube.com/watch?v=bAyrObl7TYE * Tutorial de Visualização de Dados em R: https://www.youtube.com/watch?v=_WyUme_H2ZQ # Documentação do R ## Criando Gráficos de Pasta No R, você pode criar gráficos de pasta usando a função `pi`. Aqui, `x` é um vetor de quantidades numéricas não-negativas. O valor de `x` indica a área de uma fatia de pasta. `labels` são cadeias de caracteres ou expressões que dão nomes aos vetores. ```markdown # Primeiro, crie o vetor das fatias slices <- c(10, 12, 4, 16, 8) # Em seguida, crie o vetor de labels labels <- c("Slice1", "Slice2", "Slice3", "Slice4", "Slice5") # Passe ambos os vetores para a função pi pi(slices, labels) ``` ### Definindo o Título do Gráfico Para definir o título geral do gráfico, você pode passar `main` como um parâmetro: ```markdown # Defina o título pi(slices, labels, main = "Título do Gráfico de Pasta") ``` ### Adicionando Porcentagens ao Gráfico de Pasta Para adicionar porcentagens ao gráfico de pasta, crie o vetor `pct` e o vetor de labels para adicionar realmente labels as fatias. Para concatenar dados ao vetor de labels e adicionar o sinal de porcentagem, utilize a função `paste`: ```markdown # Crie o vetor pct pct <- (slices / soma(slices)) * 100 # Adicione porcentagens ao vetor de labels labels <- paste(labels, " - ", round(pct, 2), "%") # Passe ambos os vetores para a função pi pi(slices, labels) ``` ### Criando um Gráfico de Pasta em 3D Para criar um gráfico de pasta em 3D, você pode usar o pacote `plotrix`, que contém a função `pi3d`: ```markdown # Instale o pacote plotrix install. packages("plotrix") # Carregue o pacote plotrix library(plotrix) # Crie um gráfico de pasta em 3D pi3d(slices, labels) ``` ## Criando Histogramas Histogramas são uma forma excelente de conhecer seus dados. Um histograma tem eixos x e y, e barras de alturas diferentes. As barras agrupam intervalos de valores ou categorias continuas no eixo x, e o eixo y mostra com quantidade as ocorrências dos valores no eixo x nas suas dados. ```markdown # Crie um histograma para um conjunto de valores de dados específicos hist(dados) ``` ### Representando a Densidade de Probabilidade Para representar a densidade de probabilidade, configure o parâmetro `frequency` para `FALSE`: ```markdown # Crie um histograma com densidade de probabilidade hist(dados, frequency = FALSE) ``` ### Controlando o Número de Barras Para controlar o número de barras, utilize a opção `breaks`: ```markdown # Define o número de barras hist(dados, breaks = 10) ``` Para mais opções ou ajuda, digite o seguinte comando no console: ```markdown ? hist ``` ## Criando Gráficos de Linhas Os gráficos de linha representam uma série de pontos de dados chamados marcações conectados por uma reta recta. Esta forma de visualização gráfica é frequentemente utilizada para mostrar dados que mudam ao longo do tempo. ```markdown # Crie um gráfico de # Tutorial de Visualização de Dados para Iniciantes | Tutorial de Análise de Dados Grandes | Simplilearn Idioma: en [Música] Comecemos este lesson definindo o que é a visualização de dados. **Visualização de dados** é um técnica para apresentar os dados em um formato **gráfico** ou **gráfico**. Ele permite a stakeholders e decisores analisar os dados visualmente. Os dados em formato gráfico permitem identificar facilmente uma nova tendência e padrão. **Porque a visualização de dados é importante? ** Vamos explicar com um exemplo. Você é um gerente de vendas em uma organização lideradora global. A organização pretende estudar os detalhes de vendas de cada produto em todos os regiões e países. Esta pesquisa permitirá à organização aumentar a produção do produto em uma determinada região. Os dados implicados nesta pesquisa são poderosos e complexos. A pesquisa destes dados numéricos é difícil e custosa quando é feita manualmente. Quando este dado numérico for plotado num gráfico ou convertido em gráficos, é fácil identificar as tendências e prever os resultados de maneira precisa. **As principais vantagens da visualização de dados** - Simplifica a informação quantitativa complexa - Auxilia no análise e exploração de grande dados facilmente - Identifica as áreas que precisam de atenção ou melhoria - Identifica a relação entre os pontos de dados e variáveis - Explora novos padrões e revela padrões escondidos nos dados **As três considerações principais para visualização de dados** 1. **Claridade**: garanta que o conjunto de dados é completo e relevante. Isto permite ao cientista de dados usar os novos padrões extraídos do dados em locais relevantes. 2. **Acurácia**: garanta o uso de uma representação gráfica apropriada para transmitir a mensagem correta. 3. **Eficiência**: use uma técnica de visualização eficiente que destaca todos os pontos de dados. **Fatores básicos que um choosing deveria estar familiarizado antes de visualizar os dados** - Efeito visual: inclui o uso de formas apropriadas, cores e tamanhos para representar os dados analisados. - Sistema coordenado: ajuda a organizar os pontos de dados dentro dos coordenados fornecidos. - Tipo e escala de dados: escolha o tipo de dados, se numérico ou categorizado. A interpretação precisa ajuda a criar visualizações de maneiras efetivas e facilmente interpretáveis use labels, titulo, legenda e pontos. **Visualsizando os dados usando Python** Utilizando a linguagem de programação Python, é possível realizar esta visualização de dados. Você aprenderá mais sobre a visualização de dados usando a linguagem python de programação no subsequente telas. Á dividas novas bibliotecas de visualização de python de dados foram introduzidas recentemente, como matplotlib, VisPy, Bokeh, Seaborn, Pigeon, Folium e NetworkX. **matplotlib** matplotlib é uma biblioteca de código aberto da linguagem Python para a visualização de dados bidimensional. Possui muitas vantagens de usar o Matplotlib para visualizar dados: - É uma ferramenta de dados visualização multiplataforma construída no framework numpy e scipy, portanto ela é rápida e eficiente. - Pode trabalhar bem com vários sistemas operacionais e backends gráficos. - Possui gráficos e visualizações de alta qualidade para visualizar e imprimir um variado de gráficos como histogramas, gráficos de barra, tábuas de contingência, maca de dispersão e mapas aquecidos, com integração do notebook Jupyter. - Os desenvolvedores puderam passar seu tempo implementando características e não lutando com compatibilidade cruzada. - Possui uma comunidade de apoio de desenvolvedores grandes e suporte de mais de uma plataforma uma vez que é uma ferramenta de código aberto. - Tem controle completo sobre estilos de gráficos ou plots, como propriedades de linha, fontes e propriedades do eixo. **Criando um gráfico** **Um gráfico** é uma representação gráfica dos dados que mostra a relação entre duas variáveis ou a distribuição dos dados. Considere o exemplo abaixo: ! [Exemplo de gráfico](data: image/png; base64, iVBORw0KGgoAAAAHJSU1FB9zYSAAAAFElFTkSuQmCC) Este é um gráfico bidimensional de linha de números aleatórios no eixo y e o intervalo no eixo x. A parte de fundo do gráfico é chamada de grade. A cordilha `primeira gráfico` indica o título do gráfico. A linha de texto` palavra única de apresentação` indica a legenda. Você pode criar um gráfico usando quatro passos simples: 1. Importe as bibliotecas necessárias 2. Defina ou importe o conjunto de dados necessário 3. Defina os parâmetros do gráfico 4. Exiba o gráfico criado **Guardo gráficos em RStudio** Neste demo, você aprenderá a salvar gráficos em RStudio. **Para exportar gráficos em RStudio, siga estas etapas: ** 1. No painel de gráficos de RStudio, clique no `gráficos` 2. Clique no `exportar` e escolha o menu item `Exportar como Imagem` 3. A janela de `salvar como imagem` é exibida 4. Selecione o formato de imagem e o caminho onde devem ser salvos os arquivos 5. Clique em `Salvar` **Para exportar gráficos como PDFs em RStudio: ** 1. No painel de gráficos de RStudio, clique no `gráficos` 2. Clique no `exportar` e escolha o menu item `Exportar como PDF` 3. Selecione o caminho onde devem ser salvos os arquivos 4. Clique em `Salvar` **Resumo** - R inclui pacotes gráficos de código aberto que auxiliam na visualização de dados. - Você pode salvar os outputs dos gráficos em diferentes formatos de arquivo como PDF, PNG e JPEG. - Exporte gráficos em RStudio usando o painel de gráficos. **Fontes: ** [Tutorial de Visualização de Dados para Iniciantes | Tutorial de Análise de Dados Grandes | Simplilearn](https://www.youtube.com/watch?v=MiiANxRHSv4) - Idioma: en Duas Subplots ============= Esta secção demonstra como criar dois gráficos subjacentes exibidos lado a lado numa mesma janela utilizando a biblioteca `matplotlib`. 1. Importar as bibliotecas necessárias e configurar: ``` import matplotlib. pyplot as plt %matplotlib inline # Definir parâmetros # . . . (Dados de temperatura, vento, umidade e precipitação, e dados de tempo) ``` 2. Criar dois gráficos subjacentes: ``` fig, axs = plt. subplots(nrows=1, ncols=2, figsize=(10, 5)) # Configurar subgráfico de temperatura axs[0]. plot(time_data, temperature_data, cor='azul', estilo='-', largura=1. 5) axs[0]. set_title('Temperatura') # Configurar subgráfico de vento axs[1]. plot(time_data, wind_data, cor='vermelho', estilo='-', largura=1. 5) axs[1]. set_title('Vento') plt. show() ``` Duas Subplots Superpostas ========================= Esta secção demonstra como criar dois gráficos subjacentesercise superpostidos ou divididos verticalmente numa mesma janela utilizando a biblioteca `matplotlib`. 1. Importar as bibliotecas necessárias e configurar: ``` import matplotlib. pyplot as plt %matplotlib inline # Definir parâmetros # . . . (Dados de umidade e precipitação) ``` 2. Criar dois gráficos subjacentes superpostidos: ``` fig, axs = plt. subplots(nrows=2, ncols=1, figsize=(6, 10)) # Configurar subgráfico de umidade axs[0]. plot(time_data, humidity_data, cor='verde', estilo='-', largura=1. 5) axs[0]. set_title('Umidade') # Configurar subgráfico de precipitação axs[1]. plot(time_data, precipitation_data, cor='roxo', estilo='-', largura=1. 5) axs[1]. set_title('Precipitação') plt. show() ``` Quatro Subplots ============== Esta secção demonstra como criar quatro gráficos subjacentes exibidos numa única janela utilizando a biblioteca `matplotlib`. 1. Importar as bibliotecas necessárias e configurar: ``` import matplotlib. pyplot as plt %matplotlib inline # Definir parâmetros # . . . (Dados para subplots 1, 2, 3 e 4) ``` 2. Criar quatro subplots: ``` fig, axs = plt. subplots(nrows=2, ncols=2, figsize=(12, 8)) # Configurar primeiro subgráfico axs[0, 0]. plot(data1_1, data1_2, cor='azul', estilo='-', largura=1. 5) axs[0, 0]. set_title('Subgráfico 1-1') # Configurar segundo subgráfico axs[0, 1]. plot(data1_2, data1_3, cor='verde', estilo='-', largura=1. 5) axs[0, 1]. set_title('Subgráfico 1-2') # Configurar terceiro subgráfico axs[1, 0]. plot(data2_1, data2_2, cor='vermelho', estilo='-', largura=1. 5) axs[1, 0]. set_title('Subgráfico 2-1') # Configurar quarto subgráfico axs[1, 1]. plot(data2_2, data2_3, cor='roxo', estilo='-', largura=1. 5) axs[1, 1]. set_title('Subgráfico 2-2') plt. show() ``` Tipos de Gráficos =============== Esta secção pretende fornecer uma visão geral dos diferentes tipos de gráficos que pode criar utilizando a biblioteca `matplotlib`. 1. Histogramas ``` # Importar as bibliotecas necessárias import matplotlib. pyplot as plt import pandas as pd # Carregar o dataset de Boston data = pd. read_csv('boston_housing. csv', header=None) X = data. iloc[: , : -1] y = data. iloc[: , -1] # Criar um histograma para o dataset de Boston plt. hist(X, c estilos="blue", alpha=0. 5, figsize=(10, 6)) plt. xlabel('Característica') plt. ylabel('Contagem') plt. show() ``` 2. Ponto a Ponto ``` import matplotlib. pyplot as plt # Criar um gráfico ponto a ponto para o dataset de Boston plt. scatter(X0, y0, cor='red', marca='o', rótulo='Rótulo 0') plt. scatter(X1, y1, cor='green', marca='x', rótulo='Rótulo 1') plt. xlabel('Característica') plt. ylabel('Alvo') plt. legenda() plt. show() ``` 3. Mapas de Calor ``` import seaborn as sns # Carregar o dataset de voos tips = sns. load_dataset('tips') # Criar um mapa de calor para o dataset de voos sns. heatmap(tips. corr(), anot=True, fmt='. 2g', cmap='coolwarm') plt. show() ``` 4. Gráficos de Pasta de Azeites ``` import matplotlib. pyplot as plt # Dados para um gráfico de pasta de azeites olive_oil = ['Italia', 70. 50, 8. 2, 'Virgem Extra', 2019, 10000] olive_oil = [i for i in olive_oil] # Cria um gráfico de pasta de azeites plt. barh(olive_oil, color='green', tick_label=[olive_oil[1], olive_oil[2], olive_oil[4], olive_oil[5]]) plt. xlabel('Percentual dela no mercado') plt. ylabel('Marca') plt. title('Dados sobre a oleo de oliva do mercado') plt. show() ``` Barras de Erro ============= ``` import seaborn as sns import matplotlib. pyplot as plt # Carregar o dataset de voos tips = sns. load_dataset('tips') # Criar um gráfico de barras de erro para o dataset de voos sns. boxplot(x=tips['total_bill'], y=tips['tip'], whiskerprop='errboundy', showfliers=False) plt. show() ``` Seaborn ======= A biblioteca `seaborn` é uma biblioteca de visualização de dados em Python baseada em `matplotlib`. Fornece uma interface de alto nível para desenharem gráficos estatísticos atraentes. ``` import seaborn as sns import matplotlib. pyplot as plt # Carregar o dataset de voos tips = sns. load_dataset('tips') # Criar um gráfico de dispersão para o dataset de voos sns. pairplot(tips, x_vars=['total_bill', 'size'], y_vars=['tip', 'sex']) plt. show() ``` Grândulos de Dados Altamente Estruturados ======================================== Para se tornar um especialista em Big Data: 1. Inscreva-se no Simply Learn: [Subscrever Aqui](https://www.simplylearn.io/) 2. Clica aqui para assistir a mais vídeos: [Assistir Mais Vídeos](https://www.youtube.com/watch?v=dQw4w9WgXcQ)