Desdobramentos em gráficos

Para além do gráfico “achatamento da curva” comentado neste post, há uma segunda onda de visualizações do dados que reflete os desdobramentos implicados na prática de distanciamento social. São visualizações baseadas em dados secundários, isto é, indiretamente relacionados ao avanço da pandemia. Selecionamos algumas visualizações para comentar e as dividimos em três eixos: impacto sócio-ambiental, impacto socioeconômico e hábitos de consumo e de busca na internet.

Impacto sócio-ambiental

O The New York Times publicou no dia 17 de março imagens de satélites que mostram os efeitos do novo coronavírus na Itália e na China. O referido satélite (no caso, o Sentinel-5P) detecta traços de atividade humana – emissões de tubos de escape de carros e caminhões, combustível fóssil queimado em usinas de energia e outras atividades industriais – que podem ser sintetizados em imagens, mais especificamente visualizações científicas. Quando comparadas com imagens do mesmo período há um ano atrás, as visualizações deste ano evidenciam uma redução significativa das concentrações de dióxido de nitrogênio na Itália e na China (os primeiros países a adotarem medidas restritivas visando a limitação de movimento de pessoas).

Itália: cada quadro nesta animação representa um composto de 20 dias de concentrações de dióxido de nitrogênio, de meados de dezembro a meados de março. Fonte: dados de satélite do Sentinel-5P processados ​​pelo Descartes Labs
China: cada quadro nesta animação representa um composto de 20 dias de concentrações de dióxido de nitrogênio, de meados de dezembro a meados de março. Fonte: dados de satélite do Sentinel-5P processados ​​pelo Descartes Labs

O MIT Media Lab buscou uma abordagem semelhante ao publicar um estudo sobre como a prática de distanciamento social está alterando a mobilidade das pessoas na cidade de Nova York. No entanto, a natureza e origem dos dados é completamente diferente de imagens de satélite. Os dados de mobilidade utilizados na visualização foram fornecidos pela Cuebiq, uma empresa de inteligência e medição de localização. A empresa fornece registros anônimos de localizações GPS de usuários que optaram por compartilhar seus dados anonimamente nos EUA, de 26 de fevereiro de 2020 a 25 de março de 2020. Informações mais detalhadas sobre o estudo podem ser lidas aqui.

Nova York: cada quadro nesta animação representa uma média de distância percorrida por dia por usuários de GPS anônimos na cidade de Nova York. Fonte: MIT Media Lab.

Impacto sócio-econômico

O jornal The New York Times, em sua versão impressa, publicou nos dias 27 de março e 9 de maio de 2020, duas capas visualmente impactantes sobre a onda de desempregos que atinge os Estados Unidos nas últimas semanas. As duas capas utilizam uma estratégia similar: recorrem a gráficos em escala linear para destacar o pico desproporcional de desempregos nas últimas semanas.

Capas do The New York Times de 27 de março e 9 de maio utilizam gráficos em escala linear para enfatizar o aumento de desemprego nos Estados Unidos devido à pandemia. Dica: clique nos links das publicações para ver as capas em alta resolução.

Em ambas capas, os gráficos foram utilizados para apontar uma correlação entre o aumento de desemprego nos Estados Unidos e a evolução da pandemia. E ao ocupar a coluna da direita exclusivamente com dados dos gráficos, as capas reforçam visualmente a intensidade da crise: a verticalidade da coluna intensifica a agudeza ascendente ou descendente da última linha do gráfico.

O gráfico da capa de 27 março mostra o histórico de solicitações semanais por seguro desemprego no país desde os anos 2000 até a última semana de março de 2020. Os dados são do Departamento do Trabalho dos Estados Unidos. A maioria das linhas variam poucos centímetros de altura umas das outras. O maior índice de desemprego semanal anterior até então é de cerca de 6oo.000 durante a recessão de 2008-09 (essa informação aparece anotada no gráfico como um elemento comparativo). Mas essa linha é superada radicalmente pela última linha que representa o vertiginoso aumento de reivindicações por seguro desemprego na semana de 20-27 de março: a linha ultrapassa outras manchetes alcançando o topo página. Os quase 3,3 milhões de pedidos por seguro desemprego neste período é cerca de 5 vezes maior que o segundo maior índice.

Já o gráfico da capa de 9 de maio exibe a variação mensal de empregos desde 1946 até abril de 2020. Os dados também são do Departamento do Trabalho dos Estados Unidos. Quando há aumento de empregos entre meses subsequentes, a variação é positiva e é representada por uma linha ascendente em cor cinza. Quando há diminuição de desempregos, a variação é negativa e é representada por uma linha descendente em cor vermelha. Assim, a última linha – que representa o mês de abril – indica uma variação negativa de menos 20,5 milhões de empregos em relação ao mês anterior.

Ao criar visualizações, designers da informação devem eleger a melhor maneira de apresentar os dados e a decisão por um tipo ou outro de escala é uma dessas escolhas. Em uma escala linear, como a utilizada em ambos gráficos do NYT, o valor entre os intervalos no eixo y é constante, o que pode acarretar em picos acentuados. Esse tipo de escala tem prós e contras, mas, no presente contexto, a desproporcionalidade dos picos em relação ao restante dos gráficos corrobora o tom das matérias que é destacar a gravidade da crise.

É interessante destacar que dados não são unidades de informação neutras e que questioná-los é, na maioria das vezes, uma atitude crítica saudável. A matéria da Vox de 9 de abril expõe algumas possíveis ponderações sobre os dados utilizados para tratar do atual problema de desemprego. No caso do primeiro gráfico, é possível argumentar que o aumento de pedidos de seguro desemprego nos EUA aumentou drasticamente nas últimas semanas não só por causa de possíveis demissões, mas também porque uma lei recentemente promulgada no país expandiu a elegibilidade de beneficiários. Ao mesmo tempo, há uma provável subnotificação de pedidos de seguro desemprego pois os sistemas estaduais responsáveis por receber as reivindicações (tanto telefônico como online) não suportam a alta demanda de solicitações. Isso leva a crer que o real número de solicitações excede aquele registrado pelos órgãos oficiais.

Sobre o gráfico do dia 9 de maio, podemos ponderar sobre o fato da variação mensal de desemprego ser medida em números absolutos. Se fosse baseada na taxa de desemprego, será que a forma do gráfico teria a mesma força visual ? Esclarecendo para os menos familiarizados com terminologias estatísticas, taxa é a razão entre duas grandezas. Então, taxa de desemprego pode ser compreendida como o número de trabalhadores desempregados dividido pela força de trabalho total. O próprio NYT pondera sobre tal aspecto ao trazer à capa um gráfico secundário – bem menor que o gráfico principal – apresentando a taxa de desemprego no mesmo período. A taxa de desemprego em abril de 2020 é a maior registrada na história, mas mostrá-la visualmente é menos impactante do que apresentar a variação em números absolutos.

Taxa mensal de desemprego nos Estados Unidos desde 1946 até abril de 2020. Fonte: NYT.

Hábitos de consumo e de busca na internet

A matéria do The New York Times de 11 de abril traz uma análise sobre como o vírus alterou profundamente a vida da população norte-americana, transformando, inclusive, a maneira como cidadãos gastam seu dinheiro. A primeira visualização é uma série histórica que ilustra a variação percentual em gastos por categoria entre 8 de janeiro e 1 de abril. É nítida a queda de gastos em todas categorias, com exceção de groceries – que inclui gastos em supermercados, lojas de conveniência, entre outros. Além disso, a acentuada curva de crescimento em groceries na primeira quinzena de março coincide com o momento de supermercados lotados no país, quando à população norte-americana, incitada pelo pânico, esvaziou prateleiras em inúmeros estabelecimentos.

Variação percentual em gastos (por categoria) dos norte-americanos desde o início do ano. Cada linha é uma média das duas semanas anteriores, o que suaviza as anomalias semanais. Fonte: NYT.

Já a segunda visualização é um gráfico de bolhas que mostra a variação de gastos por setor entre a última semana de março de 2019 e o mesmo período em 2020. A área das bolhas são dimensionadas pelas vendas do setor e as cores representam se as variações são negativas (em laranja) ou positivas (em verde). É fácil notar que os setores aéreo e cultural são fortemente impactados enquanto setores de jogos e compras online registram forte crescimento.

Variação de gastos por setor entre a última semana de março de 2019 e o mesmo período em 2020. Fonte: NYT.

O texto da matéria elucida as fontes dos dados: “todos os gráficos deste artigo são baseados em uma análise de dados do Earnest Research, do New York Times, que rastreia e analisa as compras com cartão de crédito e débito de quase seis milhões de pessoas nos Estados Unidos. Embora os dados não incluam transações em dinheiro e, portanto, não reflitam todas as vendas, eles fornecem um forte instantâneo do impacto do vírus na economia.”

No dia 11 de maio, o Nexo publicou uma série de visualizações sobre o aumento de buscas no Google por certos termos durante quarentena. Segundo a matéria, o Google Trends (ferramenta do Google que mostra os mais populares termos buscados em um passado recente) chegou a registrar 142% mais buscas por pijamas no começo de maio em relação à média do ano. Aspirador e quebra-cabeça também tiveram um aumento de mais de 50% no interesse.

Há dois tipos de visualização de dados na matéria. O primeiro tipo exibe quatro faixas de variação (-50% ou menos; 50% a 0%; 0% a 50%; e mais de 50%) de buscas em relação à média do ano (janeiro a maio de 2020). Os termos são divididos em categorias: computador/escritório, cozinha, uso pessoal, diversão, exercícios físicos e casa. O recorte abaixo apresenta a variação para os termos na categoria computador/escritório.

Variação de buscas por termos no Google em relação à média do ano. Fonte: Nexo.

O segundo tipo de visualização é um detalhamento da variação de busca por termos mais buscados. Essas visualizações contam com elementos ilustrativos e evidenciam a variação dia-a-dia. Em comparação com a visualização anterior, é possível perceber agora o quão mais um termo é mais buscado que outro.

Variação de buscas pelos termos pijamas, cadeira de escritório e quebra-cabeça no Google em relação à média do ano. Fonte: Nexo.

Continuamos discutindo crítica social e auto-reflexão.