Contextualização

Hoje, ouve-se com bastante frequência a expressão “sem precedentes”. É como se a linguagem que usamos para explicar nosso mundo estivesse desmoronando e os superlativos não pudessem acompanhar a nova realidade trazida pela pandemia do novo coronavírus. Desde março de 2020, nossas vidas foram atingidas por uma avalanche de perguntas difíceis de serem respondidas: “Quando isso vai acabar? Como posso proteger a mim mesmo e aos outros? Até quando as escolas permanecerão fechadas? Vou perder meu emprego?”.

A ironia da situação é que essas dúvidas emergem em um momento de larga e acelerada produção de dados que, no entanto, não parecem ser suficientes para aclarar a situação. A pandemia está gerando grandes quantidades de dados como número de testes realizados, casos confirmados, pacientes recuperados, pessoas que morreram pelo vírus, etc. Ao mesmo tempo, esses dados são muitas vezes incertos, incompletos e difíceis de serem analisados pois estão em contínua revisão e atualização. Diante da complexidade e volatilidade do fenômeno, cientistas, jornalistas e agentes públicos esforçam-se para tornar dados significativos a um público muitas vezes não especializado. Nesse contexto, a visualização de dados assume um papel crucial no processo comunicacional. 

Podemos observar uma proliferação de visualizações de dados sobre a Covid-19 na mídia o que torna o momento bastante propício para estudo do tema sob a perspectiva de diferentes disciplinas dentre as quais a Matemática e o Design da Informação. Assim, nasce o portal “Coronaviz: visualização em tempos de coronavírus“, uma iniciativa do Visgraf, do Instituto de Matemática Pura e Aplicada, um laboratório com foco em pesquisa e desenvolvimento de novas mídias. O portal é um projeto em andamento. Ao longo das próximas semanas iremos comentar bons e maus exemplos de visualizações de dados produzidas no contexto da pandemia, assim como aclarar conceitos matemáticos importantes para a compreensão do fenômeno. Em última instância, podemos argumentar que os bons exemplos de visualização ajudam pessoas a entenderem, em diferentes graus e aspectos, as causas e implicações envolvidas no novo coronavírus e incentivam a responsabilidade cívica por meio do autocuidado e da prática do distanciamento social.

A prática e reflexão de e sobre visualização de dados possui um longo histórico que remonta, primeiramente, a produção empírica de mapas e gráficos por pioneiros como Joseph Priestley, William Playfair e Charles Joseph Minard, e, posteriormente, a sistematização propriamente dita de uma teoria para a linguagem visual-gráfica proposta por estudiosos como Jacques Bertin e Edward Tufte. Nos últimos anos, a visualização de dados popularizou-se, tornando-se mais presente em nossas experiência diárias. Nós a vemos em notícias jornalísticas (impressas e televisivas), mídias sociais, livros didáticos, campanhas publicitárias, dashboards interativos, estudos científicos, relatórios, etc. sendo usada para diferentes fins: analisar problemas, comunicar informação e tomar decisões baseadas em evidências

Evidência é a qualidade daquilo que é evidente, do que não dá margem à dúvida. Constitui-se como uma das principais prerrogativas para o emprego de metodologias e técnicas baseadas em dados. Nesse sentido, visualizações de dados baseadas no tempo tradicionalmente são empregadas em dois tipos de situação:

  • Evidenciação de eventos concretos e finalizados, isto é, conjuntos de dados com início, meio e fim conhecidos;
  • Evidenciação de eventos concretos e em processo, isto é, conjunto de dados atualizados em tempo real em um ambiente controlado.

Nenhuma das situações, contudo, descreve o fenômeno Covid-19: a pandemia, no momento, é um evento em processo em um ambiente não controlado. 

O fato é que a situação impulsionada pela Covid-19 é inédita tanto em termos da velocidade e imprevisibilidade como o vírus se propaga, como em termos do rítmo acelerado em que notícias e análises são publicadas e divulgadas na mídia. A simultaneidade entre fenômeno e análise do fenômeno faz com que se consolide uma nova abordagem para a visualização de dados. Chamaremos essa nova abordagem de visualização de dados hipotéticos e monitorados .

Se, por um lado, a proliferação de visualizações de dados sobre a atual pandemia já constituiria razão legítima para se debruçar sobre o assunto, por outro lado, ela não é a principal motivação da presente reflexão. A singularidade do fenômeno epidemiológico que vivemos evidencia novos aspectos a respeito da produção de visualizações e podem ser situados em dois eixos, elucidados a seguir. Utilizaremos o portal Coronaviz para publicar análises e reflexões cobrindo esses eixos e as diferentes questões que eles abarcam. Eventualmente, tópicos não mencionados neste primeiro momento poderão ser incluídos às análises do portal.

1) Diversificação da visualização de dados para além da contagem de eventos

O primeiro eixo diz respeito à diversificação da visualização de dados para além da contagem de eventos relacionados a propagação da Covid-19. Em um momento inicial, quando a pandemia deflagrou mundialmente em meados de março, mapas, gráficos de barras e gráficos de linhas de casos confirmados, dentre outros tipos de contagens, predominaram na mídia. No entanto, à medida que os efeitos da crise se desdobraram – e continuam a se desdobrar – os meios de comunicação começaram a se atentar para outros tipos de dados que extrapolam a mera contagem de casos confirmados e taxas de mortalidade. Nesta linha de pensamento, o exemplo mais emblemático que podemos citar é o gráfico do “achatamento da curva” que, nos perdoem o duplo sentido, viralizou e ganhou inúmeras adaptações.

O resultado da busca por “flatten the curve graphic” no Google Images exibe incontáveis versões do gráfico. Fonte: Google/captura de tela.

No contexto acima, o gráfico do “achatamento da curva” exemplifica um caso onde a visualização de dados desloca-se de sua função primordial que é evidenciar eventos concretos para demonstrar conceitos e modelos matemáticos a partir de dados obtidos em simulações. Nos aprofundaremos mais sobre esse aspecto nas análises Visualização de dados hipotéticos e Achatando a curva.

Visualizações de dados hipotéticos gerados através de simulações. Fonte: Washigton Post.

Para além do gráfico “achatamento da curva”, há uma segunda onda de visualizações de dados que reflete os desdobramentos implicados na prática de distanciamento social. São visualizações baseadas em dados secundários, isto é, indiretamente relacionados ao avanço da pandemia. Podemos citar, por exemplo, visualizações que demonstram  a mudança dos padrões de gastos (NYT), o aumento na taxa de desemprego (Vox), alterações no comportamento de mobilidade das pessoas (MIT MediaLab), a redução da poluição urbana (NYT) e a até mesmo o índice de transparência na divulgação de dados sobre a pandemia (Open Knowledge Brasil). 

O gráfico mostra a variação percentual nos gastos dos norte-americanos desde o início do ano. Cada linha é uma média das duas semanas anteriores, o que suaviza as anomalias semanais. Fonte: NYT.

Finalmente, há uma terceira onda de visualizações de dados que emerge quase como uma resposta à ironia mencionada no início do texto. Há uma quantidade sem precedentes de dados sendo produzidos e divulgados em tempo real. Contudo, esses dados, mesmo quando visualizados, não são capazes de dar conta de todas as dúvidas e amenizar nossas ansiedades. Diante, da incerteza, incompletude e complexidade do fenômeno, surgem práticas de visualização de dados que evocam, por um lado, o cuidado com a comunidade e, por outro lado, a autorreflexão.

Por práticas de visualização de dados voltadas para o cuidado da comunidade, queremos enfatizar exemplos que evidenciam o impacto desproporcional da Covid-19 em segmentos mais vulneráveis da sociedade como refugiados, profissionais que não podem trabalhar de casa, negros, pessoas encarceradas, etc. Em um perspectiva stricto sensu, são visualizações passíveis de serem questionadas como tais à medida que distanciam-se de certas qualidades como abstração, precisão e objetividade. Apoiando-se em pequenos conjuntos de dados, são visualizações que utilizam recursos figurativos e expressivos para sustentar críticas sociais.

A Covid-19 propaga-se com maior facilidade em áreas de alta densidade populacional como é o caso de campo de refugiados. Fonte: Instagram/Mona Chalabi.

Por práticas de visualização de dados voltadas para o autorreflexão, queremos destacar uma mudança mais paradigmática no fluxo de produção de visualizações de dados durante a pandemia. Até o momento, citamos práticas de visualizações de dados claramente produzidas por um meio de comunicação legitimado com objetivo de comunicar informações confiáveis a um público amplo. No entanto, o contexto da Covid-19 evidencia a emergência de visualizações de dados criadas para outro objetivo: auto reflexão e expressão. Nessa linha, iniciativas como Diario Visual de la cuarentena, Data Selfie da quarentena e Quarantine portrait utilizam a visualização de dados como uma ferramenta para refletir sobre e representar o cotidiano durante o período de distanciamento social.

Coleta de dados pessoais (à esquerda) e representação dos dados (à direita) são etapas distintas da oficina Data Selfie da quarentena. Fonte:

Nos aprofundaremos mais sobre esse aspecto nas análises Desdobramentos em gráficos e Crítica social e autorreflexão.

2) Uso responsável da visualização de dados

O segundo eixo diz respeito a responsabilidade cívica envolvida nos processos de aquisição e representação de dados durante a pandemia. A visualização de dados carrega uma aura de confiabilidade e autoridade em seu discurso apoiando a tomada de decisão tanto de gestores da administração pública como dos indivíduos. Quando essa autoridade é exercida de maneira irresponsável, ela pode esgotar a confiança do público, levar à rejeição de medidas de saúde pública e até mesmo incitar pânico.

O uso responsável da visualização de dados possui duas facetas: a primeira diz respeito à proveniência, qualidade e transparência dos dados; a segunda diz respeito aos desafios que conceitos complexos e fenômenos incertos e/ou incompletos impõem à representação visual.

Situações de crise como uma pandemia exigem uma comunicação abundante, consistente e com fontes confiáveis. E diferentes agentes assumem a mediação desse processo. Em primeiro lugar, organizações de saúde, em suas diferentes instâncias, precisam ser abertas e transparentes. Precisam esclarecer a metodologia utilizada na coleta de dados e devem informar o que sabem e, principalmente, o que desconhecem ou não têm certeza a respeito dos dados que divulgam. Em segundo lugar, os repositórios online que agregam e disponibilizam conjuntos de dados sobre a Covid-19 na internet precisam ter competência para fazê-lo. As universidades Johns Hopkins (Estados Unidos) e Imperial College (Inglaterra) são exemplos de instituições acadêmicas que criaram repositórios online com credibilidade e facilmente acessíveis à comunidade. Em terceiro lugar, os meios de comunicação – dos grandes veículos a publicações acadêmicas passando por iniciativas independentes – precisam ser criteriosos e sensatos ao selecionar e estruturar dados em visualizações e dashboards. Visualizações são recursos poderosos para comunicação de informações, mas também podem enganar e desinformar. Sobre essa questão, a especialista Amanda Makulec publicou uma orientação para criar visualizações de dados responsáveis diante de uma crise de saúde pública.

Tweet sobre a publicação “Ten Considerations Before You Create Another Chart About COVID-19“. Fonte: Twitter/Amanda Makulec.
Dashboard interativo criado pela UFRGS mostra casos e mortes confirmados de coronavírus no Brasil (estados e cidades). As fontes de dados são creditadas e o código fonte do dashboard está disponível no GitHub. Fonte: captura de tela.

Finalmente, a pandemia aponta alguns desafios para a representação visual de dados: como explicar e descrever o crescimento exponencial de forma clara e acessível? Como comparar a propagação do vírus em diferentes países de modo correto? Como explicar visualmente a incerteza em números como contagem de casos quando nem sempre os testes realizados são suficientes para torná-los indicadores confiáveis de casos reais? Ao invés de reduzir a complexidade do fenômeno, os bons exemplos de visualizações criados até o momento valem-se de convenções visuais específicas para o contexto, bem como fazem uso recorrente de anotações e ressalvas.