Reunimos dados sobre uma série de status infecciosos individuais relacionados à pandemia de COVID-19, comportamento socioeconômico e humano. Integraremos os dados de determinantes socioeconômicos e de saúde disponíveis para cada uma das 5.570 cidades brasileiras.
Além disso, acessaremos em conjunto informações sobre as intervenções implementadas e os padrões de mobilidade social. Os dados harmonizados em nível municipal serão um recurso fundamental para a aplicação / desenvolvimento de análises estatísticas, modelagem matemática não linear, modelagem computacional, visualização de dados e divulgação científica sobre a pandemia COVID-19 no Brasil.
Podemos coletar os dados de plataformas de acesso aberto como Google Mobility, WCota, OpenDatasus, JusBrasil e IPB Cidacs Bahia. Além disso, um script em linguagem python foi desenvolvido para automatizar o processo de organização, download e atualização de arquivos, facilitando o ajuste do período de atualização do datalake conforme o sistema da plataforma original recebe suas atualizações.
Atualmente, configuramos nosso datalake para atualizar semanalmente em nosso projeto. Observe que os dados do projeto podem ser baixados por meio do código python mencionado acima ou por meio do Google Drive. Vale ressaltar que um aplicativo está sendo desenvolvido para dar aos usuários o poder de gerenciar quais informações eles desejam obter para suas pesquisas.
Os dados de vacinação têm 63 gigabytes, SG tem 14 gigabytes, SRAG tem 694 megabytes, Google Mobilidade 593 megabytes, WCota 285 megabytes e os setores censitários CIDACS 42 megabytes. Esses valores podem se alterar devido às constantes atualizações das fontes originais dos dados.
Dessa forma, o banco de dados soma aproximadamente 80 gigabytes para a versão atualizada em 4 de agosto de 2021. Todos os arquivos estão inicialmente disponíveis no formato .csv, exceto os dados dos setores censitários e WCota, respectivamente em .xlsx (excel 2007) e extensões gzip. No entanto, adicionamos um formulário de conversão e extração para distribuir todos os arquivos na extensão .csv.
Com o surgimento da pandemia causada pelo SARS-COV-2, o Ministério da Saúde implantou um sistema de vigilância para registro da Síndrome da Gripe (SG, também denominado e-SUS VE) de casos leves a moderados com suspeita de COVID-19.
O conjunto de dados da Síndrome Respiratória Aguda Grave (SRAG) é um conjunto de dados de saúde obtido junto ao Ministério da Saúde do Brasil por meio da Secretaria de Vigilância em Saúde (Ministério da Saúde, 2020). A vigilância SRAG começou com a pandemia de Influenza A (H1N1) em 2009. Desde então, SRAG também é usado para relatar Influenza e outros vírus respiratórios, que anteriormente eram relatados apenas com a vigilância sentinela da síndrome da gripe. Além disso, em 2020, as infecções humanas causadas por SARS-COV-2 foram incorporadas à vigilância SRAG.
O conjunto de dados WCota é extraído do repositório no Github do pesquisador Wesley Cota. O número de casos confirmados e óbitos causados por infecções por SARS-COV-2 agregados em nível estadual e municipal são compilados a partir de dados do Ministério da Saúde e Secretarias Estaduais de Saúde. O autor reune os dados dos relatórios das secretarias estaduais e municipais disponíveis publicamente antes do registro no banco de dados do Ministério da Saúde do Brasil.
Os dados de vacinação da Covid-19 estão relacionados à Campanha Nacional de Vacinação contra a Covid-19. O Ministério da Saúde disponibiliza por meio do Sistema de Informações do Programa Nacional de Imunizações (SI-PNI) e está disponível no OpenDatasus para download.
O conjunto de dados Índice de privação Brasileiro fornece medidas de privação para cada município brasileiro e setor censitário e é usado para avaliar as desigualdades em saúde em todo o país. O Censo Demográfico Brasileiro de 2010 é a base de cálculo da medida de privação, disponível no CIDACS. Esses dados não precisam ser atualizados.
O conjunto de dados de mobilidade Google representa a mobilidade humana fornecida pelas tendências do Google, que relata como a mobilidade humana é afetada pela propagação do COVID-19 desde 15 de fevereiro de 2020.
O conjunto de dados Mobilidade intermunicipal Brasileira são os dados históricos de fluxo médio diário em todo o país usando redes rodoviárias, aéreas e fluviais. Os dados estão disponíveis no Instituto Brasileiro de Geografia e Estatística e medidos pelo Censo Demográfico Brasileiro de 2010.
O conjunto de dados Índice de estringência é uma métrica que resume o nível de medidas governamentais promulgadas pelos estados locais a partir de Março de 2020. O conjunto de dados é dividido em dois arquivos. O primeiro contém informações textuais das medidas aplicadas em ordem cronológica e para cada estado. O segundo arquivo inclui a métrica global de rigor calculada, uma combinação de subíndices de diferentes tipos de fiscalização, como restrições a eventos, fechamento de escolas, etc. Os dados podem ser obtidos pelo JusBrasil.
A partir do banco de dados original descrito em detalhes em Visão geral, incluindo Vacinação, WCota, SG e SRAG, criamos um único arquivo onde você pode encontrar as principais informações de cada banco de dados. A composição facilita o uso dos dados, pois já são cruzados entre si e apresentam uma única entrada para uma determinada cidade e dia.