O conjunto de dados WCota é extraído do repositório no Github do pesquisador Wesley Cota (W. Cota, “Monitoring the number of COVID-19 cases and deaths in brazil at municipal and federative units level”, SciELOPreprints:362, 2020). O número de casos confirmados e óbitos causados por infecções por SARS-COV-2 agregados em nível estadual e municipal são compilados a partir de dados do Ministério da Saúde e Secretarias Estaduais de Saúde.
O autor reune os dados dos relatórios das secretarias estaduais e municipais disponíveis publicamente antes do registro no banco de dados do Ministério da Saúde do Brasil. Esse processo ajuda a disponibilizar dados sobre o COVID-19 em tempo real, uma vez que demora muito para registrar os casos das secretarias estaduais e municipais no sistema único brasileiro.
Além disso, os dados fornecidos pelo Ministério da Saúde têm um processo de atualização raro e lento, o site fica fora do ar com frequência e os dados são desestruturados.
Coletamos os dados de 1º de fevereiro de 2020 em diante. Os dados podem ser atualizados diariamente. Links para publicações que usam os dados do WCota ou fornecem outros locais de acesso público dos dados podem ser encontrados em ( Jorge et al., 2021, 35 ).
Os dados coletados, limpos e formatados disponíveis gratuitamente no WCota podem ser acessados e baixados em (Wesley Cota, 2020), sob a licença Creative Commons Attribution ShareAlike (CC-BY-SA 4.0).
Um código python está disponível em nosso diretório Github para baixar dados do projeto WCota, veja detalhes em Github. A Pamepi utiliza os arquivos nomeados como cases-brazil-cities-time por conter a série temporal de novos casos e mortes por Covid-19.
O conjunto de dados do WCota (arquivos "cases-brazil-cities-time") possue um total de 12 colunas e um tamanho de 311 MB na última atualização de 11 de Maio de 2022. Um código com mais detalhes sobre as variáveis, processamento de dados e métodos de análise é apresentado em nosso diretório Github.
O conjunto de dados WCota depende da qualidade das informações divulgadas pelas secretarias estaduais e municipais de saúde. Quando os arquivos são fornecidos em pdf ou imagens, isso pode comprometer a tabulação dos dados em tempo real. Além disso, os óbitos e casos de COVID-19 são tabulados de acordo com a data de coleta dos dados.
Portanto, a curva epidemiológica construída pode mostrar um atraso de uma a até 7 semanas em relação à data dos primeiros sintomas ou à data do exame laboratorial do caso (Observatório COVID-19, 2020). Ainda assim, o conjunto de dados é considerado uma excelente fonte para medir o curso da pandemia em tempo real.