Como a ciência de dados vem ajudando na luta contra a COVID-19

 

A pandemia de COVID-19 está mobilizando todos os setores da sociedade em busca de alternativas para identificação de locais de alta incidência, o rastreamento da expansão do contágio e o monitoramento do distanciamento social. As ciências, em todas as suas vertentes, estão agora empenhadas nas pesquisas que visam criar uma vacina. E a ciência de dados é uma delas.

Segundo especialistas, os profissionais das ciências de dados, especialmente aqueles ligados a Inteligência Artificial, podem assumir três papéis estratégicos para ajudarem na luta da ciência contra o coronavírus: executando algoritmos complexos, analisando diversos conjuntos de dados e identificando componentes de uma vacina, entendendo a estrutura da proteína viral da COVID -19; ajudando os pesquisadores médicos a analisar toneladas de documentos de pesquisa relevantes em um ritmo sem precedentes; e identificação de compostos usando Inteligência Artificial e computação em nuvem para impedir que a proteína Spike se ligue ao receptor ACE2 em células humanas, o que efetivamente causa a doença.

Por todo o mundo instituições públicas e privadas vem se unindo para estudar e propor formas de combate e pesquisa que capacitem médicos e epidemiologistas a lidar com as condições impostas pelo coronavírus. E essas iniciativas vão muito além do simples monitoramento de casos e desfechos – óbitos e curas – confirmados.

Nos Estados Unidos, a Harvard Medical School e a Universidade Johns Hopkins desenvolveram sistemas de busca de informações através de coleta de dados em redes sociais e outras fontes que ajudam na identificação e localização de casos possíveis e confirmados da doença.

A Harvard Medical School está utilizando abordagens de aprendizado de máquina para revisar dados e informações de várias fontes, incluindo registros de pacientes, mídias sociais e dados de saúde pública que, submetidos a uma ferramenta de processamento de linguagem natural, os pesquisadores podem distinguir entre as pessoas que reclamam dos sintomas do coronavírus e as que discutem sobre a doença, mas não são afetadas e entender a localização atual do surto.

A tecnologia GIS, Tecnologia de Sistemas de Informação Geográfica desenvolvida pela Universidade Johns Hopkins, se tornou uma ferramenta importante para impedir a disseminação do coronavírus. Através da mineração de dados de sites de mídia social, a Universidade criou um painel que mostra todos os casos de coronavírus em todo o mundo na forma de mapas de calor que podem rastrear melhor a localização e a propagação de uma doença. Isso ajuda a detectar áreas em que as pessoas falam sobre a doença e, consequentemente, basear medidas de prevenção a serem implementadas.

Mesmo antes de a COVID-19 se tornar uma ameaça global, cientistas de dados já tentavam chamar a atenção da comunidade médica internacional para os perigos da doença. A empresa canadense BlueDot, especializada no monitoramento de doenças infecciosas no mundo, previu o alastramento da doença em dezembro de 2019 com a ajuda de sistemas de Inteligência Artificial. Esses sistemas analisaram enormes quantidades de dados relacionados a redes de enfermidades em animais e vegetais, novos estudos em websites, documentos governamentais e de outras fontes online que vieram a identificar a região de Wuhan na China como principal foco da doença e que, em pouco tempo, ela estaria em Seul, Bangkok, Taipei e Tóquio.

As empresas gigantes da Internet também se envolveram no desenvolvimento de ferramentas que disponibilizassem informações úteis para o combate à COVID-19. A Baidu, a gigante das  buscas online da China, se associou à Universidade de Southampton no Reino Unido para a utilização de dados anonimizados de usuários de smartphones no intuito de desenvolver um modelo que mostrasse como o vírus saiu de Wuhan nos dias seguintes a sua aparição. Já a Tencent, outra gigante chinesa dona do app WeChat, desenvolveu um modelo que mostra a forma de contágio, o que baseou as medidas restritivas colocadas em prática na China para a contenção do alastramento.

O Facebook, em parceria com o Google e pesquisadores da Carnegie Mellon University, nos Estados Unidos, implementaram uma pesquisa voluntária na rede social em que os usuários são convidados a reportar sintomas relacionados à COVID-19 que venham a experimentar. Essa iniciativa provê insights sobre o comportamento da doença em vários países e pode contribuir em muito para as instâncias de saúde pública, por exemplo, na definição de capacidade hospitalar a ser implementada num cenário de aumento de casos. Os dados voluntários colhidos pelo Facebook são então cruzados com as pesquisas feitas no Google sobre sintomas, testes e visitas médicas e com resultados divulgados pela empresa de testes epidemiológicos Quidel e informações coletadas por consultas de telemedicina.

No Brasil as iniciativas também estão acontecendo. O Serasa Experian, a Amazon, pesquisadores da USP e um braço da ONU lançaram uma plataforma com novos dados para ajudar a combater a COVID-19 no Brasil. O Serasa Experian provê dados unanimizados, a Amazon se encarrega do armazenamento e processamento de dados, o Instituto de Matemática da USP desenvolve modelos epidemiológicos. Enquanto o Instituto de Biologia da USP cria modelos de propagação e o Pacto Global da ONU (Brasil) fica responsável por garantir a governança desses dados. A ferramenta, chamada de Covid Radar, conta com informações sobre os deslocamentos de pessoas no país, o que permite entender como a doença pode se espalhar. Nesse caso, a ideia é usar dados emitidos pelos telefones celulares.

Essas informações são anonimizadas, ou seja, não se sabe a identidade desses usuários. O que importa é entender o padrão de deslocamentos no Brasil. Quando identificada uma região crítica em número de casos, é possível saber para onde pessoas dessa área costumam ir, ajudando no combate à propagação da doença.

Em São Paulo, a prefeitura da capital que é o principal foco da doença no Brasil, se associou com operadoras de celular para monitorar o distanciamento social. A ideia é cruzar os dados das operadoras, que monitora informações georreferenciadas de seus usuários, com dados dos registros de saúde da capital para gerar informações como índices elevados de casos, locais com maior concentração de pessoas e a criação de um índice de eficácia da quarentena monitorando a adesão considerada ideal para controlar a disseminação da doença.

Já no Rio de Janeiro, a Fundação Oswaldo Cruz está liderando várias iniciativas científicas para o combate e a geração de informações relevantes sobre a COVID-19. Lá, os pesquisadores se associaram à Rede D’Or, rede particular de hospitais, e com uma empresa na área de Inteligência Artificial e Big Data e desenvolveram um aplicativo para smartphone no qual os usuários, de forma anônima, preenche um formulário de autoavaliação sobre o seu histórico de saúde e sintomas associados ao coronavírus. Os resultados levantados pela parceria serão usados pela Secretaria de Estado de Saúde do Rio de Janeiro que estará mais bem capacitada para, com eles, entender melhor a dinâmica de transmissão do vírus e a evolução da pandemia para embasar medidas e planejamento de ações de contenção e tratamento mais efetivas.

Não são poucas as possibilidades que a ciência e os cientistas de dados têm para contribuir para chegarmos a novas possibilidades de combate e, quem sabe, a uma vacina.

Fique de olho no nosso Painel de Impacto do Coronavírus.

Manoella Fidalgo

Manoella mudou para São Paulo para fazer uma pós-graduação e nunca mais saiu. Além de escrever para o blog da Criteo Brasil, ela é responsável pelo Marketing da Criteo na América Latina. Gosta de pipoca, música e não come chocolate. Não necessariamente nessa ordem.