Quem é o jovem de 27 anos que previu dados alarmantes sobre a covid, e como ele fez?

Sem qualquer experiência em saúde pública, Youyang Gu acertou os dados futuros da pandemia antes de muitas instituições

A primavera de 2020 trouxe consigo a chegada da celebrização de modelos estatísticos. Enquanto o público tentava avaliar a importância do coronavírus em março e abril, esse modelo foi repetidamente direcionado para dois sistemas de previsão: um construído pela Faculdade Imperial de Londres, o outro pelo Instituto de Métricas e Avaliação em Saúde, ou IHME, com sede em Seattle.

Mas os modelos produziram previsões totalmente divergentes. A Faculdade Imperial de Londres alertou que os EUA poderiam ter até 2 milhões de mortes por covid-19 até o verão, enquanto a previsão do IHME, muito mais conservadora, previu cerca de 60.000 mortes até agosto. Nenhum dos dois chegou perto. Os EUA atingiram cerca de 160.000 mortes no início de agosto.

A enorme discrepância nos números das previsões naquela ocasião chamou a atenção de um analista de dados de 26 anos chamado Youyang Gu. O jovem tinha mestrado em engenharia elétrica e ciência da computação pelo Instituto Tecnológico de Massachusetts e outra graduação em matemática, mas nenhum treinamento formal em qualquer área relacionada à pandemia, como medicina ou epidemiologia. Mesmo assim, ele acreditou que sua experiência em lidar com modelos de dados poderia ser útil durante a pandemia.

Em meados de abril, enquanto morava com seus pais na cidade de Santa Clara, na Califórnia, Gu passou uma semana construindo seu próprio indicador de mortes por covid-19 e um site para divulgar as novidades. Em pouco tempo, seu modelo começou a produzir resultados mais precisos do que aqueles preparados por instituições com centenas de milhões de dólares em financiamento e décadas de experiência.

“O modelo de Gu era o único que parecia lógico”, diz Jeremy Howard, renomado especialista em dados e cientista pesquisador da Universidade de São Francisco. “Os outros modelos, muitas vezes, mostraram-se sem sentido e, no entanto, não houve autocrítica das pessoas que publicaram as previsões ou dos jornalistas que as reportaram. A vida das pessoas dependia dessas informações e Youyang era a única pessoa que realmente analisava os dados e fazia isso da maneira apropriada”.

O modelo de previsão que Gu construiu era, de certa forma, simples. Primeiro ele havia considerado examinar a relação entre os testes de Covid, hospitalizações e outros fatores, mas descobriu que esses dados estavam sendo relatados de forma inconsistente pelas autoridades e pelo governo federal. Os números mais confiáveis ​​pareciam ser as contagens diárias de mortes. “Outros modelos usaram mais fontes de dados, mas decidi confiar nas mortes anteriores para prever as mortes futuras”, diz Gu. “Ter isso como a única entrada ajudou a filtrar o excesso de informações”.

A nova e sofisticada reviravolta do modelo de Gu surgiu após o uso de algoritmos de aprendizado de máquina para aprimorar seus números. Depois do MIT, Gu passou alguns anos trabalhando no setor financeiro programando algoritmos para sistemas de negociação de alta frequência, nos quais suas previsões precisavam ser acuradas se ele quisesse manter seu emprego. Quando chegou o Covid-19, Gu comparava suas previsões com os totais de mortes relatados e constantemente ajustava seu software de aprendizado de máquina para chegar a prognósticos cada vez mais precisos. Embora o trabalho demandasse as mesmas horas de um exigente emprego de período integral, Gu usava o próprio tempo e passou a viver de suas economias. Ele queria que seus dados fossem vistos como isentos de qualquer conflito de interesses ou preconceitos políticos.

Embora certamente não fosse perfeito, o modelo de Gu apresentou bom desempenho desde o início. No final de abril, ele previu que os EUA teriam 80.000 mortes até 9 de maio. O número real de mortos foi de 79.926. Uma previsão semelhante do final de abril do IHME previu que os EUA não ultrapassariam 80.000 mortes durante todo o ano de 2020. Gu também previu 90.000 mortes em 18 de maio e 100.000 mortes em 27 de maio e, mais uma vez, acertou. Enquanto o IHME esperava que o vírus desaparecesse como resultado do distanciamento social e outras políticas, Gu previu que haveria uma segunda grande onda de infecções e mortes à medida que muitos estados retomassem as atividades depois dos bloqueios.

O IHME enfrentou algumas críticas em março e abril, quando os números divulgados não correspondiam ao que estava acontecendo. Ainda assim, o prestigioso centro, com sede na Universidade de Washington e sustentado por mais de US$ 500 milhões em financiamento da Fundação Bill & Melinda Gates, foi citado quase que diariamente durante reuniões por membros da administração do presidente Donald Trump. Em abril, o chefe de doenças infecciosas dos Estados Unidos, Anthony Fauci, disse a um entrevistador que o número de mortos por covid-19 "está mais para 60.000 do que 100.000 a 200.000", previsão que refletia as do IHME. Em 19 de abril, no mesmo dia em que Gu alertou sobre uma segunda onda, Trump apontou para a previsão de 60.000 mortes do IHME como indicador de que a luta contra o vírus estaria terminada em breve.

Funcionários do IHME também promoveram intensivamente seus números. “O IHME estava em todos esses noticiários tentando dizer às pessoas que as mortes iriam para zero em julho”, diz Gu. “Qualquer pessoa com bom senso poderia ver que teríamos de 1.000 a 1.500 mortes diárias por um tempo. Achei que era muita hipocrisia da parte deles.”

Christopher Murray, diretor do IHME, diz que assim que a organização conseguiu lidar melhor com o vírus depois de abril, suas previsões melhoraram drasticamente.

Mas naquela primavera, semana após semana, mais pessoas começaram a prestar atenção ao trabalho de Gu. Ele falou de seu modelo para repórteres no Twitter e enviou e-mails para epidemiologistas, pedindo que verificassem seus números. No final de abril, o proeminente biólogo da Universidade de Washington, Carl Bergstrom, tuitou sobre o modelo de Gu, e não muito depois disso os Centros de Controle e Prevenção de Doenças dos EUA incluíram os números de Gu em seu site de previsões para o Covid-19. À medida que a pandemia avançava, Gu, migrante chinês que cresceu em Illinois e na Califórnia, começou a participar de reuniões regulares com o CDC e equipes de modeladores profissionais e epidemiologistas, enquanto todos se esforçavam para melhorar suas previsões.

O volume de acessos ao site de Gu explodiu, com milhões de pessoas diariamente checando para ver o que estava acontecendo em seus estados e nos EUA em geral. Na maioria das vezes, suas previsões acabaram alcançando a linha dos números reais de morte quando esses chegavam algumas semanas depois.

Com tanto interesse em torno dessas previsões, mais modelos começaram a surgir durante a primavera e o verão de 2020. Nicholas Reich, professor associado do departamento de bioestatística e epidemiologia da Universidade de Massachusetts, em Amherst, coletou cerca de 50 modelos e mediu sua precisão ao longo de muitos meses no Centro de Previsão Covid-19. “O modelo de Youyang estava consistentemente entre os melhores”, diz Reich.

Em novembro, Gu decidiu encerrar sua operação de previsão de mortes. Reich estava combinando as várias previsões e descobriu que as previsões mais acertadas vinham desse "modelo conjunto” ou dados combinados.

“Youyang se retirou com um notável senso de humildade”, diz Reich. “Ele viu que os outros modelos estavam indo bem e seu trabalho já tinha sido feito.” Um mês antes de interromper o projeto, Gu previu que os EUA registrariam 231.000 mortes em 1º de novembro. Quando chegou 1º de novembro, os EUA relataram 230.995 mortes.

Murray, do IHME, tem sua própria opinião sobre a saída de Gu. Ele diz que o modelo de Gu não teria percebido a natureza sazonal do coronavírus e teria ignorado o pico de inverno em casos e em mortes. “Ele achou que a epidemia iria embora no inverno, mas nós havíamos captado a sazonalidade já em maio”, diz Murray.

Os métodos de aprendizado de máquina usados ​​por Gu funcionam bem em previsões de curto alcance, Murray diz, mas “não são muito bons em compreender o que está acontecendo” no quadro geral. Os algoritmos, baseados no passado, não podem levar em conta as variantes do vírus e quão bem as vacinas podem ou não funcionar contra eles, de acordo com Murray. Por sua vez, o IHME divulgou corretamente o pico inicial do vírus e depois errou ao prever um declínio acentuado nas mortes até ajustar seu modelo para refletir melhor a realidade. “Erramos no primeiro dia de abril”, diz Murray. “Desde então, somos o único grupo que acertou de forma consistente.”

Reich, que compila a lista dos principais modelos, disse que as previsões da organização se tornaram mais plausíveis, mais tarde na pandemia. “No início, o modelo do IHME não fazia o que anunciava”, diz Reich. “Mais recentemente, tem sido um modelo razoável. Eu não diria que é um dos melhores, mas é razoável”.

Gu recusou-se a responder aos comentários de Murray sobre seu modelo. Em vez disso, ele dá uma versão de humildade científica diante de um elogio indireto. “Agradeço muito o Dr. Chris Murray e sua equipe pelo trabalho que fizeram”, diz Gu. “Sem eles, não estaria na posição que estou hoje.”

Na medida em que podemos aprender com essa história sobre dados, Reich pede que as pessoas não se apressem em colocar muita fé nos primeiros modelos individuais na próxima vez que uma pandemia chegar. Ele também questiona se as previsões além de seis a oito semanas serão muito precisas. Idealmente, o CDC e outros serão mais rápidos ao combinar modelos e distribuir os dados combinados no futuro. “Espero que possamos investir tempo, energia e dinheiro na criação de um sistema que esteja mais preparado para responder com uma gama mais ampla de modelos mais próximo do início”, diz Reich. “Precisamos de indivíduos preparados, em vez de sair por aí e bater na porta das pessoas.”

Depois de uma pequena pausa, Gu, agora com 27 anos e morando em um apartamento em Nova York, voltou a trabalhar no modelo. Desta vez, está criando números relacionados a quantas pessoas nos EUA foram infectadas pela covid-19, a rapidez com que as vacinas estão sendo lançadas e quando, se isso acontecer, o país poderá atingir a imunidade coletiva. Suas previsões sugerem que cerca de 61% da população deve ter alguma forma de imunidade – seja por causa da vacina ou de infecção anterior – até junho.

Antes da pandemia, Gu esperava iniciar um novo empreendimento, possivelmente em análises esportivas. Agora ele está pensando em se limitar à saúde pública. Quer encontrar um emprego onde possa exercer grande impacto, evitando política, preconceitos e o peso que às vezes vem com grandes instituições. “Existem muitas deficiências nesse campo que poderiam ser melhoradas por pessoas com minha formação”, diz ele. “Mas ainda não sei bem como me encaixaria.”

* Tradução de Anna Maria Della Luche

 

Obrigado por ler a EXAME! Que tal se tornar assinante?


Tenha acesso ilimitado ao melhor conteúdo de seu dia. Em poucos minutos, você cria sua conta e continua lendo esta matéria. Vamos lá?


Falta pouco para você liberar seu acesso.

exame digital

R$ 3,90/mês
  • R$ 9,90 após o terceiro mês.

  • Acesse quando e onde quiser.

  • Acesso ilimitado ao EXAME Invest, macroeconomia, mercados, carreira, empreendedorismo e tecnologia.
Assine

exame digital anual

R$ 99,00/ano
  • R$ 99,00 à vista ou em até 12 vezes. (R$ 8,25 ao mês)

  • Acesse quando e onde quiser.

  • Acesso ilimitado ao EXAME Invest, macroeconomia, mercados, carreira, empreendedorismo e tecnologia.
Assine

Já é assinante? Entre aqui.