Imagem: Reprodução
Leia abaixo a Carta Aberta na íntegra:
Preocupações com relação à interpretação errônea de testes de hipóteses estatísticas em ensaios clínicos para COVID-19
Uma parte significativa da comunidade médica, e especificamente alguns artigos em revistas médicas importantes, estão interpretando erroneamente os resultados estatísticos em ensaios clínicos randomizados. Realizados, até agora, para responder à pergunta sobre a eficácia da hidroxicloroquina no tratamento inicial da COVID-19. Embora existam evidências de que a hidroxicloroquina não é eficaz em pacientes graves hospitalizados [1], seu uso nos estágios iniciais da doença ainda está em debate.
Recentemente, três revistas médicas importantes publicaram artigos influentes sobre o uso precoce de hidroxicloroquina para a COVID-19[2][3][4]. Deixando de lado suas limitações de projeto, eles são ensaios clínicos randomizados, que são o padrão ouro em pesquisa médica. Esses três artigos tiveram grande repercussão na mídia, nas políticas públicas e na comunidade científica.
No entanto, esses três artigos compartilham pelo menos um erro em comum: as conclusões que extraem de seus dados estão erradas. Todos os três artigos levam, explícitamente [2][4] ou implícitamente [3], à conclusão de que o tratamento precoce de pacientes com COVID-19 com hidroxicloroquina não é eficaz. Ao dizer que as conclusões estão erradas, não estamos afirmando que a hidroxicloroquina seja eficaz. Esta é uma distinção sutil, mas importante [5].
A hipótese nula nesses artigos é definida como H0: efeito do tratamento = efeito de controle. Em qualquer teste estatístico clássico, a hipótese nula nunca pode ser aceita, apenas não pode ser rejeitada. Esse é um problema bem conhecido 6]. Os ensaios clínicos randomizados são amplamente usados na ciência médica. Todos esses três estudos aplicaram um teste de hipótese estatística para analisar seus resultados e tirar suas conclusões. Eles tiveram resultados semelhantes: todos os efeitos do tratamento medidos nos estudos mostraram resultados positivos, com os grupos de tratamento exibindo melhores resultados do que os grupos de controle em cada variável medida, mas com diferenças não estatisticamente significativas em níveis de confiança de 95%[2][4] ou 90%[3].
A conclusão formal para esses testes de hipótese deve ser que não há evidência suficiente, para a amostra e o teste adotado, para rejeitar a hipótese nula de que o tamanho do efeito do tratamento é igual ao tamanho do efeito do controle para o nível de confiança escolhido. Uma interpretação mais adequada da conclusão formal nesses estudos seria que há evidências de que o efeito do tratamento é positivo, mas essas evidências são estatisticamente inconclusivas, no sentido de que não é possível concluir, em 95%[2][4] (90%)[3] nível de confiança, que o efeito não pode ser atribuído à aleatoriedade.
Em outras palavras, seus resultados trazem evidências de que o tratamento precoce é eficaz. A confusão ocorre porque a evidência é medida por efeitos estatísticos, não por valores de p, que medem a incerteza dessa evidência 5]. Grandes valores de p estão relacionados ao aumento da incerteza nas evidências obtidas. Eles podem ser grandes por dois motivos: um, o tratamento não é realmente eficaz e as evidências encontradas foram devido à aleatoriedade; dois, o tamanho da amostra não era grande o suficiente para medir com precisão o efeito real do tratamento.
Portanto, pelo menos inicialmente, se o valor de p não for pequeno o suficiente, não será possível atribuir esse fato ao efeito do tratamento, uma vez que o tratamento pode ser eficaz e o grande valor de p pode ser atribuído a um pequeno tamanho de amostra, a limitação do estudo não do tratamento. Recentemente, a Nature publicou um editorial para chamar a atenção para o fato que os tamanhos de amostra dos ensaios COVID-19 eram muito pequenos [7].
O fato desses três estudos com hidroxicloroquina (HC) apresentarem resultados positivos, mas inconclusivos, sugere que eles podem ter baixo poder estatístico. Por exemplo, o maior estudo objetivou um efeito relativo prévio de 50% para definir o tamanho da amostra 2]. Embora possa não ser alto quando comparado aos tratamentos para algumas outras doenças, isso parece muito ambicioso no contexto da COVID-19, conforme mostrado pelo efeito relativo da dexametasona de 10,8% mostrado na tabela 1 abaixo.
A intenção primária desta carta, entretanto, é chamar a atenção para a interpretação errônea dos resultados do teste de hipótese, não para realizar uma análise completa de seus poderes estatísticos. Portanto, optamos por mostrar na tabela 1 uma comparação simples de uma parte de seus resultados com aqueles do célebre ensaio randomizado de recuperação em dexametasona (DX) para COVID-19[8]. Observe que os valores de p exibidos abaixo, para amostras hipoteticamente maiores, não são estimativas formais. A intenção da comparação a seguir é principalmente enfatizar que os valores de p não podem ser comparados diretamente sem levar em consideração os tamanhos dos efeitos que estão medindo e os tamanhos das amostras usadas [9].
Usamos o artigo da dexametasona como referência porque as comunidades médica e científica concordam amplamente com sua importância para a COVID-19.
Fonte: Conexão Política

Nenhum comentário:
Postar um comentário