Quantcast
Channel: Medicina Baseada em Evidências
Viewing all 225 articles
Browse latest View live

O Princípio da Prova do Conceito

$
0
0

Tradicionalmente, nossos textos argumentam a favor do uso de evidências científicas na decisão clínica. Esta atual postagem está além da discussão do paradigma do embasamento científico. Este texto é feito para aqueles que estão convencidos da necessidade da decisão embasada em evidências científicas. Hoje vamos propor um refinamento, o uso do paradigma na medida certa. 

O princípio da prova do conceitoé pouco entendido em sua essência, provocando um uso caricatural da medicina baseada em evidências. A Prova do Conceito define a medicina baseada em evidências como a prática do julgamento clínico individualizado, norteado por conceitos científicos. Nortear é diferente de obrigar ou comandar. 

Afirmações como “não devo fazer desta forma, pois não foi exatamente isso que foi testado nos estudos” são muito frequentes por praticantes da medicina baseada em evidências. Observe que esta frase tem o intuito de reforçar o paradigma da medicina baseada em ciência, porém exagera ao aprisionar a decisão clínica dentro da metodologia do trabalho científico.

Ao violar o princípio da hipótese nula (ceticismo), erramos pela liberdade de fazer o que se quer ou o que se crê. Ao violar o princípio da prova do conceito nos tiramos a liberdade de raciocinar a respeito do paciente. São dois erros, diametralmente opostos.

O princípio da prova do conceito previne dois equívocos comuns: (1) achar que a conclusão do trabalho cria uma regra ou receita de bolo a ser sistematicamente reproduzida; (2) copiar o método do trabalho científico na prática clínica.

A Receita de Bolo (o caso do PEGASUS)


Imaginem um estudo de excelente qualidade metodológica que prova o conceito de eficácia de uma terapia. Com base nisso, observamos muitas vezes a criação de uma regra a favor da terapia, representada por uma indicação classe I. A “rotina" passa a ser a utilização do tratamento. 

Não deve ser exatamente assim. O trabalho científico serve para criar um conceito e não para determinar uma conduta individual. Quem determina a conduta é o médico, com base em decisão multifatorial. 

Por exemplo, o recente ensaio clínico PEGASUS-TIMI 54 demonstrou que a associação de dupla anti-agregação plaquetária  (Ticagrelor + AAS) reduz eventos cardiovasculares comparado a apenas AAS, em pacientes estáveis, que tiveram infarto em passado remoto. Analisando criticamente a metodologia do trabalho, concluímos que este representa um alto nível de evidência, devido ao baixo risco de vies ou erro aleatório. Fica então demonstrado um novo conceito: mesmo em pacientes sem instabilidade de placa, anti-agregar mais agressivamente traz benefício. Complementando a informação de benefício, há o conceito da magnitude do benefício, representada neste estudo pela uma redução relativa do risco (hazard neste caso) de 16%. A redução relativa do risco representa a propriedade intrínseca do tratamento, pois tende a ser constante, independente da gravidade do paciente (observe isso nas análises de subgrupos de estudos positivos). Portanto, este estudo de boa qualidade prova o conceito de que a dupla anti-agregação promove uma redução adicional de risco de 16%, em termos relativos. 

E agora? Fica então indicado de forma rotineira este tratamento? É uma receita de bolo? 

Agora depende do raciocínio clínico. Observem que neste estudo a redução absoluta do risco foi de 1.27%, resultando em NNT = 79. Esse é um alto NNT, sugerindo um benefício de pequena magnitude. Mas essa pequena magnitude não é exatamente um conceito genérico que está sendo demonstrado. Este NNT é o que ocorre em média, considerando o amplo espectro de pacientes na amostra do estudo. 

Uma confusão comum é achar que o NNT é uma propriedade intrínseca do tratamento. Não é, pois este varia de acordo com o risco basal do paciente. O que é constante é a redução relativa. Assim, o NNT nos chama atenção que o tratamento pode ser de pequena magnitude, em média. 

Partimos de uma conceito e individualizamos a conduta. O conceito foi a redução relativa do risco de 16%. Agora olhamos para o risco absoluto de nosso paciente. Observem que aplicando a redução relativa em pacientes de risco baixo ou intermediário, terminaremos com um NNT insatisfatório, não valendo a pena pagar o preço de mais sangramento. Porém, em paciente no extremo de gravidade, o NNT será mais baixo e este tratamento pode valer e pena. 

Em um paciente com incidência de eventos de 9% (como observado no estudo), o NNT é 79. Mas um paciente cuja incidência é 20%, o NNT já seria 31.

Isto mostra que um conceito demonstrado não promove um regra que deve ser copiada sistematicamente. Apenas nos dá subsídio para raciocinar a respeito de nosso paciente. 

Violando este princípio, a indústria pode querer induzir os médicos a vender este tratamento para pacientes de qualquer faixa de risco. Já estou até vislumbrando o lançamento de um Brillinta Light, na dose de 60 mg para pacientes estáveis, tal como fez o estudo. Não devemos nos deixar enganar por esta lucrativa regra. 

Por outro lado, médico mais atentos ao paradigma científico podem rejeitar totalmente o uso da dupla anti-agregação com base no cálculo do NNT do trabalho e no risco de sangramento apresentado. A rejeição total também não seria adequada. 

O correto é aceitar o conceito da redução relativa do risco, pois a evidência é de qualidade, e a aplicar ao risco basal de seu paciente. Neste caso, acredito que o uso se limitará a exceções de alto risco.

Ler artigo e valorizar a evidência é uma coisa diferente de adotar a evidência. 

Devemos evitar a confusão entre nível de evidência e grau de recomendação. Observem que o nível de evidência diz respeito à confiabilidade do trabalho (risco de vies ou erro sistemático). Um trabalho como o PEGASUS é um nível top de evidência (nível A), demonstrando um conceito verdadeiro. Isso pode induzir as pessoas a achar que o grau de recomendação deve ser forte (Grau I). No entanto, com base no NNT médio demonstrado no trabalho, este tratamento deve ser classificado como fraco grau de recomendação. Vejam então que um tratamento pode ter alto nível de evidência e fraco grau de recomendação. Esta fraca recomendação significa reservar a terapia para exceções. 

A Cópia do Método do Trabalho


Como mencionei, a pouca clareza a respeito do princípio da prova do conceito promove o caricatural cópia do método do trabalho, que ocorre de 3 formas: copiar o critério de inclusão do estudo, copiar a forma de tratamento ou copiar (pasmem) o grupo controle do estudo. 


Copiar o Critério de Inclusão

A cópia da população-alvo é a negação do princípio da complacência ou de evidências indiretas. Muito comum que guidelines limitem a indicação de tratamentos de ressincronização apenas para pacientes com fração de ejeção < 35%. E o pacientes com fração de ejeção de 36% deve ficar de fora? Vemos na prática as engraçadas situações onde os médicos solicitam outros métodos mais acurados de medidas de fração de ejeção na esperança de que o resultado venha abaixo de 35%. No fundo, o médico está convencido do benefício, baseando-se na prova do conceito, porém se sente engessado ao método do trabalho. Essa conduta aparenta ser uma conduta respeitosa com o paradigma da medicina baseada em evidências, porém é equivocada. 

Percebam mais uma vez de que o ensaio clínico representa uma metodologia que testou um conceito. Testou e demonstrou o conceito de que pacientes com disfunção sistólica clinicamente importante se beneficiam do tratamento. A fração de ejeção < 35% não é o conceito, é apenas um método do estudo para recrutar o melhor tipo de paciente para testar a hipótese, sem cometer erros. A fração de ejeção no extremo inferior é uma forma de recrutar uma amostra que terá um número maior de desfechos clínicos, o que garantirá o poder estatístico do estudo. É uma forma metodológica de prevenir o erro tipo II. Apenas isso, não que a proposta seja apenas tratar pacientes com fração de ejeção < 35%, deixando necessariamente de fora qualquer outro tipo de paciente. Usar a terapia de ressincronização em pacientes com bloqueio de ramo esquerdo, QRS devidamente alargado e fração de ejeção de 37% é um ótimo exemplo de utilização correta de uma evidência indireta. O mesmo funcionaria para o paciente com fração de ejeção de 40%, se clinicamente a doença fosse importante. Mas na medida em que o seu paciente vai se distanciando muito da média da amostra analisada, ficamos mais céticos, até deixarmos de aplicar a evidência indireta. 

Duas coisas: a comparação se faz melhor com a característica média da amostra do que com os critérios de inclusão; não há um limite preciso de onde parar de aplicar a evidência indireta, este é um julgamento clínico individualizado. Por outro lado, não vamos querer aplicar essa evidência em pacientes sem bloqueio de ramo esquerdo, pois esta variação de característica tem muita plausibilidade interferir na eficácia do tratamento em questão. É um julgamento caso a caso.

Esta complacência na aplicação de um tratamento custoso como ressincronização pode gerar uma certa sensação de liberalidade. Mas não é essa a proposta. Não haverá liberalidade, pois quando julgamos individualmente, podemos também identificar indivíduos com fração de ejeção < 35% e que não deverão usar o tratamento. A proposta é apenas não nos engessar no pensamento clínico. 

Um exemplo de aplicação da prova do conceito é o tratamento farmacológico de hipertensão leve. Imaginem um paciente com pressão arterial de 150 x 95 mmHg. Na maioria das vezes, quando corretamente diagnosticados, estes pacientes recebem indicação de tratamento. No entanto, as evidências de eficácia dos tratamentos se restringiram os critérios de inclusão a pacientes com pressão > 160 x 100 mmHg e múltiplos fatores de risco cardiovascular. Por que? Essa foi uma forma de estudar uma amostra mais grave, que terá mais eventos, proporcionando adequado poder estatístico. Estes estudos comprovaram o conceito de que a redução da pressão arterial traz benefício do hipertenso e este conceito pode ser aplicado a pessoas menos hipertensas do que a amostra utilizada. Até um certo limite. Que limite? Isso é discutível, haja visto nossa história discussão neste Blog com o professor Flávio Fuchs. 

Há alguns anos a eficácia da Sibutramina foi testada em pacientes de alto risco cardiovascular, e o estudo falhou em comprovar redução de eventos em pacientes de alto risco cardiovascular. Não só falhou em reduzir eventos, mas aumentou a incidência. Daí me vêem os entusiastas da Sibutramina querendo dizer que só entraram no estudo pacientes de alto risco cardiovascular e portanto poderiam continuar utilizando nos demais. Que bobagem … Vejam que foi a amostra de alto risco cardiovascular que permitiu ao estudo ter poder estatístico. E foi neste cenário de poder estatístico que o estudo não conseguiu demonstrar benefício. Desta foram, o conceito comprovado é de que a  Sibutramina não reduz eventos, de acordo com o melhor cenário científico, aquele que nos tranquiliza quando ao erro tipo II. E se algo não tem o conceito de benefício demonstrado, por que utilizar?


Cópia da Forma de Tratamento

No início da década de 2000, o estudo MIRACL demonstrou que atorvastatina 80 mg ao dia (comparada a placebo) reduzia eventos cardiovasculares (modestamente) ao longo de 4 meses após síndromes coronarianas agudas. Isto gerou um carimbo prescritor de 80 mg de atorvastatina em pacientes internados nestas condições. Mas porque 80 mg na velinha com colesterol apenas moderadamente alto? 

Essa é uma confusão comum entre conceito e o método do trabalho. A dose é apenas o método utilizado pelo trabalho para testar o conceito. No experimento, este foi o melhor método, pois dada a variabilidade individual de resposta, a dose máxima garantiria um contraste médio entre a droga e o placebo no curto prazo. Além disso, ao usar a dose máxima, um eventual resultado negativo não poderia ser atribuído a uma dose insuficiente. 

Por outro lado, na prática individual, esta pode não ser a melhor dose na maioria dos pacientes. A dose diz mais respeito ao desenho do estudo do que ao que devemos fazer com nosso paciente. 

Esta discussão não se refere apenas a dose de medicação, mas a qualquer outra forma de adoção de conduta clínica. Gosto do exemplo de dose, pois posologia é um dos mais inadequados paradigmas na medicina. Posologia conota uma regra a ser seguida de forma consistente em nossos pacientes. Medicação não tem dose ideal, na verdade cada paciente tem a SUA dose ideal. Só não sabemos qual, por isso que tentemos a partir de um norte posológico. 

O estudo deve ser bem desenhado para provar um conceito. Uma vez provado, a forma de aplicação do conceito paciente pode e deve ser individualizada. Medicina baseada em evidênciasé individualizar uma decisão norteada por um conceito comprovado. Ao individualizar, estamos aprimorando o tratamento para o nosso paciente, pois cada indivíduo deve ser tratado de uma forma um pouco diferente, considerando suas particularidades. 


Cópia do Grupo Controle

Este é o mais caricatural dos equívocos por praticantes da medicina baseada em evidências. Um dos melhores exemplos são os estudos que testaram a eficácia de transfusão liberal em pacientes criticamente enfermos. Transfusão liberal (more is more) foi definida na maioria dos trabalhos como repor o sangue para colocar a hemoglobina > 10g%. E o grupo controle em boa parte dos trabalhos foi transfundir se hemoglobina < 7 g% ou instabilidade clínica. Estes estudos foram todos negativos, não mostraram benefício da transfusão liberal. Fica então a prova do conceito de less is more na transfusão de pacientes críticos.

No entanto, de forma equivocada surgem recomendações do tipo (olhe o UpToDate de novo): salvo instabilidade clínica, a transfusão deve ser realizada apenas se hemoglobina < 7 g%. Esse é um grande exemplo de cópia do grupo controle. Observem que 7 g% é apenas o método usado pelo trabalho para promover contraste da quantidade de transfusão entre os dois grupos. Mais uma vez, a prova do conceito está no contraste, e o método do trabalho deve ser desenhado para garantir esse contraste. Mas isso não quer dizer que 7 é um número mágico. Observem que 7 não foi comparado a 7.5, 8, 8.5 ….. Não foi isto que foi testado. A interpretação correta é de que 7 é apenas o método e o conceito que fica é de ser restritivo na indicação, pensar de forma multifatorial, considerar as circunstâncias. 

Na individualização dos nossos pacientes, evitaremos transfundir porque a hemoglobina está abaixo de 10g. Mas não há motivo de nos guiar em um numero 7 ou 8, que não foram testados como o melhor limite para desencadear a transfusão. Temos que nos basear em nosso julgamento, norteados pelo paradigma do less is more

Caricatural é quando o paciente está com hemoglobina de 7.3g,  a mão fica coçando para transfundir (julgamento clínico), mas não o fazemos. Ficamos na expectativa (torcendo) para que a hemoglobina do dia seguinte chegue em 6.9g, nos autorizando a dar sangue ao paciente.

Conclusão


É comum o equívoco de confundir ciência e assistência como coisas próximas. A ciência deve influenciar a assistência e a assistência deve gerar ideias para serem testadas cientificamente. Mas as duas são diferentes e devem ser tratadas como diferentes. O pensamento do cientista no desenho do estudo não deve ser o mesmo do pensamento do médico na decisão quanto a seu paciente. 

O desenho do estudo se preocupa em evitar conclusões erradas, decorrentes de acaso ou vies. O médico se preocupa em beneficiar seu paciente, aplicando corretamente os conceitos provenientes da ciência, usando sua sensibilidade, experiência e percepção a respeito de seu cliente.


Assista do vídeo gravado pelo autor sobre A Prova do Conceito



Exercício e Perda de Peso: Um Mito Prejudicial

$
0
0


Há mitos e mitos. Há mitos interessantes e há mitos prejudiciais. 

O aspecto cultural da mitologia grega é um exemplo da utilidade representativa dos mitos.

O mito de que o arco-íris tem 7 cores é atraente, melhor do que falar a realidade de que o arco-íris não tem cores individuais, tem um espectro contínuo de cores. É apenas um artefato da percepção humana que faz com que ele apareça como uma série de cores separadas. Esse mito, proveniente de uma ilusão visual, não é prejudicial. 

Por outro lado, quando os mitos nos desfocam de verdades práticas, estes podem se tornar indesejáveis. A ideia de que a prática regular de exercício físico causa redução de peso significativa é exemplo de um mito prejudicial, causado por uma ilusão cognitiva.

Para resolver a ilusão visual do arco-íris, precisamos de aparelhos especiais de visualização. Para resolver nossas ilusões cognitivas de interpretação do mundo real, precisamos da aparelhagem do método científico. 

Ao acreditar fortemente que exercício possui um efeito direto na perda de peso, cada pessoa que  percebemos perder peso durante atividade física servirá de confirmação para nossa crença. E as pessoas que não perdem peso são eliminadas de nossa memória. É o viés cognitivo de confirmação selecionando os casos positivos. 

Já o método científico é estatístico, pois leva em conta as pessoas que perdem e as que não perdem peso. E compara a frequência de sucesso na perda de peso entre pessoas que fazem e que não fazem exercício. Em segundo lugar, o método científico se preocupa com vieses. Será que as pessoas que perdem peso fazendo exercício obtém este efeito porque melhoram a dieta em paralelo? Dieta aqui funciona como uma potencial variável de confusão. E como resolver essa confusão? Através de ensaios clínicos randomizados, pois como sabemos a randomização tornam homogêneos os grupos intervenção e controle, eliminando inclusive diferenças de hábitos alimentares, pelo menos no momento baseline. 

Em 2010, o USPrevention Task Force publica a revisão sistemática de ensaios clínicos randomizados comparando orientação para atividade física versus controle, não evidenciando redução estatisticamente significante de adiposidade. Poderíamos imaginar que os indivíduos do grupo exercício enrolaram e não praticaram devidamente. Mas estes estudos descreveram um aumento significativo da prática de atividade e melhora da capacidade funcional no grupo intervenção. Portanto, este não foi um viés. Vejam figura abaixo. 


Um ano após, em 2011, é publicado no New England Journal of Medicine o ensaio clínico  randomizado "Weight Loss, Exercise, or Both and Physical Function in Obese Older Adults”, reforçando a ausência de efeito do exercício no peso. Observem o gráfico abaixo, que representa o peso de 4 grupos ao longo de 1 ano: dieta isolada, exercício isolado, ambos ou nada (controle). A linha do grupo exercício isolado está colada na linha do grupo controle. E a linha do grupo exercício e dieta, está colada na linha do grupo dieta isolada. Primeiro, sozinho o exercício não promoveu perda de peso; segundo, o exercício não potencializou a perda de peso da dieta. O resultado é evidente.

Mas o peso não depende apenas de gordura. Seria interessante avaliarmos o impacto do exercício na massa gorda. E isso foi feito pelo estudo, demonstrando que quando o exercício foi associado à dieta a redução de massa gorda foi menor (- 6.3 ± 2.8 Kg) do que a dieta isolada (- 7.1 ± 3.9 Kg).


De fato, exercício nos faz gastar algumas poucas calorias. Mas o que nós perdemos no exercício é facilmente reposto por uma garrafa de Gatorade + 1 banana. E normalmente nós superestimamos o quanto podemos comer a mais por conta do gasto calórico do exercício. Por isso que às vezes até ganhamos peso com o exercício. 

E quanto ao metabolismo? Se este aumenta, não aumenta o suficiente para ter efeito no peso, seria apenas a tentativa de convencer que algo funciona através de um argumento mecanicista. Pífio.

Portanto, este é um mito médico. Agora vem a segunda questão, é um mito prejudicial ou tanto faz?

Ao colocar parte da responsabilidade da perda de peso no exercício, retiramos erroneamente parte da responsabilidade da dieta. Vejo com frequência afirmações do tipo “estou fazendo dieta e não perco peso. Preciso começar a fazer exercício." Observem a perda de foco. O que a pessoa precisaria pensar é que deve aprimorar a dieta. Acreditar que o segredo para a resolução do problema está na associação com exercício é anti-científico e não promove a mudança necessária na dieta. 

Há pessoas inclusive que acham poder fazer uma dieta menos restrita pois estão fazendo exercício, o que tende a reduzir a efetividade da dieta.

Administradores sabem que focoé o maior segredo gerencial e controle do peso é um dos grandes exemplos de dependência do bom gerencialmente pessoal. Esse mito nos desfoca.

Por outro lado, devemos reconhecer que do ponto de vista pragmático, exercício pode contribuir para a perda de peso em alguns, pois como parte de uma medida geral de mudança de hábitos, pode motivar a pessoa a reduzir a infesta calórica. Imaginem uma pessoa que passa a ter o hobby de corrida. É comum que ao lado disso a pessoa se motive a iniciar uma dieta, pois a perda de peso poderá melhorar seu desempenho na corrida. O exercício entra como um motivador da dieta. Isso é positivo. Porém é diferente de confundir isso com efeito direto do exercício. Há uma evidente utilidade clínica em reconhecer a diferença destas duas coisas. 

Já não é a primeira, nem segunda vez que discuto evidências que desmistificam certos benefício do exercício neste Blog. Uma postagem bastante discutida foi a do estudo LOOK-AHEAD, estudo que ficou com a hipótese nula da ausência de beneficio cardiovascular. Isto pode fazer parecer que tenho preconceito contra exercício. O que me salva é meu hábito diário de fazer 1 hora e meia de exercício, pois reconheço outros benefícios da atividade física que vão além da redução de peso ou de risco cardiovascular. Essas reflexões não vêem de um preconceito contra exercício, mas sim de uma predileção em utilizar a lente científica para filtrar as ilusões do mundo real. 

Considerando um potencial efeito motivador para uma dieta mais adequada e outros benefícios advindos do exercício (funcionalidade, bem estar, qualidade de vida), pessoalmente sou um incentivador da atividade física quando converso com meus pacientes. Porém há uma diferença entre incentivar e indicar a atividade física como parte de uma conduta preventiva ou terapêutica. Há diferença entre incentivar e impor um falsa verdade para nosso cliente. Esta distinção deve fazer parte de nosso processo de decisão compartilhada. 

Devemos também reconhecer que há conflitos de interesse por trás de tudo isso. Indústria produtora de produtos esportivos, equipamentos, novas formas de exercício, academias têm grande interesse em exagerar estes benefícios, sugerindo o sedentarismo como um fator de risco cardiovascular.  Sedentarismo é associado a risco em uma visão univariada, pois o sedentário tem outras características que causam aumento de risco. A validação final de que sedentarismo seria um fator de risco, estaria no critérios de reversibilidade, o mais importante dos Critérios de Causalidade de Hill. E este critério não confirma a ideia. Pois uma variável é fator de risco quando o controle dela reduz o risco do paciente. E estes trabalhos demonstraram que o controle do sedentarismo não reduz o risco. Este é um interessante paradigma a ser discutido.

Observem que o magro que faz exercício quase invariavelmente é disciplinado na dieta. Exercício e dieta vêm junto no pacote de disciplina no indivíduo. 

Desta forma, devemos abandonar a fantasia e considerar que o efeito do exercício na perda de peso é um mito que cria uma expectativa prejudicial. 

O Mito do Exercício na Perda de Peso pode ser comparado ao Mito do Amor Românticoprevalente nos dias de hoje. Este mito cria uma expectativa que prejudica o relacionamento de casais, pois pressupõe que as partes devam se complementar plenamente, correspondendo com perfeição aos anseios mútuos, como Romeu e Julieta. Esta expectativa leva a frustração e insatisfação de uma pessoa para com a outra. 

Evitando o Mito do Amor Romântico seremos mais tolerantes e aprenderemos a admirar eventuais diferenças de nossos companheiros. Evitando o Mito do Exercício na Perda de Peso, teremos mais foco na medida que de fato impacta no peso, a dieta. 

Assim como no amor, o pensamento de vanguarda deve abandonar a visão romântica quanto aos benefícios do exercício, evitando uma distorção da realidade que acaba por inibir o aprimoramento de medidas realmente efetivas. Isto não impede de incentivarmos a prática do exercício, sob o paradigma da qualidade de vida. Devemos ser ao mesmo tempo entusiastas da verdade científica e entusiastas da qualidade de vida promovida pelo movimento saudável de nosso corpo. 

IMPROVE-IT: Estudo Positivo ou Negativo ?

$
0
0


Após anos de ansiosa espera, neste mês de junho foram publicados no New England Journal of Medicine os resultados do estudo IMPROVE-IT. Este é o primeiro trabalho adequado para testar o impacto clínico de associar ezetimibe à terapia com estatina. Até então, sabíamos que a associação de ezetimibe potencializava o efeito antilipidêmico das estatinas (LDL-colesterol, um desfecho substituto). No entanto. sabemos que um resultado em desfecho substituto não garante impacto clínico da terapia. Daí a importância deste trabalho testar desfechos clínicos. 

Em 2008, a publicação do estudo ENHANCE trouxe dúvidas quanto à eficácia do esquema envolvendo o ezetimibe. Naquele ensaio clínico randomizado em pacientes com hipercolesterolemia familiar, o esquema que adicionava ezetimibe a sinvastatina 80 mg promoveu maior redução de LDL-colesterol do que sinvastatina 80 mg, porém isto não foi acompanhado de maior redução da aterosclerose medida pela espessura médio-intimal de carótidas (desfecho substituto). Naquele momento, ficou patente a precipitação da indústria farmacêutica em promover a utilização de uma droga antes da demonstração de seu efeito em desfechos clínicos. 

No mesmo ano, o New England Journal of Medicine publicou um artigo que mostrava como o marketing direcionado para médicos e leigos impactou em grande aumento das vendas do ezetimibe no mercado americano, a despeito da ausência de evidências clínicas, diferente do ocorrido no Canadá. O marketing era prioritariamente voltado para a substituição de esquemas tradicionais com estatina pela combinação de ezetimibe e estatina em baixa dose. Porém, na ausência de estudos suficientemente grandes para avaliar impacto em desfechos clínicos, permanecia a dúvida se a substituição de alta dose de estatina por baixa dose (associado a ezetimibe) poderia promover a perda dos teóricos efeitos pleiotrópicos das estatinas. 

Esta contextualização explica porque os resultados do IMPROVE-IT terem sido tão esperados. Estes resultados foram inicialmente apresentados no congresso do American Heart Association em novembro do ano passado. Fugindo ao habitual, o estudo não foi publicado no mesmo dia da apresentação, como ocorre com os grandes ensaios clínicos. Houve especulações de que fortes discordâncias entre editores e autores atrasaram a publicação, enquanto os autores negavam que o estudo não havia sido submetido a revista alguma, devido a “falta de tempo”. 

Diante deste pano de fundo, analisaremos os diversos significados do ensaio clínico IMPROVE-IT, o qual em nossa opinião traz implicações tanto positivas quanto negativas para o ezetimibe.

Mais do que isso, os resultados no IMPROVE-IT nos motivam a aprofundar a discussão a respeito do valor da redução relativa do risco, da redução absoluta do risco e do NNT.  


IMPROVE-IT Positivo


O estudo demonstrou que a associação de ezetimibe 10 mg e sinvastatina 40 mg reduz a incidência de desfechos clínicos quando comparado ao uso de sinvastatina 40 mg em pacientes que sofreram recente síndrome coronariana aguda e cujo LDL-colesterol é baixo (< 125 mg/dl). 

Podemos afirmar que esta observação possui alto nível de confiabilidade: seu baixo risco de viés fica caracterizado por ser um grande ensaio clínico, com 18.000 pacientes randomizados (homogeneidade dos grupos garante ausência de efeitos de confusão), duplo-cego (prevenindo viés de desempenho ou viés de aferição por tendenciosidade de observação), análise por intenção de tratar, baixa perda de seguimento. Quanto ao risco de erro aleatório (acaso), este é um estudo grande, com adequado poder estatístico, conclusão baseada em desfecho primário e na análise de toda a amostra (não foi desfecho secundário, nem subgrupo) e não houve interrupção precoce por benefício (truncamento). 

Concluímos portanto que este é um estudo positivo quanto à demonstração da presença de eficácia  do incremento anti-lipidêmico pela introdução de ezetimibe à terapia com estatina. É a primeira demonstração de proteção clínica com ezetimibe. 


IMPROVE-IT Negativo (a magnitude do efeito)


Ao mesmo tempo em que o IMPROVE-IT mostra a existência de eficácia, este estudo mostra que esta eficácia é mínima, quase irrelevante. Na verdade, este é um estudo positivo em relação à presença do efeito, mas negativo em relação ao tamanho do efeito.

Esta minha colocação pode gerar estranheza, visto que o NNT do IMPROVE-IT é 50, algo que ainda se considera moderada relevância. Por exemplo, este é o NNT que nos fez associar Clopidogrel ao AAS em pacientes com síndromes coronarianas agudas, de acordo com o estudo CURE. Então porque estou dizendo que o IMPROVE-IT é um estudo negativo em relação ao tamanho do efeito? Esta minha afirmação é baseada na redução relativa do risco de apenas 6%. 

É neste momento que nossa discussão ganha um aspecto didático adicional ao que temos dito a respeito do NNT. 

A (correta) noção que se tem passado no ensino da medicina baseada em evidências é de que a redução relativa do risco sozinha pode gerar uma ideia hiperinsuflada do benefício de um tratamento, o que nos obriga a calcular a redução absoluta do risco (RAR) e o NNT (100/RAR) para ter uma melhor noção da magnitude do efeito. De fato, é comum propagandas utilizarem reduções relativas do risco ao invés de reduções absolutas, pois normalmente os tratamento benéficos tem reduções relativas em torno de 20% a 40% e reduções absolutas em torno de 2 a 4%. Isto faz com que usualmente seja mais sedutor falar em redução relativa. 

Não é só porque a redução absoluta é um número menor que esta se torna mais confiável. É também porque esta se aproxima mais do real impacto. Por exemplo, dizer que ganhei 50% de uma herança (relativo) não tem muito significado se eu não souber quanto é a herança (absoluto). Essa apologia ao absoluto é uma revisão do que já sabemos. 

Agora vem o conhecimento novo, exemplificado pelo estudo IMPROVE-IT: quando a redução relativa do risco é muito pequena, a redução absoluta do risco e o NNT de um estudo positivo podem hiperinsuflar o benefício do tratamento. Os papéis se invertem!! 

Por quê? 

A redução relativa do risco representa o efeito intrínseco do tratamento, o que tende a ser constante, independente do risco basal do paciente. Já a redução absoluta varia de acordo com o risco basal do paciente, não é uma propriedade intrínseca. Quanto maior o risco basal, maior a redução absoluta, para uma mesma redução relativa. Quando o efeito intrínseco do tratamento é mínimo, como no IMPROVE-IT, podemos insuflar o resultado para algo relevante ao aplicar o tratamento em uma amostra de grande incidência do desfecho. 

Foi isto que ocorreu no IMPROVE-IT. O estudo compara um tratamento bom (estatina) com um mero aprimoramento deste tratamento (associação de ezetimibe) e ainda em pacientes com colesterol baixo (< 125 mg/dl). O efeito intrínseco do tratamento só poderia ser mínimo. Já sabendo disso, os autores escolheram pacientes com síndromes coronarianas agudas (maior risco) e definiram o desfecho como o combinado de 5 componentes, em lugar dos 3 componentes tradicionais (morte, infarto e AVC).  Desta forma,  a incidência do desfecho foi de 34%, fazendo com que uma mínima redução relativa de 6% resultasse em uma razoável redução absoluta de 2%, gerando um NNT de 50. 

Normalmente falamos que redução absoluta do risco (RAR) e NNT são medidas mais representativas de relevância, pois este englobam tanto o relativo quanto o absoluto (redução relativa do risco x risco absoluto = RAR). Mas quando uma redução relativa muito pequena é acompanhada de um razoável NNT, devemos ter cuidado. Duas são as possibilidades:

1. O NNT está artificialmente insuflado pela amostra do estudo ser formada de um subgrupo de  pacientes com maior risco; ou por um desfecho combinado de vários componentes, alguns menos relevantes. 

Ambos fenômenos ocorreram com o IMPROVE-IT: foi escolhida uma população de grande incidência de desfecho (síndromes coronarianas agudas) para validar clinicamente o ezetimibe; e o desfecho foi o combinado de morte, infarto, AVC (duros) + internamento por angina e necessidade de revascularização (moles). Dentre os 170 desfecho prevenidos, apenas 1 morte foi prevenida, sendo o restante divididos entre infarto ou revascularizações. 

Segunda possibilidade:

2. O NNT retrata corretamente uma boa magnitude de efeito, pois o risco habitual da doença é muito alto, fazendo com que uma pequena redução relativa tenha um impacto médio bom. É o que ocorre com uso de IECA na ICC, que promove apenas 16% de redução relativa (SOLVD), porém ICC é uma doença de alta mortalidade, garantindo um NNT alto. Aqui não há a seleção de um subgrupo específico de risco, toda a doença (ICC) tem alto risco.

Sendo assim, podemos seguir a seguinte regra:

Se a redução relativa do risco for razoável (> 20%), devemos aprofundar a análise para o cálculo do NNT. Esta nos dirá se o efeito intrínseco se reflete em uma diferença absoluta importante. 

Se a redução relativa do risco for pequena, concluímos que o impacto do tratamento é pequeno. Neste caso, este deve ser reservado apenas para situações de alta incidência do desfecho.

Sendo assim, esta postagem traz o valor de sabermos a propriedade intrínseca de um tratamento (redução relativa) e não apenas o NNT. Ambos devem ser levados em consideração. 

Vejam que o efeito do IECA na ICC na verdade é pequeno, mas como esta é uma doença de alta mortalidade, este efeito se torna relevante. Percebem a profundidade do pensamento?

IMPROVE-IT Negativo (imprecisão do resultado)


Outra aspecto do IMPROVE-IT é a imprecisão de suas estimativas. Falamos em uma redução relativa do risco de apenas 6%, mas para piorar este cenário está o intervalo de confiança desta estimativa, que vai de 1% a 11%. Ou seja, na verdade a redução relativa pode ser tão pequena quanto 1%. Considerando este pior cenário, o NNT seria de 288. 

Já falamos neste Blog que um estudo pequeno é muito impreciso em relação à magnitude do efeito. Neste caso, o estudo é grande (N = 18.000), mas se torna pequeno (impreciso) quando tenta retratar um efeito tão pequeno. 


O Uso Clínico do Ezetimibe


Este estudo demonstra que a prescrição de ezetimibe em pacientes que estão em uso de estatinas, com colesterol bastante razoável (LDL-médio = 90 mg/dl), promove um efeito benéfico de mínima magnitude. Um efeito deste tipo tornará a prescrição desta combinação uma exceção, reservada para inusitadas situações em que uma redução relativa do risco de 6% promova uma redução absoluta de magnitude satisfatória em desfechos duros. O mínimo efeito apresentado pelo estudo implica muito mais no não uso do tratamento para a maioria dos pacientes do que no uso do tratamento para uma minoria. Por este motivo, retratamos este como um estudo mais negativo do que positivo.

Como já discutimos, em torno de 40% das condutas propostas como baseadas em evidências são implicações indiretas de estudos. Vejo utilidade um pouco maior do IMPROVE-IT com uma evidência indireta do que como evidência direta proposta pelo trabalho. Refiro-me ao paciente que permanece com colesterol alto, a despeito de um tratamento máximo com estatina. Não foi exatamente isso que foi avaliado no trabalho, mas os resultados do IMPROVE-IT indiretamente indicam que a associação de ezetimibe pode promover redução de eventos nestes pacientes. Pois se promovem no paciente com colesterol normal, por que não promoveria no paciente com colesterol alto. Conforme gráfico da análise de meta-regressão trazido pela discussão do artigo (veja abaixo), quando maior a redução absoluta de colesterol, maior a redução relativa do risco.




Isso indica que se usarmos o conceito do IMPROVE-IT em uma população de colesterol maior, podemos obter um benefício maior. É um bom exemplo do uso de evidência indireta. Esta tende a ser uma aplicação mais útil, pois estaríamos corrigindo um colesterol ainda elevado, a despeito da estatina. É o caso em que a aplicação indireta de uma evidência parece fazer mais sentido do que a evidência direta. 

Além disso, no IMPROVE-IT o ezetimibe foi associado a um esquema de moderada potência de estatina (sinvastatina 40 mg). Não seria melhor trocar por estatina mais potente, em alta dose, como foi feito no estudo PROVE-IT? Não temos a resposta do que seria melhor. Já na situação em que um esquema mais potente de estatina já estaria sendo usado, temos apenas o ezetimibe para aprimorar o tratamento. Mais uma argumento a favor do uso indireto da evidência ao invés da aplicação como feito no IMPROVE-IT. 

Mesmo assim, esta indicação também parece ser de exceção, não garantindo uma grande relevância do IMPROVE-IT.

Pelos motivos discutidos neste texto, de uma forma (direta) ou de outra (indireta), este estudo tem aplicabilidade clínica limitada. 

O Verdadeiro Valor do IMPROVE-IT


Para mim, o maior valor do IMPROVE-IT está em sua mensagem científica, cristalizado em mais uma evidência a favor da hipótese do colesterol como fator de risco cardiovascular. Estatinas promovem redução de colesterol e reduzem risco cardiovascular, sendo um critério de reversibilidade a favor da hipótese do colesterol como fator aterosclerótico. No entanto, os críticos a esta hipótese argumentavam que a redução de risco com estatina poderiam decorrer de seus efeitos pleiotrópicos. O IMPROVE-IT é uma evidência de que a redução do colesterol com uma droga que não é estatina também reduz risco. Este é o verdadeiro valor deste estudo, o de trazer mais uma evidência de que o colesterol como fator de risco já venceu a inércia da hipótese nula.

O grande valor do IMPROVE-IT é em aprimorar nosso conhecimento: a respeito da hipótese do colesterol e da análise crítica do aclamado NNT, sob a luz de uma mínima redução relativa do risco.

Sem perder o trocadilho, o que o IMPROVE-IT melhora mesmo é nossa maturidade científica. 

Medicina Pseudocientífica

$
0
0

* Artigo publicado recentemente no Jornal A Tarde por Luis Correia

A imagem do médico atual se confunde com a de um cientista. Desejando corresponder a esta expectativa, o médico normalmente evita justificar suas condutas com base em crença ou fé, procurando trazer argumentos lógicos para suas decisões. O problema é quando nos deparamos com argumentos pseudocientíficos em prol de condutas fantasiosas. Acredito que a origem disto está na carência de entendimento quanto à essência do pensamento científico. 

Diferente do que acredita o senso comum, esta essência não está na presunção de entender o universo, mas sim na humildade de reconhecer a incerteza de nossas crenças. Esta humildade se apresenta na mente científica sob a forma do ceticismo. A palavra "cético"vem do Grego skeptikos, que significa “aquele que reflete, que indaga, vistoria”. Sendo assim, o cético não é o chato que não acredita em nada, mas sim aquele deseja se aproximar de uma verdade consistente. 

Diferente do cético, o crente já tem sua verdade e procura apenas encontrar justificativas que a respalde. O crente é presunçoso, dogmático, enquanto o cético tem a humildade de reconhecer sua ignorância, que poderá ser reduzida caso apareça evidências da existência do fenômeno em questão. Baseada no ceticismo, a ciência assume o papel de construir o quebra-cabeça de entendimento do universo a partir de peças que tenham a credibilidade de não concluir com base em pseudo-evidências. 

E o que são pseudo-evidências? Uma forma comum de tentar convencer alguém é apresentar uma explicação mecanicista. É como se a explicação do porquê garantisse algo ser verdade. Porém, a existência de uma razão não é prova do crime. Por exemplo, alguns propõem que vitaminas possuem ação anti-cancerígena porque têm efeito anti-oxidante. Mas não é porque oxidação predispõe a câncer, que vitamina reduz incidência de câncer. Na verdade, as evidências de melhor qualidade metodológica indicam a ausência desta ação protetora.

A segunda forma de pseudo-ciência é se deixar enganar pelas ilusões do mundo real, causadas por vieses ou efeito do acaso. 

Um dos tipos mais comuns de viés é o efeito de confusão. Está demonstrado que países europeus com maior população de cegonhas possuem maior taxa de natalidade. No entanto, a conecção cegonhas-natalidade é mediada por um terceiro fator, de confusão. Países com muitas cegonhas têm mais cidades rurais e nestas os casais se sentem mais a vontade para procriar. Não eram as cegonhas, eram os tipos de cidade.

Para filtrar estas ilusões, foi criado no início do século passado o método científico, um conjunto de procedimentos que minimizam as ilusões da observação do universo em seu estado natural. Quanto menos rígido for o método científico, mais susceptível o estudo fica às ilusões do mundo real. Assim, mesmo as condutas mais fantasiosas dispõem de estudos concluindo a seu favor. O que precisamos fazer é separar o joio do trigo, escolhendo evidência de qualidade para testar nossas hipóteses. 


Não que seja errado adotar condutas por fé, pois isso também faz parte da equação da vida. O inadequado é travestir estas decisões de científicas. O equívoco é denominar certas coisas de medicina.


Choosing Wisely: Entrevista com Aseem Malhotra

$
0
0
Compartilho com vocês nossa entrevista com Aseem Malhotra, a quem conheci na recente reunião do Choosing Wisely em Londres. Aseem é um dos responsáveis pela recente implantação da campanha Choosing Wisely no Reino Unido, autor principal do artigo publicado no British Medical Journal sobre o assunto. Assem é cardiologista intervencionista e uma voz ativa contra o overdiagnosis e overtreatment in cardiologia. Atua também consultor associado da Academy of Medical Royal Colleges e como correspondente da BBC de Londres sobre assuntos médicos. 

Nossa postagem sobre Choosing Wisely contextualiza o assunto tratado na entrevista.


* Agradeço à cientista da Universidade de Harvard, Luisa Santos Pereira, pelas legendas do vídeo.



Ensaio Filosófico sobre a Medicina Baseada em Evidências

$
0
0

Foi outro dia que pensei, a ciência nasceu com São Tomé e a medicina baseada em evidências nasceu com Maquiavel. 

Nesta imagem de Caravaggio, São Tomé enfia o dedo na ferida de Cristo, mostrando seu caráter investigativo e analítico. Tomé precisava analisar para depois tirar conclusões. Aí nasceu o paradigma científico do teste de hipótese e da observação do mundo real. Evoluímos e hoje enfiamos o dedo de forma controlada, evitando algum viés cognitivo que Tomé poderia estar carregando neste momento retratado pela pintura.

Maquiavel (1469 - 1527) defendia enfaticamente que o mais importante é o resultado (desfecho). Ela falava aquilo no contexto político, defendendo os atos “maquiavélicos”, pelo argumento de que os fins justificam os meios. Sem saber, ele dava origem ao paradigma da medicina baseada em evidências. Hoje falamos que o impacto no desfecho clínico é o que deve nortear as decisões médicas. Há meios lógicos de pensar, mas que podem nos surpreender por não corresponder ao resultado esperado. Há condutas plausíveis de serem benéficas, porém com impacto neutro ou negativo em desfechos clínicos. 

No outro extremo, temos Descartes (1596 - 1650) e primazia da razão, com suas colocações de que o pensamento lógico seria capaz de entender e prever perfeitamente os fenômenos universais. A verdade seria descoberta pelo pensamento, não pelo resultado. Descartes é a antítese do paradigma da medicina baseada em evidências. Mesmo assim, este dualismo tem grande valor. O valor científico de Descartes existe como gerador de hipóteses ou ideias. Uma exploração científica deve iniciar pelo lógico. Na sequência, devemos sempre procurar confirmação, pois o lógico erra com frequência. 

É lógico não acreditar na lógica. 

Já Spinoza (1632 - 1677) nos traz uma essencial reflexão, hoje comprovada cientificamente, porém ainda não reconhecida pelo pensamento médico em geral: nossa construção lógica é influenciada pelo emocional (ou pelo inconsciente). É a filosofia dos afetos. Somos serem emocionais, muito mais do que pensamos. Às vezes nossas decisões médicas estão totalmente enviesadas emocionalmente, porém conseguimos disfarçar, nos justificar logicamente, escondendo os viéses cognitivos. Por exemplo, enquanto um cidadão comum diz que “não traio minha mulher, pois isso é imoral”, Spinoza diria que na verdade o cara não trai pois morre de medo de ser flagrado e punido. 

Isso ocorre todo dia em medicina (não com traição conjugal, pois médicos não traem), mas com exemplos assim: “prescrevo exames e tratamentos inapropriados, pois o paciente que já entra no consultório pedindo". A realidade não é essa: o médico prescreve pois a mentalidade do médico ativo prevalece, ou seja, nos sentimos melhor fazendo (more is more) do que não fazendo. A sensação de causa-efeito é muito maior com o ato feito do que com o ato desfeito. Essa é a genialidade de Spinoza.

Somos atraídos por um imenso desejo de adotar condutas, independente do respaldo científico. É frequente a medicina baseada em evidências ser vista como uma forma de engessar o médico, impedir que este tome condutas livremente. Ainda bem que temos Kant (1724 - 1804) para nos lembrar que a “a verdadeira liberdade é escolher contra o que nós queremos”. Um obeso compulsivo, que quer comer uma caixa inteira de chocolate em uma sentada, tem liberdade de escolha? Precisamos entender que disciplina é a melhor forma de liberdade

Medicina baseada em evidências nos dá liberdade de não sermos manipulados por formadores de opinião enviesados ou ignorantes. O Princípio da Prova do Conceitoé a maior forma de liberdade: norteado pelo conhecimento científico, devemos tomar decisões individuais, nunca adotar a prática caricatural de copiar artigos para nosso paciente. No entanto, vemos médicos fazendo o que querem toda hora, sem saber que estão enjaulados por vieses cognitivos e conflitos de interesse.

Outro dia um amigo me fez uma inteligente pergunta (provocativa): qual a evidência de que medicina baseada em evidências é o melhor caminho? Respondi direitinho, citando evidências de que este é o melhor caminho. Mas a melhor resposta me veio depois e é filosófica: se exigimos evidência para acreditar em evidência, é porque já acreditamos em evidência. Esta é a verdadeira contribuição de Descartes para a medicina baseada em evidências. Ou alguém discorda de “penso, logo existo”. Isso é plausibilidade extrema. 

A demonstração científica é ferramenta essencial da medicina baseada em evidências, porém o preparo da mente para este paradigma deve ser filosófico, não necessariamente científico. Ou seja, o filosófico deve estar por trás do científico. 

No início dos tempos, os homens explicavam o universo por meio da mitologia (se chover é porque o Deus da chuva quis). O milagre grego nos trouxe os filósofos que passaram a entender o universo a partir do pensamento lógico e da observação. Daí surgiu a ciência, que não passa de uma filosofia com um método mais organizado para impedir erros sistemáticos e aleatórios. 

Filosofar é pensar. A espécie humana se distingue das demais principalmente pela linguagem. Mas não somos pensadores natos. Nossos ancestrais não tinham muito tempo para pensar. Na evolução (Darwin), nosso ancestral pensador morria comido pelo Leão, enquanto o intuitivo (pensamento rápido e ágil) sobrevivia. Assim criamos uma espécie baseada no pensamento rápido, definido por Kahneman como uma forma útil de pensar, porém repleta de vieses cognitivos. 

Não somos uma espécie pensadora e por isso nos distanciamos do paradigma filosófico da medicina baseada em evidências

Precisamos mais de filosofia. 

Nos achamos pensadores, inteligentes, porém cometemos erros básicos de pensamento, muitos abordados ao longo das postagens deste Blog. 

Precisamos mais de filosofia. 

A forma tradicional (dos livros) de teorizar sobre medicina baseada em evidências aprofunda o conhecimento da metodologia científica e da interpretação de artigos científicos (critical appraisal). Embora essa seja minha principal matéria de estudo e ensino, percebi que que sozinho isto não faz evoluir o pensamento médico suficientemente. Falta alguma coisa, o filosófico.

Precisamos nos alicerçar no estudo do pensamento médico. Isto justifica a criação neste Blog dos princípios da medicina baseada em evidências e de postagens na linha cognitiva. 

Medicina é uma profissão caracterizada pela tomada de decisões, dilemas, dúvidas, desfechos influenciados por uma gama de variáveis (multivariados), imprevisibilidade. Não basta ler artigos científicos. Precisamos saber aplicar o conhecimento científico na complexidade da tomada de decisão médica. Isso é diferente de copiar a mensagem do trabalho em seu paciente. Isto requer estudo e treinamento. A gente não nasce sabendo. 

Precisamos usar a ciência filosoficamente. 

* Para receber avisos de lançamento de novas postagens, vídeos e cursos, cadastre seu email no link medicinabasedaemevidências.com

Choosing Wisely: Entrevista com Daniel Wolfson

$
0
0
Nesta semana compartilho a segunda entrevista de nossa série Choosing Wisely. É a conversa que tive com Daniel Wolfson, durante nossa reunião em Londres. Daniel foi um protagonista na idealização e implementação do Choosing Wisely nos Estados Unidos. Aqui ele conta como surgiu a ideia e qual o sentido maior da campanha. 

Daniel Wolfson é vice-presidente da American Board of Internal Medicine.

O Cientista e o Pesquisador

$
0
0


Outro dia um colega pensador, Antônio Marcos Andrade, me provocou: "qual a diferença entre pesquisador e cientista?"

Pergunta pertinente, pois todo cientista é pesquisador, mas nem todo pesquisador é cientista. 

Pesquisador persegue a certeza. Cientista é deslumbrado com a incerteza.

Pesquisador tenta explicar o mundo. Cientista tenta entender o mundo. 

Pesquisador tende ao dogmatismo. Cientista tende ao ceticismo.

Pesquisador pensa de forma determinística. Cientista pensa de forma probabilística. 

Pesquisador é presunçoso. Cientista é humilde em reconhecer a incerteza de suas crenças. 

Pesquisador persegue resultados positivos. Cientista persegue a verdade.

Pesquisador é cartesiano. Cientista é apaixonado pelo acaso. 

Pesquisador pensa em valor de P. Cientista pensa em intervalo de confiança. 

Pesquisador é hierárquico e formal. Cientista é horizontal e informal.

Pesquisador usa gravata. Cientista quase nunca. 

Pesquisador se frustra quando suas expectativas são contrariadas. Cientista se deslumbra com o inusitado. 

Pesquisador produz artigos. Cientista produz conhecimento.

Pesquisador usa “comparar" ou “correlacionar” na descrição do objetivo da pesquisa. Cientista usa “testar a hipótese”. 

Pesquisador se baseia na lógica como evidência. Cientista, filósofo que é, parte da contra-lógica para depois chegar à lógica. 

Pesquisador se preocupa com o numero de citações. Cientista se preocupa com quem citou seus trabalhos. 

Pesquisador persegue premiações para seus trabalhos. Cientista é premiado pelo processo de crescimento que acompanha sua atividade de pesquisa. 

Pesquisador vive na era industrial. Cientista vive na era do conhecimento.

Pesquisador procura eficiência. Cientista procura excelência.

Pesquisador coordena um laboratório de experimentação. Cientista lidera um grupo de pensadores ávidos pela verdade. 

Pesquisador se preocupa com a meta. Cientista se preocupa com o trajeto.

Pesquisador pensa linearmente. Cientista reconhece que o mundo é regido pelo caos.

Pesquisador confunde fenômenos com explicações. Cientista reconhece fenômenos e amplia sua consciência a procura de explicações multifatoriais. 

Pesquisador persegue a prova de sua crença. Cientista preserva a hipótese nula, até que se prove o contrário.

Pesquisador pensa no impacto da revista. Cientista pensa no impacto de sua ideia.

Pesquisador aprende por repetição. Cientista aprende por emoção. 

Pesquisador é gestor de projetos. Cientista é um líder de pessoas.

Pesquisador é na caixa. Cientista é fora da caixa. 

O sonho do pesquisador é ser reconhecido como o melhor. O sonho do cientista é ser superado por seus discípulos. 

Pesquisador canta Maria Betânia em Gabriela, “Eu nasci assim, eu cresci assim, eu sou mesmo assim, vou ser sempre assim”. Cientista canta Lulu Santos, “Nada do que foi será.”

E a maior distinção de todas: o pesquisador procura as respostas certas, enquanto o cientista procura perguntas certas.

Quantos pesquisadores e cientistas você conhece?

[Cadaste-se gratuitamente em nosso mini curso 100% Online:"Os princípios da medicina baseada em evidências" no: www.medicinabaseadaemevidencias.com

PARADIGM-HF: a Falácia do Entresto (LCZ696)

$
0
0
Em julho deste ano foi liberada pela Food and Drug Administration (FDA), a comercialização da nova droga da Novartis para tratamento de insuficiência cardíaca, o LCZ696, comercialmente denominado de Entresto. Este tratamento foi avaliado pelo FDA em regime prioritário (fast track designation), o que permitiu uma liberação mais rápida que o habitual. No Brasil a droga está em fase de avaliação pela ANVISA, de forma semelhante ao que ocorre nos países da União Européia e Canadá.  

Esta perspectiva nos motivou a revisitar a análise que fizemos no ano passado, à época da publicação do estudo PARADIGM-HF, o qual demonstrou que o LCZ696 é mais eficaz do que o enalapril no tratamento de pacientes com insuficiência cardíaca sistólica.

O entusiasmo por este novo tratamento se deve ao fato deste ser o primeiro em 20 anos a demonstrar incremento de eficácia ao tratamento tradicional da insuficiência cardíaca, desde o advento do uso de inibidores da ECA e beta-bloqueadores. Quando nos deparamos com níveis elevados de entusiasmo, devemos avaliar cuidadosamente o quanto este sentimento é  proporcional ao nível de evidência.

Em análise sistematizada, podemos julgar que o estudo PARADIGM-HF possui baixo risco de vieses e de erros aleatórios na afirmação de que LCZ696 é superior ao enalapril 20 mg/dia. Quanto ao tamanho do efeito, o benefício da “nova droga” é representado por um NNT de 21 na prevenção do combinado de morte e internamento, efeito quantitativa e  qualitativamente relevante.

Mas será que o PARADIGM-HF de fato representa uma mudança de paradigma no tratamento da insuficiência cardíaca?

O Conceito Testado

Embora LCZ696 pareça ser o nome de uma molécula recém inventada, não se trata exatamente disto. Na verdade, LCZ696 é uma mistura da tradicional valsartana 320 mg com sacubritil. Sacubritil é a nova droga, a qual atua inibindo a ação do neprilysin. O neprilysin degrada boas moléculas, como peptídeo natriurético e bradicinina. Desta forma, ao inibir o  neprilysin, o sacubritil aumenta a concentração destas boas moléculas, que têm ação vasodilatadora e natriurética. Portanto, o ônus da prova está no benefício clínico do sacubritil. Surpreendentemente, este não foi o conceito testado no estudo PARADIGM-HF.

Quando surge um novo tratamento candidato a incrementar a conduta padrão, esta nova terapia deve ser comparada a um grupo controle (sem a terapia), sendo queo grupo intervenção e controle devem fazer o mesmo tratamento padrão. Ou seja, o correto écomparar nova intervenção e tratamento padrão versus tratamento padrão. 

O que fez o PARADIGM-HF? Estranhamente, o tratamento padrão do grupo sacubritil foi melhor do que o tratamento padrão do grupo controle. Enquanto no grupo sacubritil os pacientes desfrutaram de um bloqueio do sistema reina-angiotensina-aldosterona em dose máxima (valsartan 320 mg/dia), no grupo controle os pacientes utilizaram metade da dose máxima de enalapril (20 mg/dia, de forma fixa). 

Duas seriam as possibilidades corretas de testar a eficácia do sacubritil. A primeira, mais comumente utilizada, seria randomizar pacientes para sacubritil versus placebo, enquanto  o tratamento padrão seria semelhante nos dois grupos, pelo efeito da randomização. Desta forma, o tratamento padrão recebido pelos pacientes não representaria um efeito de confusão. 

Mas caso os autores fizessem questão de que o sacubritil fosse associado à valsartana, droga também da Novartis, haveria uma outra alternativa: randomizar os pacientes para sacubritil e valsartana versus placebo e valsartana na mesma dose. Assim, ambos os grupos receberiam o mesmo tratamento, diferenciado-os apenas pelo sacubritil. 

Da forma como foi feito, nunca saberemos qual o conceito testado. A maior eficácia do LCZ696 se deve ao advento do sacubritil ou ao maior bloqueio do sistema renina-angiotensina-aldosterona? 

Fica o questionamento do porquê um laboratório optar por um desenho de estudo que não avalia a eficácia de sua nova droga. 

Portanto, não podemos afirmar que o sacubritil representa a evolução tão esperada no tratamento da insuficiência cardíaca. 

Há um segundo problema com o PARADIGM-HF, que se refere à demonstração da tolerabilidade e segurança do esquema LCZ696. Este estudo tem uma peculiaridade incomum em ensaios clínicos de fase III: há uma fase de run-in. Antes de randomizados, os pacientes foram submetidos ao LCZ696 e apenas entraram no estudo aqueles que toleraram o tratamento. Portanto, o estudo diz respeito apenas a pacientes selecionados para tolerarem a droga, o que reduz sua validade externa quanto à desfecho de segurança. Se algum de nós decidir trocar o velho inibidor da ECA pelo LCZ696, devemos saber que há uma probabilidade maior de intolerância em nosso paciente do que a apresentada pelo estudo.

Desta forma, a presente análise nos sugere que, ao invés de analisar a questão sob a forma de fast track, as agências reguladoras deveriam, sem pressa, questionar a indústria do porquê da escolha de um desenho que não avalia eficácia da nova molécula, aproveitando-se de um bloqueio menos efetivo do SRAA no grupo controle. A comunidade médica deve acompanhar atentamente se estes questionamentos serão levantados. 

E quando o Entresto entrar no mercado como uma inovação no tratamento da insuficiência cardíaca, caberá ao médicos reagirem com maturidade científica na decisão a respeito do uso deste tratamento em seus pacientes. Devemos preservar nossos clientes de uma postura pseudo-científica. 

Cadaste-se gratuitamente em nosso mini curso 100% Online:"Os princípios da medicina baseada em evidências" no: www.medicinabaseadaemevidencias.com

Choosing Wisely: Entrevista com Wendy Levison

$
0
0
Colegas, vejam a terceira entrevista de nossa séria Choosing Wisely, feita em nosso encontro em Londres. 
Dra. Wendy Levison foi a principal idealizadora da Campanha Choosing Wisely nos Estados Unidos, lançada quando ela era Presidente do American Board of Internal MedicineAtualmente Wendy é coordenadora do Choosing Wisely Canadense e Internacional.

Observem o insight sobre o que é profissionalismo médico.




Cadaste-se gratuitamente em nosso mini curso 100% Online:"Os princípios da medicina baseada em evidências" no: www.medicinabaseadaemevidencias.com

BENEFIT Trial: Estudo Pragmático ou Prova de Conceito ?

$
0
0


O ensaio clínico BENEFIT foi apresentado no início deste mês, em Londres, durante o Congresso Europeu de Cardiologia, com publicação simultânea no New England Journal of Medicine. 

Este é o primeiro estudo de grande escala sobre esta afecção típica de nossa realidade e descrita originalmente por um brasileiro, que deu nome à doença. Como não poderia deixar de ser, o BENEFIT foi também idealizado por brasileiros (Anis Rassi, Anis Rassi Jr, Marin Neto). Por tudo isso, este estudo representou uma espécie de orgulho nacional. 

Este trabalho randomizou 2.854 pacientes com miocardiopatia chagásica para o uso de benzonidazol ou placebo, tendo como objetivo a avaliação da eficácia clínica deste tratamento. Para nossa frustração, seu resultado foi negativo. 

A análise metodológica evidencia um estudo sem risco significativo de viés e com poder estatístico adequado para demonstrar um benefício de magnitude relevante, respaldando a conclusão de que o esquema testado de benzonidazol não traz benefício clínico em pacientes com miocardiopatia chagásica. Esta seria a conclusão correta do trabalho.

No entanto, na publicação, os autores estruturaram sentenças de uma forma que pode levar ao entendimento da ausência de causalidade entre a presença do parasita e agravamento clínico. Isto nos pareceu inadequado

Esta aparente inadequação nos trouxe a oportunidade de discutir a diferença entre ensaios clínicos que testam hipóteses pragmáticas versus ensaios clínicos de prova de conceito causal. Esta é um importante distinção para a análise das implicações de um ensaio clínico e aproveitaremos o BENEFIT para realizar esta discussão didática.

Hipótese Pragmática versus Causal


Ensaios clínicos pragmáticos são aqueles cuja implicação se limita àeficácia de um determinada conduta. 

Ensaios clínicos de prova de conceito, além de avaliar eficácia, testam causalidade entre exposição e desfecho. Nestes trabalhos, utiliza-se o princípio da reversibilidade para testar causalidade: se o controle da exposição reduz o risco, a exposição tem uma relação causal com o desfecho. De acordo com os Critérios de Hill, reversibilidade é a principal evidência a favor da causalidade. 

Como exemplo de estudo pragmático, temos o ensaio clínico LOOK-AHEAD, discutido extensamente neste Blog. Neste trabalho ficou evidenciado ausência de benefício clínico de uma estratégia dietética para perda de peso em diabéticos. Portanto, a magnitude da perda de peso obtida com estratégias dietéticas (em média 4 Kg, incluindo estudos que usam drogas anorexígenas) não reduz eventos cardiovasculares. Porém não podemos extrapolar este achado para um prova de conceito mecanicista, dizendo que este estudo implica na ausência de relação causal entre obesidade e risco cardiovascular. O conceito da obesidade como fator de risco ficaria testado apenas com tratamentos que eliminassem ou reduzissem substancialmente a obesidade. Se o estudo fosse com cirurgia bariátrica, haveria redução de risco? Não sabemos, mas precisamos de um estudo assim para testar o conceito de causalidade. O LOOK-AHEAD tem um sentido científico apenas pragmático: a perda de peso usualmente obtida com dieta não reduz risco.

Como exemplo de estudo de prova de conceito, podemos citar trabalhos que avaliam a eficácia clínica de terapias que elevam HDL-colesterol, todos estes negativos quanto à redução de eventos cardiovasculares. Neste caso, éconsistente e significativa a magnitude do aumento do HDL-colesterol. Todos os pacientes respondem ao tratamento de forma significativa. A despeito disso, não há benefício clínico. Portanto estes dados representam uma forte sugestão de que HDL-colesterol baixo não é um fator de risco cardiovascular, é apenas uma marcador de risco. Esta é uma inferência de causalidade.

BENEFIT (Pragmático ou Causal)


Vejam agora a conclusão do BENEFIT: “Trypanocidal therapy with benznidazole in patients with established Chagas’ cardiomyopathy significantly reduced serum parasite detection but did not significantly reduce cardiac clinical deterioration through 5 years of follow-up.”

Vejam que os autores fazem uma ligação entre uma possível eliminação do parasita e a ausência de benefício clínico. A ligação entre um desfecho intermediário e um desfecho final é uma inferência causal. 

E continuam insistindo no link durante a discussão: “Benzonidazole did not significantly reduce the rate of the primary clinical outcome, despite reductions in the parasite detection in serum samples.”

E vão adiante, comentando que a taxa de negativação da detecção do parasita no sangue não guardou relação com benefício clínico: “Rates of conversion to negative PCR results varied significantly according to geographic location, but the difference in rates of conversion did not correspond to a difference in the rates of clinical outcomes.”Nesta caso, eles fizeram uma análise estatística avaliando se havia diferença de benefício do tratamento entre regiões onde a negativação do parasita foi maior ou menor. Essa análise tem um forte intuito de avaliar causalidade. 

O grande problema é que, no que tange à hipótese testada, o BENEFIT está muito mais próximo do LOOK-AHEAD do que dos estudos de HDL-colesterol, pois a droga foi na verdade pouco consistente para negativação do parasita. 

A Negativação do Parasita (PCR)


No grupo droga, apenas 66% dos pacientes apresentaram negativação da detecção do parasita, avaliado pela técnica de polymerasechain reaction (PCR). E para confundir mais ainda, 34% do grupo placebo apresentou negativação. Ou seja, encontrar o parasita no sangue depende também da aleatoriedade do momento em que o sangue écolhido. Sendo assim, o efeito verdadeiro do Benzonidazol éo observado subtraído do aleatório (este representado pelo grupo controle). O efeito verdadeiro de negativação decorrente do Benzonidazol ocorre em apenas 32% dos pacientes (66% - 34%). Isso ésuficiente para testar um conceito de causalidade?

Desta forma, são inadequadas as frases “significantly reduced serum parasite detection”ou “despite reductions in the parasite detection”.

Para piorar a análise de causalidade, apenas 60% dos pacientes do estudo tinham parasita detectado no sangue antes do início do tratamento. Como vamos fazer um link causal com a correção de um fator que não está presente em 40% dos pacientes?

Mais confuso ainda é o fato de que muitos pacientes que não tinham o parasita detectado antes do tratamento positivaram sua detecção ao longo do seguimento. Dentre pacientes inicialmente negativos no grupo Benzonidazol, 30% ficaram positivos!! 

Na verdade, PCR no soro tem muita variabilidade intra-paciente, decorrente do momento da dosagem. A medida é do parasita no sangue, ou seja, se o parasita estiver passando por aquela veia na hora da coleta será detectado, do contrário não será detectado. 

Por fim, dos 2854 pacientes no estudo, apenas 1487 pacientes tiveram a avaliação de PCR antes e depois do tratamento.

Isso tudo sugere que a metodologia do trabalho não é suficiente para avaliar negativação do parasita, muito menos para enfatizar esta observação na frase mais importante da conclusão, ao lado do achado referente a desfechos clínicos. Este não é um estudo que permite inferências causais. 

A postura científica correta e cautelosa seria limitar as conclusões à ausência de benefício do presente esquema anti-parasitário. Apenas ligar o tratamento ao desfecho clínico. A questão continua aberta para outras formas de tratamento que possam ser mais eficazes na eliminação do parasite e, eventualmente, outras formas ou estágios da cardiopatia crônica.

Poder Estatístico (Pragmático versus Causal)


Um conceito importante, porém pouco conhecido é que cálculo do tamanho amostral deve levar em consideração se o estudo é pragmático ou causal. 

Em um estudo de hipótese pragmática, deve-se dimensionar o tamanho amostral para oferecer poder adequado na detecção de diferenças clinicamente relevantes. Neste contexto, 26% de redução relativa do risco que o estudo se propôs a detectar éuma magnitude adequada. 

Por outro lado, um estudo que se propõe a expandir a inferência para causalidade deve ter poder de detectar efeitos menores da terapia, pois em um sistema biológico nem sempre um mecanismo causal se traduz em grande impacto clínico. 

Um bom exemplo é o que se discute sobre análise de correlação entre variáveis biológicas, no intuito de inferir causalidade. Por exemplo, para avaliar se obesidade predispõe a hipertensão arterial, poderíamos analisar correlação entre índice de massa corpórea e pressão arterial. Neste caso, não devemos esperar encontrar fortes correlações (r > 0.8), pois não é apenas obesidade que determina a pressão arterial, em um sistema complexo de causalidade. Assim, se o intuito for avaliação etiológica, devemos estar preparados para detectar correlações fracas, porém de sentido biológico

Desde seu desenho, os autores deveriam ter refletido sobre o poder estatístico se quisessem fazer inferências causais. 

A Grande Lição


Parece-me injustificável do ponto de vista científico tanta ênfase na análise de negativação do parasita, conectada com ausência de benefício clínico. Por que sempre que os autores disseram que o tratamento não funciona, também fizeram um link com a (pseudo) eficácia do tratamento na negativação do parasita?

A história do BENEFIT é um grande ensinamento quanto ao jogo das hipóteses pragmáticas versus causais.

Nos bastidores de Londres, conversei longamente com dois autores do BENEFIT, Marin-Neto e Anis Rassi Jr, os quais foram os verdadeiros idealizadores deste estudo e se associaram ao grupo da McMaster para viabilizar um ensaio clínico desta magnitude. Fiz várias provocações e senti nas entrelinhas o grande desconforto de ambos com as inferências causais presentes do texto. Em um estudo escrito a tantas mãos, eles foram votos vencidos na conotação do texto. 

Aí está a diferença de cientistas e pesquisadores. Os primeiros se preocupam prioritariamente com a verdade científica, enquanto os segundos com o impacto de suas publicações. Expandir as conclusões para um aspecto de causalidade dá mais impacto ao trabalho, porém menor veracidade. Pesquisadores tendem a superestimar os achados de seus trabalhos, cientistas tendem a reconhecer as lacunas que permanecem em aberto. Cientistas se fascinam mais com perguntas do que respostas. 

Anis e Marin-Neto são exemplos de grandes cientistas. Estavam mais preocupados com a mensagem que ficou do que com a publicação no New England Journal of Medicine. 

_________________________________________________________________________________

Comentário registrado por Anis Rassi Jr. horas após a postagem de nosso texto:

Luis, grato pelas palavras e parabéns mais uma vez pela sua análise precisa do estudo BENEFIT. Infelizmente, os neófitos da McMaster preferiram supervalorizar os resultados do PCR (a inclusão deste limitado desfecho substituto foi a única sugestão original do Dr Salim Yusuf e de seu grupo) ao invés de focar os resultados clínicos do estudo (por nós delineado). Recentemente Marin e eu postamos alguns de nossos comentários no endereço https://www.researchgate.net/profile/Anis_Rassi2/publications, onde deixamos também bem claro que análise de subgrupos adequada evidencia benefício do Benzonidazol na redução de desfechos clínicos no Brasil (onde predomina o T cruzi II), quando comparado aos demais países. Devemos escrever artigo de atualização sobre tratamento etiológico da doença de Chagas em breve salientando todos estes aspectos.

Como calcular o tamanho amostral ?

$
0
0

Se tivesse que apontar a dificuldade que mais aflige um jovem pesquisador durante um desenho de estudo, lembraria o cálculo do tamanho amostral. É engraçado perceber que durante apresentações de projetos, este é o slide de mais rápida projeção, tornando impossível a compreensão do público quanto às premissas que estavam na mente do pesquisador durante a determinação do tamanho de sua amostra. Na verdade, muitas das vezes, a rapidez do slide demonstra que o pesquisador não quer falar no assunto, limitando-se a passar a impressão de que fez algum cálculo. Frequentemente, peço para voltar o slide e deixar a projeção em silêncio por um minuto. Neste casos, é comum perceber que por trás daquele cálculo existe muita confusão mental. 

Não vejo motivo para tamanha dificuldade, a qual acredito que ocorre mais por falta do ensino simplificado, do que pela complexidade do assunto. Desta forma, esta postagem tem o intuito de clarear nossas ideias a respeito do processo mental do cálculo amostral, apontando os caminhos que nosso pensamento deve percorrer e quais premissas devem ser utilizadas neste processo. 

Para começar, precisamos discutir o porquê da necessidade do dimensionamento da amostra. 

Por que calcular?


Se nossos estudos fossem populacionais, não precisaríamos nos preocupar com número de indivíduos, pois a observação seria de todo o universo de pessoas. Assim ocorre no dia de uma eleição, quando a coleta de dados diz respeito a toda a população adulta, teoricamente. Não existe amostra, nem valor de P, nem intervalo de confiança. Estamos observando a população.

Porém a vasta maioria dos estudos são amostrais, ou seja, avaliam uma pequena parte do universo e extrapolam estes achados para a população. Neste momento, surge o conceito estatístico de imprecisão.É inerente de amostras serem imprecisas, simplesmente pelo fato de que não são a população. Daí vem a simples e óbvia ideia do cálculo amostral: quanto maior a amostra, menos imprecisa, mais próxima do universo. 

Amostras pequenas são mais imprecisas, pois são mais vulneráveis ao acaso. Em amostras pequenas, observações inusitadas e falsas aparecem com mais frequência. O grande problema é que o inusitado chama mais a atenção e, paradoxalmente, este inusitado prevalece sobre a confiabilidade da notícia. Por vezes vemos estudos muito pequenos (hipotermia, beta-bloqueador no pré-operatório) demonstrando grandes efeitos terapêuticos. Estes estudos são aqueles publicados em grandes jornais médicos e que depois são refutados por grandes amostras de estudos subsequentes.

É um erro cognitivo comum valorizarmos a evidência com base em sua importância, sem antes pensar em sua veracidade. 

A imprecisão das amostras é estatisticamente caracterizada pela seguinte simulação mental: se eu repetisse o estudo em várias amostras diferentes, qual seria a variabilidade do resultado? Quando menor forem estas amostras, maior será a variabilidade. Várias amostras pequenas discordam muito mais do que várias amostras grandes. Simplesmente porque o resultado de amostras pequenas sofre muito mais o efeito do aleatório.

Assim as meta-análises avaliam se há viés de publicação. Se estudos pequenos tiverem resultados consistentes (por exemplo, se todos os estudos pequenos apontarem para resultados positivos), há viés de publicação (estudos negativos não estão sendo publicados). Isto porque se espera todos os tipos de resultados, positivos e negativos. Estudos pequenos registram muito mais o acaso do que a verdade. 

Sendo assim, não queremos que nosso estudo seja pequeno. 

Mas o que é pequeno? Para responder a esta pergunta, calculamos o tamanho amostral necessário para que nosso estudo tenha uma precisão razoável em relação ao seu objetivo primordial. Pequeno é um tamanho que não oferece uma precisão razoável. E cada estudo, cada situação, tem sua própria definição de pequeno, que virá do cálculo amostral.

Quanto maior o estudo, mas a observação estará próxima do universo. Quanto menor, mais longe do universo. O ideal portanto, seria a maior amostra possível. Porém a maior amostra possível é o universo, inexequível. Sendo assim, precisamos equilibrar a precisão do estudo com a factibilidade da amostra. Devemos escolher um tamanho amostral que tenha os dois Ps: Possível e ao mesmo tempo razoavelmente Preciso. 


A Ambição de Pesquisador


O gatilho mental inicial para o sintonizar o pensamento no cálculo amostral é se fazer a seguinte pergunta: o objetivo principal do estudo é descritivo ou analítico?

No caso do objetivo descritivo, precisamos de uma amostra que forneça precisão na descrição da variável de interesse. 

No caso do objetivo analítico (aquele que este testa associação entre variáveis), precisamos de uma amostra que forneça poder estatístico para detecção de uma dada associação, se esta existir. 

São dois Ps também:

Descritivo → Precisão
Analítico → Poder

Vamos abordar inicialmente a situação descritiva. Quando descrevemos qualquer parâmetro, devemos reconhecer humildemente a imprecisão de nossa estimativa. Este reconhecimento é definido pelo intervalo de confiança. Calcular o intervalo de confiança é um exercício de humildade.

Se um pesquisador nos disser que a prevalência de uma dada doença é 20% de acordo com sua amostra, devemos sempre lançar a pergunta: o quanto você garante este valor de 20%. A resposta estará no intervalo de confiança. Por exemplo, prevalência de 20%, com intervalo de confiança entre 10% e 30%. Isto quer dizer que a amostra não nos assegura o resultado preciso de 20%, a segurança maior está na afirmação de que o resultado está entre 10% e 30%. É o reconhecimento da incerteza.  

Antes do início do estudo, o pesquisador deve refletir a respeito do nível de incerteza que a questão científica tolera. O nível de incerteza é a amplitude do intervalo de confiança. O exemplo acima representa um intervalo com amplitude de 20% (± 10%), que implica em um determinado tamanho amostral, digamos 70 pacientes. Mas se julgamos esta imprecisão seria intolerável, podemos planejar um maior tamanho amostral. Por exemplo, para uma amplitude de intervalo de confiança de 10%, precisaremos 265 pacientes. 

Desta forma, no estudo descritivo, a amplitude desejada do intervalo de confiança é um dos fatores que determina o tamanho amostral necessário. Percebem que este parâmetro é dependente do pesquisador, que pode moldar sua imprecisão tolerável de acordo com um tamanho amostral factível. Muitas vezes o pesquisador exercita um equilíbrio entre o preciso e o factível.

Este precisão necessária não é definida estatisticamente. É definida pela mente do pesquisador que conhece o problema científico. 

Agora vamos pensar a respeito do objetivo analítico, que pretende testar associações. Em boa parte dos estudos, associação é representada por diferença entre grupos. Portanto, o pesquisador deve  planejar um tamanho amostral que forneça poder para detecção de uma diferença relevante. 

Pequenas coisas necessitam de uma grande lente de aumento para serem percebidas. Associações fracas ou pequenas diferenças entre grupos necessitam de grandes estudos para serem detectadas. Se desejarmos encontrar qualquer associação, precisaríamos de um tamanho amostral infinito, ou na verdade, precisaríamos estudar toda a população. Felizmente, não nos interessa encontrar pequenas associações, pois estas não são relevantes. Desta forma, o pesquisador deve pensar qual o tamanho da diferença que não podemos deixar de detectar. Qual a diferença relevante o suficiente para ter que ser detectada? 

Mais uma vez, este é um parâmetro que depende do pesquisador, ou seja, procura-se um equilíbrio entre uma amostra factível e o tamanho do efeito que fazemos questão de detectar. 

Por exemplo, considerando que a mortalidade no grupo placebo seja 10%, para encontrar uma redução relativa de 20% na mortalidade com uso da droga, precisamos de 6.426 pacientes. Estes pacientes nos darão poder estatístico para detectar a diferença de 10% versus 8% entre os dois grupos (20% de redução). Mas posso julgar que, em se tratando do desfecho morte, não posso deixar passar diferenças menores do que essa. Sendo assim, se a intenção for identificar uma redução relativa de risco de 10%, seriam necessários 26.990 pacientes no total. 

Se nada disso for factível, como faremos? Podemos reduzir nossa ambição para detectar uma redução relativa de 40%, ou seja, de 10% para 6%. Assim, precisaremos de 1.442 pacientes no total. Neste caso, se o estudo for negativo, a ausência de efeito se aplica a reduções de 40% ou mais, não rejeitando a possibilidade de menores reduções. 

Fica claro que o tamanho amostral de um estudo analítico depende do equilíbrio entre a capacidade em detectar associações e o factível. Mais uma vez, é a escolha do pesquisador, em relação ao grau de associação que se faz questão de detectar. 

Vale aqui salientar que “ser capaz de detectar” significa ter um poder de pelo menos 80% em detectar certo grau de associação. Ou seja, se uma dada associação for verdadeira, o estudo teria 80% de probabilidade em detectar. Sim, pois se aceita até 20% de possibilidade do erro tipo II, que seria não detectar uma associação verdadeira. Portanto, um estudo deve ser dimensionado para ter pelo menos 80% de poder na detecção de um certo grau de associação que julgamos ser relevante.

O Comportamento das Variáveis


Além do planejamento do pesquisador, descrito acima, o segundo fator que influencia no tamanho amostral é o comportamento das variáveis no universo.

Desfechos de alta frequência precisam de amostras pequenas para serem precisamente descritos, enquanto desfechos raros necessitam de grandes amostras. Imaginem que eu queira descrever a incidência de um desfecho raro, digamos 0.5%. Em uma amostra de 100 pacientes, poderia não detectar ninguém com viria ter esse desfecho. Já para um desfecho de 30% de incidência, uma amostra de 100 pacientes pode detectar vários casos. 

E se a variável for numérica? Neste caso, o que deve ser considerado é o desvio-padrão que se espera desta variável, pois quanto maior sua variabilidade, mais difícil obter uma descrição precisa. Um parâmetro muito variável, que mudam muito de indivíduo para indivíduo, mudará muito de amostra para amostra, ou seja, terá menor precisão.

O mesmo ocorrerá com objetivos analíticos, ou seja, quanto mais frequente for o desfecho ou quanto menor for o desvio-padrão de uma variável numérica, mais fácil será de detectar uma associação. 

Desta forma, no processo do cálculo amostral, o pesquisador deve ser questionar como a variável se comporta no universo: a frequência de desfechos categóricos ou o desvio-padrão de desfechos numéricos. Pode-se usar sua própria experiência pessoal, estudos pilotos ou estudos da literatura. Claro que pode haver erros nestas premissas. Mas premissas são premissas. Assim, depois do estudo realizado, devemos avaliar se o observado foi muito diferente das premissas. 

Calculando na Prática

Este é um guia básico de como calcular seu tamanho amostral, utilizando uma das melhores calculadoras online, da Universidade da Califórnia em San Francisco.

Estudo Descritivo e Variável Dicotômica

Qual a amplitude do intervalo de confiança desejado (precisão)?
Qual a frequência esperada deste desfecho?

Observem no link que estes número podem ser digitados e a resposta do tamanho amostral virá. Por exemplo, se digitarmos 10% de amplitude (width: W = 0.1) e 20% de frequência (expected proportion: P = 0.2), precisaremos de 265 pacientes. 

Estudo Descritivo e Variável Numérica

Qual a amplitude do intervalo de confiança desejado (precisão)?
Qual o desvio-padrão da variável de interesse?

Por exemplo, se formos descrever o valor do colesterol, para ter 20 mg/dl de amplitude do intervalo de confiança, sabendo que o desvio-padrão do colesterol é 32 mg/dl (olhei isso em algum artigo de estatina na população geral), precisaremos de quantos pacientes?

Se neste link digitarmos 20 (unidades da variável numérica) de amplitude (W = 20) e um desvio-padrão de 32 (S = 32), precisaremos de 39 pacientes. 

Observem que quando trabalhamos com variáveis numéricas, se o desvio-padrão não for muito alto, precisamos de menores tamanhos de amostra do que ocorre habitualmente com variáveis categóricas.


Estudo Analítico e Variável Dicotômica

Qual a diferença relativa que desejamos detectar entre os grupos?
Qual a frequência esperada no grupo controle?

Se queremos encontrar uma redução relativa de 20% no grupo droga, considerando que o esperado no grupo controle é 10%, devemos digitar 10% versus 8%. 

Neste link, digitamos Po = 0.10 e P1 = 0.08. Mantenham os outros parâmetros no default (alfa = 0.05, beta = 0.20). Alfa é o valor de P que consideramos estatisticamente significante (sempre será 0.05) e beta é o erro tipo II aceitável, que não deve passar de 20% (você pode até colocar um número menor, mas o tamanho amostral ficará maior).

Vejam que isto dará 6.426 pacientes (metade em cada grupo) para oferecer um poder de 80% na detecção desta diferença.  

Estudo Analítico e Variável Numérica

Qual a diferença que desejamos detectar entre os grupos?
Qual o desvio-padrão esperado em cada grupo?

Imaginem que desejo encontrar uma diferença de creatinina entre dois grupos, algo que julgue relevante. Penso que 0.5 mg/dl é relevante. E eu tenho uma amostra piloto em que o desvio-padrão da creatinina é 1 mg/dl.

Digitem no link. Para encontrar uma diferença de 0.5 unidades entre os grupos (effect size: E = 0.5), sob a premissa de desvio-padrão de 1 (S = 1), necessitaremos de 126 pacientes. 

Observem que nestes exemplos analíticos, estou apenas comparando variáveis entre dois grupos. Há outros tipos de análise, que compara variáveis entre mais de 2 grupos ou que testam correlação entre variáveis numéricas, que poderão ser abordados em outra oportunidade. 


Em Conclusão


Percebam nem precisamos falar em fórmulas estatísticas, pois o cálculo amostral depende muito mais do pensamento científico do que de uma habilidade estatística complexa. 

Depende do entendimento do pesquisador quanto ao objetivo de sua pesquisa, da distinção entre o descritivo ou analítico, da nossa "ambição" de precisão ou poder, e finalmente da estimativa de como a variável se comporta no universo. 

O cálculo amostral é o maior exemplo de interação entre duas personalidades: a do pesquisador ("ambição") e a de sua variável de interesse (comportamento no universo).

Curso Medicina Baseada em Evidências 100% Online

$
0
0
Hoje abrimos as inscrições de nosso Segundo Curso de Medicina Baseada em Evidências 100% Online.
Clique aqui para se inscrever.

Inscrições ficarão abertas até a próxima sexta-feira (23/10)



Fosfoetanolamina para Tratamento de Câncer: a culpa foi do juiz?

$
0
0

Em setembro deste ano, o mais novo ministro do Supremo, Edson Fachin, decidiu pela liberação do uso da fosfoetanolamina para tratamento de câncer. Qualquer câncer. 

Isto gerou uma reação contrária por parte da comunidade médica, que se viu surpresa com a liberação de um “tratamento” sem a devida comprovação científica de eficácia. Dráuzio Varella afirmou no Fantástico que "esta conduta não se faz nem em veterinária", se referindo ao uso de tratamentos antes de testes clínicos adequados no animal em questão.

Para mim, a verdadeira surpresa foi a indignação da comunidade médica. 

Fico a me perguntar em que mundo vivem os que se viram surpresos com a decisão do juiz. Digo isso pois o mundo real é repleto de condutas indicadas por profissionais de saúde, a despeito da falta de embasamento científico. Agimos frequentemente de forma não profissional, quando utilizamos argumentos pseudocientíficos para justificar nossas condutas. 

Alguns são os contextos em que condutas são adotadas sem base científica sólida: há aquelas avaliadas por estudos iniciais, com resultados favoráveis, porém não definitivos; há condutas não testadas, porém adotadas como eficazes devido a argumentos mecanicistas, tipo plausibilidade biológica; e no outro extremo, há terapias correntes cujos trabalhos de boa qualidade mostram que não são eficazes.

Há algumas situações de plausibilidade extrema em que não necessitamos de comprovação científica. São aquelas óbvias. É o caso de administrar glicose em um indivíduo com hipoglicemia sintomática; ou o caso de utilizar um device denominado paraquedas quando precisamos pular de um avião em pleno vôo. 

Excluindo situações extremas, os potenciais prejuízos da precipitação em adotar condutas sem base científica são provavelmente maiores do que potenciais benefícios. Até mesmo porque (como já comentado neste blog) a magnitude do benefício de condutas eficazes tende a ser quantitativamente modesta. Os potenciais prejuízos são de diversas ordens: efeitos adversos, sofrimento desnecessário, custo desnecessário, enraizamento de paradigmas incorretos, aculturação científica. Portanto, os médicos estão corretos em criticar a decisão do novo juiz. 

Por outro lado, soa estranho criticar a liminar do juiz do Supremo (que não possui o conhecimento técnico), quando os críticos (que possuem conhecimento técnico) cometem frequentemente o mesmo erro quando a decisão está em suas mãos. 

Apenas como exemplo, vivemos em um país cujo Conselho Federal de Medicina e a Associação Médica Brasileira reconhecem a homeopatia como especialidade médica. Paradoxalmente, as evidências científicas de qualidade são consistentes em demonstrar que o efeito da homeopatia não supera a eficácia do placebo. Esta informação está presente em revisões sistemáticasde boa qualidade. Devemos sempre lembrar que há evidências para todo tipo de resultado. Neste contexto, separando o joio do trigo, os trabalhos com baixo risco de viés são consistentes em negar a eficácia da homeopatia.

É sempre bom lembrar que ciência nada mais é do que uma forma de observar a natureza, prevenindo-se contra dois tipo de erros de observação: viés e acaso. A forma de prevenção é o método científico. Portanto, tudo que está na natureza é melhor observado sob a lente do método científico. Ciência não artificial, pelo contrário, ciência nos aproxima do natural.

Talvez homeopatia mereça um reconhecimento como um tipo de intervenção baseada em fé. Ter crenças é coisa comum da raça humana e às vezes faz bem. Porém isso não é a mesma coisa que medicina, isso é diferente de especialidade médica. Eticamente, ao receber tal prescrição, um cliente deveria ser informado de que os trabalhos de qualidade indicam que o efeito decorrente da homeopatia é equivalente ao placebo. 

Diferente de nosso país, o parlamento inglês baniu homeopatia do sistema público de saúde, proibindo também que qualquer verba pública fosse utilizada para financiar pesquisa com homeopatia. O parlamento inglês fez sua própria revisão sistemática, publicada em seu site. E concluiu que já está comprovado: homeopatia não funciona além do efeito placebo. E isso não é surpresa, pois não há nenhuma molécula ativa na solução administrada, visto que esta foi diluída milhões de vezes.

A Organização Mundial de Saúde, após provocada, publicou um documento em 2009, afirmando que homeopatia não é eficaz para HIV, tuberculose, malária, diarréia e gripe.  

Mas o problema não acontece apenas com tratamentos alternativos. Mais comum ainda são violações que utilizam condutas mais tradicionais, mais plausíveis, porém sem comprovação definitiva. Na década de 90, nós cardiologistas propomos o uso da terapia de reposição hormonal como forma de reduzir o risco de infarto. Haviam trabalhos científicos sugerindo este efeito, porém ainda não eram trabalhos com metodologia científica adequada. Anos depois, no início da década de 2000, o grande ensaio clínico randomizado WHI negou este efeito protetor. E pior, mostrou pequeno aumento do risco de infarto com o tratamento. Constrangimento desnecessário, poderíamos ter esperado as evidências.

Veja o caso da Sibutramina para redução de peso. Depois de anos de uso da droga, ensaio clínico desenhado para testar a eficácia desta intervenção na redução de eventos cardiovasculares demonstrou ausência de benefício. Havíamos utilizado uma droga que tem reconhecidos efeitos adversos (não proibitivos, se houvesse um benefício concreto), sem um grande motivo. Nem para perder peso a droga faz tanta diferença, pois em média a perda de peso foi apenas 2.4 Kg maior do que no grupo placebo (dieta). No entanto, ficam aí alguns endocrinologistas esperneando contra a ANVISA que restringiu (dificultou) a prescrição da droga. Na verdade, nem precisaria restringir se os médicos não tivessem a mania de supervalorizar benefícios tênues e computassem o verdadeiro tipo e magnitude do benefício ao raciocinar clinicamente. 

O mesmo Fantástico que critica (com razão) a liberação da fosfoetanolamina, faz uma campanha de várias semanas, reforçando a estratégia de rastreamento do câncer de mama com mamografia, como se esta fosse uma panacéia. Rastreamento significa utilização em toda população de uma certa faixa etária. Paradoxalmente, a tendência das evidências científicas de qualidade vai no sentido contrário desta conduta. O mais recente estudo , um ensaio clínico em que 90.000 canadenses foram randomizadas para rastreamento anual com mamografia versus controle, demonstrou mortalidade idêntica nos dois grupos. Em 2013, a Cochrane publicou uma revisão sistemática de 7 ensaios clínicos. Os 3 ensaios clínicos de randomização adequada não mostraram redução de mortalidade por câncer de mama, ao passo que os 4 ensaios clínicos de randomização inadequada sugeriram o benefício. 

Mesmo que haja redução de mortalidade, as estatísticas tendem ao problema do overdiagnosis, quando a probabilidade de prejuízo advinda do diagnóstico é maior do que a probabilidade de benefício.  Se o benefício existisse, seria de no máximo 1 vida salva a cada 1.000 mulheres rastreadas por 10 anos. Em contrapartida, o rastreamento causaria 500 biópsias desnecessárias e, pasmem, 10 tratamentos (mastectomia, radioterapia, quimioterapia, com suas complicações e sequelas) desnecessários, em cânceres que nunca vingariam como tal. 

A campanha do Fantástico a favor da mamografia e o Outubro Rosa do mês passado são simplórios quando não trazem esta discussão como prioritária.

Causou surpresa o que acabo de escrever? Claro que sim, pois o senso comum vai no sentido do benefício do diagnóstico precoce. A questão é que o senso comum nem sempre coincide com a verdade científica. Como seria de se esperar, a abordagem do Fantástico sobre mamografia foi baseada em um raciocínio "fantástico" e fantasioso, embora seja senso comum.

Na mesma reportagem do Fantástico sobre o suposto anti-cancerígeno, um oncologista crítico à decisão afirmou: “já tive uns 20 pacientes que utilizaram esta droga e nenhum genuinamente se beneficiou.” Observem o teor anti-científico desta afirmação. Se estes pacientes não foram avaliados mediante um protocolo científico, ele não poderia tirar a conclusão da ausência de benefício. E se esses 20 pacientes tivessem tido uma sobrevida média superior a um hipotético grupo controle? Não estou dizendo que a droga é benéfica. Mas, sem um adequado ensaio clínico, é anti-científico afirmar qualquer coisa (positiva ou negativa) a respeito desta droga. 

Sabemos que não é incomum médicos prescreverem tratamentos questionáveis do ponto de vista de eficácia, efetividade ou eficiência, e orientarem pacientes a conseguir liminares de juízes, para que convênios ou o SUS cubra os custos. 

Há explicações cognitivas para nossa postura não científica, muitas das quais costumamos discutir neste Blog. Nossa mente é naturalmente crente, sendo necessário um certo esforço para assumir uma postura cientificamente cética e fazer uma análise baseada em evidências. 

Evoluímos tomando decisões intuitivas (sistema límbico), pois a decisão rápida nos ajudava a fugir e sobreviver. Portanto temos dificuldade em sobrepor o pensamento intuitivo com o pensamento analítico (cortical). E para piorar as coisas, o pensamento intuitivo muitas vezes se disfarça de pensamento analítico, parece que estamos pensando direito. Requer atenção e treinamento pensar corretamente. 

Portanto é justificável que um juiz se equivoque em sua decisão, muito mais do que um profissional da área médica. Claro que o juiz poderia ter utilizado de consultores técnicos. Mas o trabalho de um juiz também se baseia no que é convencional na sociedade, na cultura vigente. 

Além de criticar a decisão deste juiz, devemos reconhecer nossa responsabilidade como parte deste processo. A sociedade vive o paradigma da medicina baseada em fantasia em parte porque nós, profissionais de saúde, usamos deste paradigma quando adotamos tratamentos não comprovados ou realizamos exames de forma exagerada e inapropriada. 

Portanto, retorno à pergunta inicial: por que tamanha indignação da classe médica com a decisão do juiz? Esta foi uma decisão inusitada? Claro que não, foi a decisão natural. 

Em minha percepção, a indignação vem do fato de que a decisão foi tomada por um juiz, alguém de fora que está nos dizendo como deve ser. O incômodo não foi criado pelo pseudo-científico (esse não incomoda), mas pela perda de autonomia.

Profissionais de saúde devem assumir a responsabilidade de moldar o pensamento da sociedade na direção de uma medicina contemporânea e de vanguarda: embasada no paradigma científico, no benefício ao cliente, na racionalidade das decisões e, por fim, na decisão compartilhada com um cliente que é devidamente informado dos riscos, benefícios e incertezas de nossas recomendações. 

O Platonismo dos Conselhos

$
0
0


Nesta semana, um de meus sobrinhos se forma em medicina. Na mesma semana, um de meus alunos se forma em medicina. 

Pergunto-me que conselhos os mais “experientes” devem dar aos jovens que ingressam nessa “nobre profissão”. Pois, já tendo passado pelo futuro dos mais jovens, temos a tendência de dar conselhos em momentos como este.

Mas conselhos nada mais são do que uma forma de reciclar nossas experiências prévias, empacotando-as em regras platônicas. Na verdade, a prática de aconselhar é anti-científica, pois se presta a predizer desfechos com base em experiências e dados limitados. Conselhos não percebem as evidências silenciosas, aquelas esquecidas pelos nossos vieses de confirmação.

Na verdade, o único conselho certo é “duvide de conselhos”, pois estes contém a presunção de um conhecimento irreal. 

Conselhos desvalorizam a incerteza, fator mais excitante na vida de um jovem. Saber valorizar as incertezas é o maior dom do “jovem de futuro”. Verdadeiros descobridores e empreendedores contam menos com um planejamento estruturado, focam no máximo de experimentação e reconhecem oportunidades quando o acaso lhes apresenta.Tudo isso com uma forte visão de futuro.

Devemos valorizar as incertezas, perceber a poesia do imprevisível, pois são os fatos não previstos que modificam o mundo e constroem a história. 

Há 7 anos, usei um raciocínio pragmático em forma de conselho, questionando o sonho de meu sobrinho em fazer medicina. Ele deveria “concluir o curso de engenharia”. Foi um conselho que deve ter provocado uma reação contrária muito positiva da parte dele. Ele deve ter se motivado a provar que eu estava errado. Ainda bem … provou …

Ao invés de aceitar conselhos, vocês devem refletir a respeito de suas incertezas. E que estas reflexões venham em forma de incentivo à prática de olhar para dentro de si, identificando seus verdadeiros valores, adaptando sua visão a estes valores. 

Nestes momentos de formatura de medicina, costumamos ouvir que "medicina é uma nobre profissão.” Confesso que não vejo muito sentido nisso. Toda profissão é nobre e não há uma mais nobre do que outra. 

Na verdade, nobre é a pessoa e não a profissão.

Ser nobre é ser autêntico. Assumir seus valores e utilizá-los da forma mais adequada. 

Dizem que o médico deve ser humano. Também não consigo entender isso, somos todos humanos.

Se seu perfil não for aquele acolhedor, sem problema: escolha uma área na medicina que não necessite desta característica pessoal. Valorize seu perfil. Se por outro lado, tiver um perfil acolhedor, não se deixe corromper, seja sempre um médico de almas. 

Assim, não ouça o conselho de ser “humanizado"; seja apenas como você é, assuma seu perfil, identifique a função de acordo com sua "anatomia". Anatomia e função devem estar coerentes. 

Não se sintam nobres simplesmente por serem médicos. Construam sua nobreza pela sua coerência entre seus valores e a missão escolhida. 

E lá vou eu caindo no platonismo de aconselhar. Mas já que comecei, vou em frente. 

Sejam científicos. Que conselho óbvio, quanto mais vindo de um professor de medicina baseada em evidências. Só que aqui não me refiro ao óbvio, me refiro à verdadeira essência da ciência.

Ser científico é ser humilde. É evitar o dogmatismo.

Equivocadamente, o pensamento médico tradicional é baseado na procura da certeza. Os processos de decisão se sustentam na tentativa de controle dos desfechos. Ao contrário, o processo de decisão deveria ser focado na valorização das incertezas, no reconhecimento do imponderável, no uso de probabilidade. 

Em uma palestra recente, Leo Clement (também ex-aluno) descreveu uma ideia que, segundo ele, eu o teria ensinado. Na verdade, eu que aprendi com a clareza do pensamento de Leo: "ter razão não é o mesmo que estar correto.” 

Procuramos a decisão médica correta, porém esta não existe no paciente individual. Podemos indicar uma tratamento adequado, porém o desfecho promovido pela nossa conduta pode vir a ser indesejado. O mundo é muito mais aleatório do que nossas explicações de causa-efeito. Então, devemos procurar "ter razão" em nossas condutas, porém não cair na ilusão de que uma conduta racional será sempre a que promoverá o melhor desfecho. Não temos controle sobre o "estar correto". Devemos focar na razão (científica).

Marcos Cunha e Felipe Ferreira, meu sobrinho e meu aluno, me inspiraram a escrever este texto que ofereço a todos os outros alunos que se formaram nos anos anteriores e que faltei em dar-lhes o melhor conselho: não ouça conselhos, ouça seu coração. 

Boa sorte (acaso). 


Continuem me inspirando.

Zika e Microcefalia: Fato ou Ficção Científica?

$
0
0
Diferentemente do que o título expressa, este texto não é primariamente sobre Zika, nem sobre microcefalia. Falarei todo o tempo sobre isso, mas o verdadeiro assunto é outro, mais genérico. O tema desta postagem é sobre miopia científica ou arrogância epistêmica. Estes, sim, seriam títulos mais representativos da ideia.

O crescimento no Brasil da incidência de Zika e aparentemente de microcefalia constituem uma interessante história de geração de hipótese: Zika causa microcefalia. Se bem aproveitada, dará bons frutos científicos. Por outro lado, a forma como esta hipótese científica foi transformada em fato nas publicações da imprensa leiga, respaldadas por especialistas, ganhou ares de ficção científica. 

Ficção científica um termo pertinente e paradoxal. Paradoxal, pois o que é ciência não é ficção; pertinente pois este paradoxo é bastante prevalente.

Este representa um caso caricatural da violação do princípio científico da hipótese nula. São casos como estes que Nassim Taleb, cientista da incerteza na Universidade de Massachussets, denomina de arrogância epistêmica. Este é um fenômeno comum da mente humana que, por questões evolutivas, tende a subestimar a incerteza presente em hipóteses.

Isto fica mais evidente quando percebemos que, ao longo das últimas semanas, a força de convicção das afirmações a favor da relação causal entre Zika e microcefalia cresceu exponencialmente, a despeito da ausência de evidências reais. É o fenômeno da manada, quanto mais se fala mais a história ganha ares de fato, sem que haja qualquer associação entre o crescimento da convicção e o aumento do nível de evidência.

São inúmeras as reportagens impressas e televisivas. Não coloco jornalistas como meros criadores de fatos, pois estes acompanham afirmações de profissionais que tem (suposta) autoridade para falar no assunto.

Um médico no Fantástico recomendou às mulheres de 30 anos (que teoricamente possuem mais tempo) a não engravidar, enquanto as de 40 anos fazê-lo, desde que cuidadosamente. Em paralelo, a Revista Veja diz: “A relação entre Zika e microcefalia fetal está 100% comprovada”. E justifica sua afirmação: “O Ministério da Saúde confirmou o fato após detectar o vírus em um bebê com microcefalia que foi a óbito”.

Há também aqueles que reconhecem a necessidade de comprovação definitiva, porém falam com a conotação de fato. Dizem que “tudo indica”, ao passo em que recomendam “medidas de prevenção” (são medidas mesmo?). Estes aparentam preservar o princípio da hipótese nula, porém fazem o contrário. Utilizam deste princípio para gerar uma aparência cientifica de mais credibilidade, sem perceber que já rejeitaram a hipótese nula quando fazem o mundo se comportar como se a causalidade estivesse estabelecida.

Precisamos refletir quais os danos versus as vantagens da rejeição precipitada da hipótese nula. Por que será que, em geral, o pensamento científico considera que o erro tipo I (afirmar algo falso - toleramos 5% deste erro) é cientificamente mais grave do que o erro tipo II (não afirmar algo verdadeiro - toleramos um risco de 20% deste erro). Esta é uma válida reflexão para este momento.

Considerando que o adequado combate à Zika deve ocorrer independentemente da criação de fatos pseudo-científicos, precisamos refletir se esta miopia científica traz (individual e culturalmente) mais benefícios ou prejuízos. A miopia científica fica evidente quando observamos a grande lacuna entre o pensamento humano cotidiano e a forma científica de raciocinar.

De fato, alguns acham que ciência é uma coisa, vida prática é outra. Em artigo na Folha de São Paulo, após afirmar que “não tenho dúvida do elo entre Zika e Microcefalia”, o diretor da OPAS diz: “alguns cientistas acreditam que é preciso mais provas, mas como profissional de saúde não tenho dúvida”. Observem que a frase propõe uma lacuna entre ciência e vida prática. Isto mostra que alguns não entendem bem que ciência nada mais é do que a forma mais honesta de retratar a natureza. Digo honesta, pois o método científico não serve para criar conhecimento. Serve para descrever o mundo, prevenindo-se contra fenômenos cientificamente reconhecidos: vieses cognitivos, vieses de observação e efeito do acaso.

Nosso problema é que, na história da humanidade, só muito recentemente o pensar científico contribui para nossa sobrevivência individual. Mas quanto à sobrevivência da espécie, ainda não deu tempo do pensar contribuir suficientemente. A nossa seleção natural se deu não pela capacidade de pensar, mas pela capacidade de correr. Talvez os que pensaram morreram mais (pois corriam menos). Por este motivo, ser cético e questionador não é nosso estado natural, precisamos nos condicionar ao paradigma científico.

Karl Popper, o maior filósofo científico do século passado, propôs que a comprovação de uma hipótese deve passar pelo processo de tentar refutá-la. Devemos começar acreditando na nulidade e mudarmos de ideia quando a evidência a favor do fenômeno ultrapassar um limiar inferior de dúvida.

O caso Zika e microcefalia mostra que ainda não entendemos o que Popper propôs. Ainda não entendemos o papel da hipótese nula. Assim, a miopia científica prevalece, com seus diversos componentes a serem descritos abaixo. 

Miopia da Incerteza

Na miopia da incerteza, não percebemos o quanto incertas são coisas que “fazem sentido”. Somos apaixonadas por nossa lógica, sem perceber que esta serve para dar plausibilidade às hipóteses, não para gerar fatos (exceto na plausibilidade extrema).

Estamos repletos de exemplos em medicina de hipóteses que faziam todo sentido, porém funcionaram ao contrário. São estas mesmas hipóteses que geram reação emocional neste Blog, quando mostramos evidências contrárias a crenças lógicas, porém incertas. Achamos que podemos acreditar, desde que tenhamos alguma forma de explicar.

Faz sentido de que Zika seja a responsável pelo suposto aumento de microcefalia, por três motivos: certos vírus podem alterar a embriogênese do sistema nervoso no primeiro trimestre; Zika está em crescimento; microcefalia está em crescimento. Dadas estas premissas, as pessoas concluem que Zika  causa microcefalia, sem perceberem que fazer sentido não é o mesmo que ser um fato. Os especialistas que fazem afirmações certas ou quasi-certas deste pseudo-fato não percebem o grau de incerteza presente na hipótese.


Miopia de Hipóteses

Este é um viés cognitivo causado pela análise retrospectiva da história dos descobrimentos científicos. Explicarei.

Retrospectivamente, o mundo ganha um aspecto platônico, parecendo que tudo fazia muito sentido antes da comprovação. Mas, este mundo funciona de outra forma. Na verdade, para cada explicação comprovada com base em evidências, existiram inúmeras hipóteses, e nem sempre a que parecia mais lógica foi a que venceu. As hipóteses que perderam ganham o status de silenciosas, não nos lembraremos delas, ficando apenas a hipótese vencedora como parte da narração da história. Assim, parece que um descobrimento foi feito por uma hipótese gerada, testada e comprovada. Um mundo platônico, uni-hipotético.

Na verdade, para cada descoberta, há inúmeras hipóteses que perderam, dentre as quais usualmente está a mais provável das hipóteses. E normalmente, a hipótese favorita tem menor probabilidade de perder do que de ganhar. Ser a mais provável, não quer dizer ser muito provável.

Modelos estatísticos multifatoriais previam que a seleção brasileira era a favorita para ganhar a copa do mundo de 2014, porém a probabilidade calculada era menor que 50%. Embora fosse a favorita, era mais provável que perdesse. Simplesmente porque haviam muitas hipóteses (seleções) concorrendo.

Esta falta de entendimento faz com que as pessoas superestimem a probabilidade da Zika ser a explicação, a ponto de julgar isso como algo confirmado ou fortemente sugestivo.

Observem o vencedor de uma maratona olímpica. Diferente dos 100 metros rasos, este tipo de prova tem o resultado influenciado por um processo mais complexo. É quase imprevisível saber quem vai ganhar, na realidade todos tem quase a mesma probabilidade. Por outro lado, depois do término da corrida, o vencedor ganha o título de ser o melhor e passa a fazer muito sentido ele ter sido o vencedor. Encontramos sempre explicações, talento, treinamento, etc. Depois do resultado, nossa mente superestima a probabilidade prévia daquele resultado. A isso se chama falácia narrativa, quando qualquer evento importante ganha uma explicação óbvia depois de ocorrido.

Pessoalmente, se fosse para apostar, eu colocaria meu dinheiro na Zika. Mas não colocaria muito dinheiro, pois mesmo sendo a escolhida como mais provável, a probabilidade de Zika ganhar é pequena.

Ser a mais provável, não quer dizer ser muito provável.

Miopia Epidemiológica

Esta é caracterizada por confundirmos os conceitos básicos de coexistência e associação.

O termo “associação” (ou relação) é o mais utilizado nas notícias sobre zika e microcefalia. No entanto, tem sido utilizado de forma equivocada e rudimentar. Inúmeros especialistas e jornalistas mencionam associação, porém na verdade este exemplo é de coexistência. Até então não presenciei qualquer relato sobre associação, nem mesmo uma menção de curiosidade a respeito.

“Uma mãe cujo filho nasceu com microcefalia pode ter tido Zika no primeiro trimestre”. Ou: “identificaram o vírus em dois casos que nasceram com microcefalia”. Isso não é associação, pois falta o outro lado da história, a evidência silenciosa. O lado silencioso da história são os casos de normocefalia com história de Zika e os casos de microcefalia sem história de Zika.

Qual a proporção de Zika na gravidez de casos de microcefalia, comparada à proporção de Zika na gravidez de crianças que nasceram normais? Se não há dados ainda, deste que seria um estudo caso-controle, pelo menos olhemos a nossa volta e perceberemos que devem ser muitos os casos de normocefalia que tiveram Zika. Precisamos valorizar mais a dúvida.

É total miopia epidemiológica falar em associação. Mas mesmo se a associação fosse comprovada, esta seria apenas o primeiro passo na demonstração de causalidade. Há muitas associações verdadeiras, porém não causais. Observem a associação abaixo descrita, publicada no New England Journal of Medicine. Será que é causal?




Outros falam em associação temporal. É mais uma miopia epidemiológica, pois sabemos que associação temporal é uma grande falácia. Coisas podem crescer ou decrescer juntas, sem que haja qualquer relação causal. Ao longo do tempo uma criança fica maior em altura e ao mesmo tempo sua habilidade de leitura aumenta. Isso quer dizer que quanto mais alta uma pessoa, maior a habilidade com línguas?


O livro Spurious Correlation nos traz interessantes exemplos da falácia da associação temporal.





Portanto, não podemos falar em associação, quanto mais em causalidade. Ainda estamos muito longe do que poderia ser considerado algo provável. Ainda estamos muito longe do limite de rejeição da hipótese nula. Muito longe do que poderia ser considerado algo provável.

Miopia Estatística

Essa é a mais banal das miopias, a qual decorre da falta de percepção de que precisamos de um denominador para quantificar o risco dos desfechos. Este denominador não tem sido apresentado nos depoimentos dos médicos ou reportagens da imprensa.

Fala-se em um crescimento grande do número de registros de microcefalia, de 30 casos para 1.200 casos em 3 meses. Isto é bastante assustador e o número que passa dos milhares traz a conotação de um grande risco. As grávidas entram em pânico quando se fala em 1.200 casos. No entanto, risco é uma probabilidade, advinda do total de desfechos dividido pelo total de pessoas vulneráveis ao desfecho. Desta forma, dividindo-se 1.200 pelo número médio de nascidos-vivos em um período de 3 meses (em torno de 600.000), chegamos a um risco de 0.19% de uma criança nascer com microcefalia nestes últimos meses, dada todas as possíveis causas, não apenas Zika. Se considerarmos o  cenário otimista de que metade destes casos decorrem de Zika, diremos que 0.095% é o risco de microcefalia por Zika. Isto justifica pânico?

A miopia estatística (básica) faz com que médicos recomendem no Fantástico que mulheres deixem de engravidar. Estes se esquecem que o conjunto de outras possíveis infecções que causam sequelas em bebês ultrapassa em muito o risco de microcefalia por Zika, se este risco for verdadeiro. Segundo meus consultores obstétricos: citomegalovírus 2.6% de incidência de infecção, toxoplasmose 1.6%, sífilis 0.5%, herpes 0.2%, só para falar alguns. E 40-50% dos fetos afetados por estas infecções apresentam sequelas.

Por que só agora recomendamos não engravidar? Ou colocado de outra forma: o número (com denominador) justifica o pânico?

O que Kant diria?

Percepção = sentidos + inconsciente.

Segundo Kant, a interpretação que damos ao que vemos é involuntária e incontrolavelmente influenciada pelo inconsciente. Sua filosofia foi mais tarde confirmada por psicólogos cognitivos. Na postagem Ensaio sobre a Cegueira, discutimos como seria importante que a interpretação de métodos de imagem ou do exame físico fosse cega em relação à probabilidade pré-teste, ou seja, ao quadro clínico ou epidemiológico.

Ao se deparar com a atual epidemia de microcefalia, Kant se perguntaria se o aumento do número de casos poderia decorrer de um problema de percepção influenciado pelo cognitivo de pessoas já influenciadas pelo modismo.

Talvez esse raciocínio pareça demasiadamente cético quando sugerimos a não existência do problema. Por outro lado, este mesmo raciocínio se torna demasiadamente plausível quando pensamos na possibilidade de superestimativa do problema.

Não há dúvida que a mente dos diagnosticadores de microcefalia está enviesada involuntariamente pelo modismo, o que implica em uma noção de probabilidade pré-teste aumentada. Para agravar, encontramos o conforto cognitivo, que se apresenta quando se torna mais confortável laudar de acordo com o mundo externo do que de forma independente. Isto faz com que médicos prefiram ampliar sua sensibilidade, em detrimento da especificidade. Isto pode gerar uma banalização dos diagnósticos.

Como cardiologista, sei o quanto pode ser subjetivo laudar uma disfunção sistólica do ventrículo esquerdo ou calcular uma fração de ejeção, número mágico para quem não passa pelo processo de quantificação. Porém nada entendo de obstetrícia ou ultrassom obstétrico. Por isso, perguntei a especialistas de mente científica e a resposta foi semelhante ao que vivencio na ecocardiografia. Há subjetividade em muitos casos. Na dúvida, de que forma se comportam os diagnosticadores neste momento particular de modismo? E como se comportavam antes?

Pouco se falava do problema, portanto a sensibilidade dos médicos não estava voltada para isso. Hoje, a principal ideia que está na mente de um ultrassonografista (e da coitada da grávida) antes do exame é se há sinais de microcefalia.

No sistema público de saúde, provavelmente menos grávidas faziam ultrassom. Hoje vemos mutirões  de ultrassom. E os médicos que fazem os exames estão muito mais atentos. Isso tudo indica que é muito plausível acreditar que no passado havia subnotificação.

Desta forma, há plausível subnotificação do passado e supernotificação do presente. Quantitativamente, parte do problema é criada por isso. Pelo menos parte do problema.

Reflexões Finais

Até o momento, tivemos acesso a apenas relatos de coexistência Zika-microcefalia publicados pela imprensa leiga, que desconsideram o lado silencioso das evidências. Ainda não dispomos de publicações em revistas científicas, aquelas que seguem um rigor na descrição dos métodos e resultados da pesquisa, passando pelo crivo da revisão por pares.

Tais artigos surgirão em revistas científicas. Como todo estudo, estes deverão passar pelo crivo da análise do nível de evidências. Mas, devemos estar atentos para a particularidade maior desta questão cientifica: a hipótese nula foi precipitadamente rejeitada, abrindo guarda aos vieses de confirmação e publicação.

Nassim Taleb aborda bem o problema dos especialistas em seu livro A Lógica do Cisne Negro. Especialistas de atividades que lidam com incerteza sofrem do problema da auto-ilusão. É por este motivo que comentaristas políticos erram muito mais do que modelos estatísticos de previsão de eleições. A arrogância epistêmica obstrui a habilidade preditiva de especialistas e suas ideias se tornam pegajosas. Depois de criadas, fica pouco provável de mudar. É o fenômeno de perseverança da crença, quando as ideias são tratadas como propriedades pessoais, da qual não queremos nos desfazer. É quando muitos convictos pesquisadores tendem a procurar confirmação de suas ideias a todo custo, vibrando quanto encontram resultados positivos, mesmo que à custa de P-value hacking, problema das múltiplas comparações ou vies de publicação.

Entre a ausência de evidencias sobre uma questão (estado atual) e a resposta definitiva, normalmente existe uma lacuna repleta de estudos pequenos, de qualidade mediana, cuja divulgação é regida pelo viés de publicação de evidências positivas. Isto estenderá o obscurantismo científico, até que em algum momento saberemos a verdade.

No mundo em que a hipótese nula foi violada, é indispensável que os diagnósticos Zika e microcefalia sejam feitos de forma cega e independente. Resultados definitivos virão de estudos prospectivamente desenhados, com hipóteses e desfechos primários definidos a priori.

Enquanto isso, grávidas devem evitar se expor a qualquer tipo de doença infecciosa e outros agentes sabidamente teratogênicos como sempre fizeram. Devem também evitar um demasiado envolvimento com recomendações caricaturais contra Zika. E devem estar cientes de que não há razão probabilística (risco absoluto) para que o pânico roube a tranquilidade de suas gestações.

Se Zika é responsável pelo crescimento dos casos de microcefalia, por enquanto não sabemos.

Mas a pergunta primordial desta postagem é outra: sabemos distinguir entre fato e ficção?


* Texto escrito por Luis Correia e Denise Matias, com colaboração intelectual dos obstetras Allan Silva e Leomar Lyrio.

Papai Noel Baseado em Evidências

$
0
0

Papai Noel existe? Essa é uma pergunta comum nesta época do ano. Considerando que este Blog se propõe a discutir a veracidade dos fatos sob o paradigma científico, precisamos abordar esta importante questão, a qual impactará na vida de milhares de famílias nas próximas horas. 

Partimos inicialmente do Princípio da Hipótese Nula, o qual afirma que todo fenômeno é inexistente até que se prove o contrário (prova científica). Esta é a justificativa para eventualmente nos questionarmos sobre a existência de Papai Noel. Ou seja, duvidar faz parte do pensamento científico. Mas não podemos parar por aqui, temos que evoluir nosso pensamento. 

Devemos evoluir e nos perguntar se a presente questão se adequa ao Princípio da Plausibilidade Extrema. Este princípio se aplica a situações de exceção, onde o fenômeno é tão plausível, que dispensamos comprovação científica. Por exemplo, na prática clínica ter uma boa relação médico-paciente, saber ouvir e conversar com nosso cliente, representa uma habilidade que deve ser utilizada, mesmo sem um ensaio clínico randomizado demonstrando que a boa relação é benéfica. É extremamente plausível que um médico atencioso faz bem ao seu paciente e por isso aplicamos (ou devemos aplicar) essa abordagem mesmo na ausência de evidência científica.

A existência de Papai Noel é extremamente plausível. Isto porque esta existência só se materializa se formos capazes de acreditar. Se acreditarmos, Papai Noel existirá, se não acreditarmos, ele desaparecerá (ou não aparecerá). É um perfeito exemplo do Princípio da Plausibilidade Extrema, que deve ser aplicado apenas a situações especiais, onde dispensamos a necessidade de demonstração e ficamos como a verdade, simplesmente porque aquela verdade é indubitável. 

Há também plausibilidade extrema do benefício em se acreditar em Papai Noel. Óbvio que esta crença faz bem para a alma, portanto devemos nutri-la. E não faz bem apenas para crianças, para adultos também.  Nós todos devemos acreditar em Papai Noel.

É tão plausível que ao imaginarmos um ensaio clínico randomizado para provar esta questão, percebemos que o resultado deste seria previsível. Imaginem que vamos randomizar famílias, metade para acreditar em Papai Noel e metade para não acreditar. É óbvio que nas famílias que acreditarem, as árvores acordarão repletas de presentes, enquanto nas famílias randomizadas para não acreditar, as árvores estarão vazias, se é que nestas casas haveria árvores de natal. É tão óbvio que seria anti-ético fazer esse estudo. 

Poderíamos então fazer um estudo observacional. Observem como o Natal de famílias crentes em Papai Noel é mais mágico do que o Natal de famílias descrentes.

Percebam que todo esse pensamento é baseado em uma seqüência lógica que respeita dos princípios da medicina baseada em evidências. Mas para aqueles que ainda permanecem com o Princípio da Hipótese Nula a despeito de meus argumentos, vamos fazer um teste: amanhã, ao acordar, se houver presentes na árvore, estará provado que Papai Noel passou em sua casa.

Na verdade, todo mundo acredita em Papai Noel, mesmo aqueles que fingem não acreditar.

Feliz Natal a todos.

* Esta é a postagem mais embasada em evidência de todas já escritas neste Blog.

SCMR 2016 Gold Medal Award - João Lima

$
0
0

The Board of Trustees of the Society for Cardiovascular Magnetic Resonance (SCMR) is pleased to announce the 2016 Gold Medal Award recipients are Joao A.C. Lima, MD, MBA, Professor of Medicine, Radiology and Epidemiology at Johns Hopkins University. The award is presented annually by the SCMR for outstanding achievement in the field of CMR as well as exemplary service to the Society.

Dr. Lima is very well known to the field of CMR, as a leader over the past 25 years. He has a strong history of service to the SCMR, beginning with the very first organizational meeting hosted by Gerald Pohost, extending through his service on the SCMR Board of Trustees, and including his tireless attendance and presentations at most if not all of the SCMR’s scientific sessions. Dr. Lima has been a major contributor to the field. In particular among his research contributions over the past two and half decades, marked by nearly 160 peer-reviewed papers, those on myocardial function, late gadolinium enhancement, LV contractile function, and delayed enhancement imaging and his many contributions from the 10-year, 7,000-patient Multi-Ethnic Study of Atherosclerosis (MESA) study have been central to advances in our field. This landmark epidemiology study has published over 1,000 papers over the past 15 years. The CMR data has been the component of that study which has
produced the most publications of any single sub-unit within MESA. In addition, Dr. Lima has authored 39 high-level editorials and guidelines directly related to CMR. Perhaps most importantly, Dr. Lima has helped mentor and guide numerous others in the field.

“From lectures to daily discussions and supervising research projects in CMR he was not only the most visionary researcher that I have ever known, but the best mentor any fellow could ask for.” - Carlos Eduardo Rochitte, MD, PhD

João, 

obrigado por impactar tanto na vida de cada um de nós que um dia sonhamos ser cientistas em cardiologia, e demos a sorte de nos depararmos com você. Mais do que impulsionar um método (CMR), você impulsionou muitas vidas criativas. E este impulso não se resume ao aspecto científico. 

Grande legado.

Faço minhas as palavras de Rochitte. 

Grande abraço, 

Luis.

Estudo SPRINT e a Definição de Hipertensão: certezas e incertezas

$
0
0


Dentre os grandes ensaios clínicos publicados em 2015, sem dúvida o SPRINT foi dos mais impactantes. Para este Blog, um estudo de grande importância, pois reacende o debate que tive com o mestre Flávio Fuchs em novembro de 2013Aquele debate se fez espontaneamente, por troca de emails na madrugada de uma terça-feira comum, ganhando notoriedade quando publiquei sob a forma de postagem no Blog. Flávio conta essa história em seu livro de memórias acadêmicas, eternizando nossa troca de ideias.

Naquela época questionei de forma provocativa a falta de evidência para o tratamento da hipertensão leve, levando Flávio a responder com argumentos epidemiológicos a favor da ideia de que valores ideais de pressão arterial são menores que 120 mmHg. 

Dois anos se passaram e no final de 2015 foi publicado no New England Journal of Medicine o ensaio clínico SPRINT, o qual comparou um tratamento intensivo da pressão arterial (meta de pressão sistólica < 120 mmHg) versus tratamento padrão (meta < 140 mmHg). O tratamento intensivo, pela primeira vez, se mostrou superior ao usual. Seria uma das exceções ao princípio do less is more

Ora, se baixar a pressão para níveis abaixo de 120 mmHg traz benefício, Flávio está certo ao argumentar que pressão arterial normal é algo menor do que a definição tradicional. Esta conclusão é baseada no princípio da reversibilidade: quando tratamos um fator (pressão > 120 mmHg) e o desfecho reduz (eventos cardiovasculares), confirmamos que este é fator causal. Assim, Flávio fica recompensado com a comprovação da hipótese que defendeu por tantos anos.

Minha proposta aqui é aprofundar a análise do SPRINT, avaliando o grau de incerteza em relação a este parágrafo que acabo de escrever. Nesta discussão, aproveitaremos para revisar conceitos estatísticos e princípios do pensamento baseado em evidências.

Discutirei o conceito testado neste ensaio clínico sob dois pontos de vista: o pragmático e o mecanicista. Como já comentamos em outras oportunidades, o aspecto pragmático se refere à influência do estudo na conduta médica, enquanto o mecanicista se refere à mensagem tirada do estudo quanto ao conhecimento etiológico das doenças. 

O SPRINT é um ensaio clínico randomizado de metodologia adequada (baixo risco de viés) e de grande tamanho amostral (baixo risco de erro aleatório). Sendo assim, deve ser considerado verdadeiro o resultado pragmático de que estabelecer uma meta mais exigente (< 120 mmHg) traz benefícios, quando comparado à conduta usual. 

E qual a magnitude do benefício da estratégia intensiva? O grupo padrão apresentou 6.8% de eventos versus 5.2% no grupo intensivo, uma redução absoluta de 1.6%, resultando em NNT = 68. Ou seja, é uma conduta que oferece um benefício de modesto impacto (NNT > 50), visto que de 68 pacientes tratados intensivamente, 1 se beneficia e 67 ficam no mesmo. Por outro lado, estes 67 que ficam no mesmo podem sofrer de sintomas decorrentes dos tratamento mais intenso da pressão arterial. Portanto, esta conduta pragmática deve ser individualizada com muito cuidado.

Agora, vamos evoluir a discussão para o aspecto mecanicista ou etiológico: este estudo demonstra que valores de pressão entre 120 e 140 mmHg implicam em maior risco cardiovascular, quando comparado a valores < 120 mmHg?


A Importância do Desvio-padrão 


A preocupação com aspecto mecanicista me fez procurar no artigo os valores médios obtidos de pressão arterial em cada grupo randomizado. Nesta procura, meu intuito foi de observar se os tratamentos de fato colocaram os pacientes nos valores pretendidos de pressão arterial. 

Observei que a média no grupo de tratamento padrão foi 136 mmHg, enquanto a média no grupo de tratamento intensivo foi 121 mmHg, o que estaria de acordo com o protocolo. Até aí, tudo bem. 

No entanto, uma coisa atípica me chamou atenção neste momento! Os autores escreveram a média sem o desvio-padrão, violando um princípio básico da estatística: sempre relatar a medida de dispersão (desvio-padrão) acompanhando a medida de tendência central (média). Isto porque a média sozinha fala pouco a respeito da distribuição dos valores de uma variável. A ausência do desvio-padrão é muito estranho para um artigo publicado no New England. Aliás, seria estranho em qualquer que fosse a revista.

Comecei a ficar meio ansioso e fui procurar o desvio-padrão no gráfico (abaixo) que mostra os valores obtidos de pressão arterial ao longo do estudo.É adequado que um gráfico de médias (pontos) tenha barras de erro (um T para cima e outro para baixo) que indiquem o tamanho do desvio-padrão para cada média. Fiquei feliz, pois observei que as barras de erro estavam presente e eram bem pequenas, mostrando valores individuais concentrados bem perto da média. 

Mas minha satisfação durou pouco, pois notei no rodapé do gráfico, em letras pequenas, que aquelas barras não representavam o desvio-padrão, mas sim o intervalo de confiança da média.


Vamos revisar estes conceitos. 

Lembrem que desvio-padrão (colocado de forma simplória) é a média dos desvios que cada paciente tem em relação à média geral. O valor de cada paciente sempre se distancia um tanto da média geral. A média desses distanciamentos é o desvio-padrão. Portanto, para uma mesma média, podemos ter um desvio-padrão pequeno (indicando que está tudo bem perto da média - pequena dispersão) ou um desvio-padrão grande (indicando que a média é resultado de valores bem maiores e menores do que esta mesma média - grande dispersão). 

Precisaríamos ver o desvio-padrão, para saber se a média representa bem os valores da maioria dos pacientes. Mas os autores não nos forneceram este dados. Como fazer? 

Há uma solução:

O intervalo de confiança é a média ± 2 erros-padrão (na verdade, 1.96 erros-padrão). Já o erro-padrão é o desvio-padrão dividido pela raiz quadrada do tamanho amostral. A partir de uma medida visual das barras de erro, podemos saber o que seria a amplitude para mais e para menos do intervalo de confiança. Metade dessa amplitude seria o erro-padrão. Se ficou confuso, leiam de novo, com calma, pois é simples!

Sabendo o erro-padrão, podemos multiplicar pela raiz quadrada do N e deduzir o desvio-padrão.

Vamos lá. 

Observem que as barras de erro são bem estreitas, visualmente algo como 1 mmHg para mais e para menos da média. Sendo assim, o erro-padrão seria metade disso, em torno de 0.5 mmHg. Isso multiplicado pela raiz quadrada de 4.678 (tamanho amostral) daria em torno de 34. Portanto, o desvio-padrão destas medidas está em torno de 34. No gráfico abaixo, desenhei o que seria uma verdadeira barra de erros que deveria estar no gráfico, representando a dispersão dos valores (desvio-padrão).


Assim, no grupo tratamento padrão (meta < 140 mmHg), o valor médio da pressão foi 136 com desvio-padrão de ± 34 mmHg. Agora usaremos a curva de Gauss para calcular, com base nesse desvio-padrão, quantos pacientes deste grupo ficaram com pressão > 140 mmHg. 

É assim: o valor de 140 mmHg se distancia 4 mmHg da média de 136 mmHg. Fazendo uma regra de três, 4 mmHg é o tamanho de 0.11 desvios-padrão. Esse 0.11 é o escore Z, aquele valor que representa quantos desvios-padrão algo se distancia da média. Olhando na tabela Z, um dado paciente tem 45% de probabilidade de estar além deste valor 140 mmHg. Portanto, quase metade dos pacientes do grupo cuja meta < 140 mmHg ficaram com pressão > 140 mmHg. 

Para ver a tabela Z e a curva de Gauss, acesse esse link.

Daí vem a dúvida: será que o benefício observado no grupo do tratamento intensivo decorre da prevenção de eventos em pacientes que no tratamento padrão estariam com pressão entre 120 e 140 mmHg ou o benefício advém mais dos pacientes em que o tratamento padrão resultou em pressões > 140 mmHg. 

É essa incerteza, decorrente do oculto desvio-padrão do estudo, que limita nossas inferências etiológicas. 


O Tipo de Desfecho


Uma segunda questão que acentua a incerteza mecanicista do estudo é a análise dos componentes do desfecho primário: o desfecho primário foi composto do combinado de morte cardiovascular, infarto, AVC e “internamento por insuficiência cardíaca”, sendo que o benefício decorreu principalmente da redução de “internamento por insuficiência cardíaca”. 

No desfecho morte cardiovascular, não está descrito o mecanismo específico, mas podemos avaliar qual o principal mecanismo do benefício pela análise dos desfechos não fatais. De 76 desfechos não fatais prevenidos pelo tratamento intensivo da pressão arterial, 38 foram “internamento por insuficiência cardíaca”, 19 infartos, apenas 8 AVCs. 

Soa estranho, pois é pouco esperado que um tratamento anti-hipertensivo tenha no AVC o desfecho de menor impacto. Digo isso, pois este é o desfecho mais associado ao benefício do tratamento anti-hipertensivo em ensaios clínicos. Por exemplo, no ensaio ALLHATo tratamento com diurético obteve melhores resultados na pressão arterial, resultando em menos eventos. Dos desfechos, o único em que a clortalidona foi superior ao inibidor da ECA foi AVC. 

Sendo o desfecho mais sensível ao tratamento, por que foi este desfecho que praticamente não sofreu impacto no estudo SPRINT? Paira a incerteza …

Por outro lado, o desfecho que mais contribuiu (“internamento por insuficiência cardíaca”) tem na crise hipertensiva uma das principais casusas. Isso sugere que o benefício obtido pode decorrer do aprimoramento do tratamento nos 45% dos pacientes que ficam com pressão > 140 mmHg. Este benefício provavelmente não reside nos pacientes que estavam com pressão entre 120 e 140 mmHg. Porque uma pressão de 130 mmHg causaria “internamento por insuficiência cardíaca”. É provável que benefício esteja no melhor controle pressórico de pacientes que estavam com valores bem mais acima. 

Prova de Conceito Pragmático


Então qual seriam a implicações do SPRINT?

Primeiro, devemos ficar com o conceito pragmático de almejar uma maior rigidez no controle pressórico. 

Mas o que seria essa maior rigidez? Alguém poderia dizer, “devemos perseguir uma pressão sistólica < 120 mmHg.” Este tipo de cópia do método usado no trabalhoé um equívoco, já discutido na postagem “O Princípio da Prova do Conceito”. 

Esclarecendo mais uma vez, o método de um ensaio clínico é uma forma de testar um conceito. O estudo usou o método de induzir os médicos a tentar uma pressão < 120 mmHg ou < 140 mmHg, para que houvesse um gradiente de nível pressórico final entre os dois grupos. É deste gradiente, representado pelas diferença dos valores médios do estudo, que surge o efeito clínico do tratamento.

Método do trabalho serve para provar um conceito, que servirá de norte para a decisão médica. Na prática, devemos utilizar o conceito, individualizando a conduta caso a caso. Isso é medicina baseada em evidências. 

Um erro semelhante é quando copiamos critério de inclusão de estudos, sob a forma de recomendação. Por exemplo, estudos com desfibrilador implantável tiveram como critérios de inclusão pacientes com FE < 35%, provando o conceito de que este device é benéfico em pacientes com disfunção importante. Erradamente, certos guidelines colocam que a indicação de CDI é FE < 35%. E o coitado do paciente que tem FE = 36%, fica de fora? FE < 35% foi apenas uma forma de selecionar pessoas com disfunção importante, porém os estudos não compararam FE < 35% versus FE 35% - 40% versus FE > 40%, para avaliar o ponto de corte ideal. O que devemos pensar é que há benefício em pacientes com disfunção. Na medida em que a FE for aumentando, o benefício se tornará mais incerto, até um limite de incerteza que não mais aplicaremos o conceito do estudo. Limite este que deve ser julgado caso a caso. Isso é o Princípio da Prova do Conceito, que tem entrelace com o Princípio da Complacência.

Da mesma forma, a meta < 120 mmHg não foi comparada a 115 mmHg ou a 125 mmHg. Não são números mágicos, são apenas metas a perseguir para obter uma diferença de pressão entre os dois grupos. 

Não devemos confundir medicina baseada em evidências, com medicina copiada de evidências. 

O conceito do SPRINT é ser menos tolerante com valores semi-controlados de pressão. Esse é a implicação pragmática. Não necessariamente, pressão < 120 mmHg.


Prova de Conceito Etiológico


Na prova do conceito etiológico de que a pressão arterial normal é algo menor do que 120 mmHg,  precisamos nos preocupar mais com valores específicos obtidos da pressão arterial. O conceito que discuto aqui é se pressão > 120 mmHg e < 140 mmHg (um nível não definido tradicionalmente como hipertensão) é mecanismo de doença. Desta forma, idealmente, a maioria dos pacientes do grupo padrão deveriam estar com pressão neste intervalo. Na medida em que muita gente do grupo padrão permanece com pressão > 140 mmHg (hipertensão clássica), o estudo perde confiabilidade quanto à sugestão de modificar os critérios do que deve ser considerado pressão arterial adequada.

Pensamento Científico Bayesiano


Toda hipótese científica tem uma probabilidade de estar correta antes do estudo. Cada novo estudo influencia positiva ou negativamente esta probabilidade, de acordo com seu resultado.  O grau de influência de um estudo tem relação com a sua qualidade metodológica, seu nível de evidência. Dizemos que um estudo comprova um conceito quando seu resultado elevou a probabilidade pré-estudo para níveis acima de um certo limite de incerteza. Por outro lado, há estudos cujo nível de evidência não consegue elevar a hipótese para níveis de incerteza desprezíveis. 

Acredito que o estudo SPRINT elevou a probabilidade da hipótese de Flávio estar correta, ou seja, que pressão sistólica normal deva ser < 120 mmHg. Porém, baseado nos argumentos apresentados, provavelmente esta hipótese ainda guarda um nível razoável de incerteza.

Acordei com Flávio Fuchs que, após ler minha postagem, ele escreveria um contra-ponto científico. Desta forma, aguardem os argumentos dele, que devem trazer causar uma saudável abrasão criativa.

_________________________________________________________________________________

Objetivos Didáticos da Postagem:
  • Estudos pragmáticos versus mecanicistas.
  • Desvio-padrão da média, intervalo de confiança e erro-padrão
  • A importância da análise dos componentes de um desfecho composto
  • O Princípio da prova do conceito
  • Pensamento científico Bayesiano

Para acesso ao nosso curso online de Medicina Baseada em Evidências, clique aqui.

A Verdadeira Mensagem do Estudo HOPE-3 (Braço Hipertensão)

$
0
0



Há dois dias publicamos nossa análise sobre o ensaio clínico SPRINT, na qual propusemos a valorização da incerteza sobre a ideia de que aquele estudo respaldaria valores pressóricos > 120 mmHg como fator de risco cardiovascular.

Ontem foi apresentado no congresso do American College of Cardiology e publicado simultaneamente no New England Journal of Medicine, o ensaio clínico HOPE-3, que traz mais dúvida a respeito da hipótese citada acima. 

O HOPE-3 estudou pacientes não hipertensos ou hipertensos com pressão arterial satisfatoriamente controlada. A média de pressão arterial da amostra foi 138 ± 15 mmHg para sistólica e 82 ± 9.4 mmHg para diastólica. Percebam que os valores médios de pressão estão abaixo da faixa que define hipertensão, mas dentro de uma faixa que poderia representar um fator de risco para o sistema cardiovascular. Esta possibilidade é embasada por estudos epidemiológicos (observacionais) que mostram aumento de risco a partir de valores > 115 mmHg. Por este motivo, pensadores científicos como Flávio Fuchs argumentam sobre a necessidade de testar essa hipótese. 

Pois bem, o HOPE-3 representa um ótimo teste desta hipótese, pois randomiza 12.700 destes pacientes para tratamento anti-hipertensivo (candezartan/hidroclorotiazida) versus placebo. Se houver redução de risco, confirma-se a relação de causalidade entre pressão arterial nestes níveis intermediários e eventos cardiovasculares. Seria a presença do mais importante dentre os critérios de causalidade propostos por Bradford Hill: o princípio da reversibilidade, quando o tratamento do suposto fator de risco reduz o risco.

Conforme esperado, o grupo tratamento desfrutou de maior redução de pressão arterial quando comparado ao grupo controle. No entanto, não houve redução do desfecho primário (4.1% vs. 4.4%, P = 0.41), definido pelo combinado de morte, infarto, AVC. Reforçando a negatividade do resultado, a análise individual dos componentes do desfecho não mostrou diferença  a favor do grupo tratamento. 

Em um estudo negativo, devemos nos preocupar principalmente com a possibilidade do erro aleatório tipo II, que pode "negativa" um eventual resultado positivo do ensaio. Lembrando, o erro tipo II é aquele no qual a falta de poder estatístico torna o estudo incapaz de rejeitar a hipótese nula quando esta é falsa. Em outras palavras, incapaz de afirmar uma associação que existe. 

Para explorar a possibilidade de erro tipo II, devemos procurar algumas pistas: (1) Há uma diferença numérica entre os grupos? (2) O valor de P é limítrofe, tendendo a significância estatística? (3) O estudo possuía poder estatístico para encontrar diferenças relevantes?

  1. Observem no gráfico abaixo, da sobrevida livre de eventos, que as curvas são bem sobrepostas. Ou seja, não estamos diante de uma diferença que não alcançou significância estatística.
  2. O valor de P é bastante alto, bem fora daquela faixa que por vezes se denomina de tendência a significância estatística.
  3. Este é um estudo grande (12.700 pacientes), com grande número de desfechos (1.179). Nos métodos, vemos que o estudo foi dimensionado para 80% de poder de detectar uma redução relativa do risco de 22%. Para isso, o estudo precisava obter 500 desfechos. E obteve. Portanto, não é um estudo que carece de poder estatístico.

Nesta análise, devemos reconhecer que a leitura mecanicista de um estudo (relevância científica) deve exigir poder estatístico capaz de detectar menores reduções de risco do que a leitura voltada para o conceito pragmático (relevância clínica do efeito - NNT). Reduções menores de desfecho podem sugerir causalidade, embora não impliquem em indicação terapêutica, devido a seu pequeno impacto clínico. 

Por isso, quando interpretamos um estudo do ponto de vista mecanicista, devemos ficar mais atentos para o poder estatístico, pois este é normalmente calculado sob o paradigma pragmático. 

Esta é um observação que menciono com intuito didático. Mas aplicando este pensamento ao HOPE-3, a grande semelhança na incidência de desfecho entre os dois grupos nos deixa tranquilos em relação à probabilidade do erro tipo II.

Análise de Subgrupo


De acordo com o média e desvio-padrão da pressão sistólica basal (139 ± 20 mmHg), em torno de metade dos pacientes do HOPE-3 possuem pressão sistólica > 140 mmHg. Ou seja, boa parte dos pacientes está acima da faixa intermediária que trago para esta discussão. Isto dá uma maior importância à análise de subgrupo.

A análise de subgrupo mostra interação significativa (P = 0.009) entre esta faixa de pressão > 144 mmHg e benefício do tratamento. Ou seja, pressão > 144 mmHg (tercil superior) se associa a benefício do tratamento, diferente de níveis abaixo disso. 

Como interpretar essa análise?

Sabemos do cuidado que devemos ter com análise de subgrupo, no sentido de que nunca a conclusão do estudo deve priorizar o resultado de um subgrupo em detrimento do resultado geral. Quando um estudo é negativo, um subgrupo positivo deve ser interpretado apenas como gerador de hipótese (se houver plausibilidade, se o subgrupo for definido a priori, se houver interação significativa). Portanto, a conclusão do estudo é negativa, como foi colocado pelos autores, e o efeito benéfico em pacientes com pressão sistólica maior seria uma possibilidade. 

Mas no presente caso, diferente do que parece, a análise de subgrupo reforça o resultado do estudo, em vez de contradizer. Por que digo isso? Vejam que do ponto de vista pragmático, já tratamos pacientes com pressão > 140 mmHg, e do ponto de vista etiológico, já consideramos hipertensão níveis > 140 mmHg. Portanto, o original deste estudo está nos pacientes com pressão < 140 mmHg. E nesses pacientes a análise de subgrupo não mostra qualquer tendência a benefício. 

Estamos aqui na situação em que a análise de subgrupo mostra a consistência do resultado principal do estudo (que foi negativo). Mostrar consistência de algo verdadeiro é a função mais nobre de análises de subgrupo.

Voltando ao Mestre Flávio (Fuchs)


Flávio vai preparar uma réplica a minha postagem de dois dias atrás, sobre o SPRINT. Falei para ele não ter pressa, fazer com calma, quando der na telha. Mas ao longo do dia de ontem, surgiu o resultado do HOPE-3. Isto tornou mais difícil o seu contra-argumento. 

Do ponto de vista pragmático, o HOPE-3 sugere que não há benefício em reduzir a pressão arterial para níveis inferiores aos padrões tradicionais. Do ponto de vista mecanicista, seguindo o pensamento bayesiano, o HOPE-3 reduz a probabilidade da hipótese de Flávio estar correta: níveis de pressão arterial intermediários, não definidos como hipertensão, representam fator de risco cardiovascular? 

O bom é que pessoas fora de série se superam diante de desafios. Com certeza, o mestre Flávio vai tirar um coelho da cartola.


________________________________________________________________________________ 

OBS: O HOPE-3 trouxe o apelo supostamente original de ter estudado pacientes de risco intermediário. Explicarei em mensagem futura porque isto é irrelevante, motivo pelo qual não mencionei este aspecto nesta postagem. Será um comentário com interessante aspecto didático. Em breve farei isso, hoje é domingo, tenho afazeres familiares.

_________________________________________________________________________________

Objetivos Didáticos da Postagem:
  • Estudos pragmáticos versus mecanicistas.
  • Princípio da reversibilidade
  • Análise de erro tipo II
  • Poder estatístico de estudos mecanicistas
  • Análise de subgrupo


    Para acesso ao nosso curso online de Medicina Baseada em Evidências, clique aqui.


    Viewing all 225 articles
    Browse latest View live