Quantcast
Channel: Medicina Baseada em Evidências
Viewing all 225 articles
Browse latest View live

A Liberdade do Conhecimento (Estudo Freedom)

$
0
0


De forma impactante, foi apresentado no recente congresso do American Heart Associatione simultaneamente publicado no New England Journal of Medicine o ensaio clínico FREEDOM, que demonstrou cirurgia de revascularização ser um tratamento mais eficaz do que tratamento com stent farmacológico, em diabéticos com doença coronária severa (80% triarteriais, a maioria com boa função sistólica).

Do ponto de vista metodológico, este é um estudo de resultado confiável, poder estatístico adequado, diferenças estatisticamente significantes e ausência de vieses comprometedores. Sendo assim, não desenvolverei nesta postagem uma discussão quanto à veracidade da informação, pois a considero verdadeira. 

O mais interessante neste caso é perceber quais as implicações dos resultados deste estudo, que me parecem ir além da mera escolha da estratégia de revascularização.

O desfecho primário do estudo foi o combinado de morte, infarto e AVC, apenas desfechos duros (hards). Como já estamos cansados de saber que cirurgia é melhor do que angioplastia no controle dos sintomas e prevenção de novos procedimentos de revascularização, estes não foram escolhidos como partes integrantes dos desfechos combinados, seria redundante.

A redução na incidência do desfecho combinado com a cirurgia se deu a custa de redução de morte e infarto. Este resultado é muito importante, pois este é o primeiro ensaio clínico que demonstra que revascularização miocárdica reduz mortalidade, quando comparado ao tratamento clínico contemporâneo. 

Muitos imaginam que este é um efeito comprovado há muito tempo, porém isto não é exatamente verdade. Voltando ao passado, é importante lembrar que os clássicos ensaios clínicos da década de 70 (CASS, VA) não demonstraram redução de mortalidade com a cirurgia, em relação ao tratamento clínico. Na verdade estes foram estudos negativos em suas análises primárias, sendo sugerido benefício em análise de subgrupo dos pacientes no extremo superior de gravidade. Como sabemos, análise de subgrupo apenas gera hipótese. Por outro lado, o estudo Europeu mostrou redução de mortalidade e, anos mais tarde, uma meta-análise de Salim Yusuf combinou estes estudos, sugerindo melhora da sobrevida no tratamento cirúrgico. Mesmo assim, uma meta-análise que sugere benefício tem ainda 30% de probabilidade de estar incorreta, segundo publicação antiga do New England Journal of Medicine. Desta forma, podemos dizer que até então não havia evidência definitiva de que cirurgia traz benefício de mortalidade. Além disso, o tratamento clínico aplicado àquela época não possuia estatinas e era limitado em relação a terapia antitrombótica. 

Desta forma, o FREEDOM é a primeira evidência contemporânea e de alto nível demostrando que a cirurgia de revascularização tem benefício que vai além do controle de sintomas. É o primeiro dado científico que nos induz a indicar cirurgia para um indivíduo assintomático, caso este seja triarterial. Isso não parece novidade, pois já é uma conduta adotada pela maioria, devido ao nosso ímpeto de heroísmo médico não embasado em evidências. Mas esta poderia ser uma conduta mal indicada, como muitos exemplos de tratamentos adotados na ausência de evidências que depois se comprovam deletérios ou sem efeito nenhum.

Portanto, a partir de agora, a indicação de cirurgia em um paciente assintomático, porém triarterial tem melhor validação. Vale salientar que o benefício apresentado foi de grande magnitude, NNT = 13 para eventos combinados, NNT = 20 para morte, NNT = 13 para infarto.

Importante lembrar que o benefício da cirurgia foi em comparação à angioplastia. Então quando digo que a cirurgia fica indicada para pacientes assintomáticos com DAC grave, parto da demonstração (estudos COURAGE e BARI-2D) de que angioplastia não é inferior ao tratamento clínico contemporâneo, mesmo em pacientes triarteriais. Sendo estes dois semelhantes, se cirurgia é melhor que angioplastia, podemos considerar que cirurgia é melhor que tratamento clínico também. Observem que isso é uma inferência lógica. Resta a possibilidade (não duvido nada) de que em certos pacientes angioplastia seja inferior a tratamento clínico.

Sempre que o tratamento clínico se mostra semelhante à angioplastia ou o tratamento cirúrgico se mostra superior à angioplastia, médicos intervencionistas entram com o argumento de que a angioplastia não foi realizada com o melhor tratamento atual (tipos de stents principalmente). Esse é o tipo de argumento que gera o fenômeno em inglês denominado catch-22. Essa expressão significa um dilema impossível de resolver: precisamos fazer um estudo com o mais novo tipo de tratamento, mas estes estudos duram 5 -10 anos do início do planejamento até a publicação, então quando o estudo terminar, o tratamento não é mais novo. Assim, nunca teremos um estudo que prove algo ser superior à angioplastia. Boa tática para não aceitar resultados que não queremos aceitar. Ótimo exemplo de catch-22.

Um segundo aspecto importante do FREEDOM é que a superioridade da cirurgia é consistente em pacientes com escore Syntax baixo, médio ou alto. Isto fica claro na análise de subgrupo, que mostra ausência de interação (P = 0.58) entre o escore Syntax e a superioridade da cirurgia. Ausência de interação significa ausência de modificação de efeito. Ou seja, o escore Syntax não modifica do efeito da cirurgia, não modifica o fato desta ser superior à angioplastia.

Este dado desfaz um erro histórico de interpretação do estudo Syntax. A primeira publicação do Syntax não conseguiu demonstrar não inferioridade da angioplastia em relação a cirurgia. Quando foram analisados os subgrupos de acordo com o escore Syntax, houve semelhança nos pacientes de Syntax baixo e a diferença era menor nos pacientes de Syntax intermediário. Os intervencionistas gostaram destes resultado e disseram que a cirurgia só é melhor em pacientes de Syntax alto. Esse é um erro grave: fazer prevalecer o resultado de análise de subgrupo em relação à análise geral. Subgrupo apenas gera hipótese. Mas agora sabemos, não importa o Syntax: cirurgia é melhor.

Diabéticos


A esta altura da postagem, muitos devem estar pensando porque eu estou generalizando estes achados e não me referindo apenas a pacientes diabéticos. A justificativa é o princípio da complacência na análise de aplicabilidade de uma terapia. De fato, o estudo foi feito apenas em pacientes diabéticos, com doença coronariana severa. O que mais contou para o resultado encontrado? Foi o fato dos pacientes serem em sua maioria triarteriais ou o fato de serem diabéticos? De fato, diabetes é um fator de risco para desenvolvimento de aterosclerose (terceiro em ordem importância) ou seja contribui para a existência de uma doença mais extensa. Porém, uma vez a doença aterosclerótica triarterial instalada, importa se o paciente é diabético ou não? Triarterial é triarterial. Alguns intervencionistas podem argumentar que o diabético terá mais reestenose. Aí me reporto a uma postagem recente sobre o pensamento multivariado. No mundo multivariado, diabetes é um dos fatores de menor peso importantes para a desenvolvimento de reestenose (quem achou estranho o que acabo de falar, leia postagem prévia). Na análise de aplicabilidade, devemos nos perguntar: se funciona do diabético triarterial, há alguma grande razão para nos fazer duvidar que não funciona no triarterial não diabético. Esse é o princípio da complacência, que sugere sermos menos rigorosos e estender a aplicabilidade de dados verdadeiros e relevantes (NNT = 13) para uma população além da estudada (triarteriais).

Além disso, criou-se erradamente um mito de que o diabético é muito diferente do não diabético. Na verdade tem muito diabético que nem diabético era antes da redução do ponto de corte da glicemia para 125 mg/dl.

Acredito que a importância  do achado deste estudo vai além dos diabéticos. Diabetes é apenas um dos mecanismos pelo qual um indivíduo desenvolve uma doença coronariana severa, mas uma vez essa doença desenvolvida, todo mundo é “igual”. Um indício é que não há nenhum tratamento cardiovascular que funcione diferente em diabéticos e não diabéticos: a eficácia de anti-hipertensivos, estatinas, aspirina, é tudo igual.

Mas para quem ainda está cético com o que estou falando, é só olhar os resultados do seguimento de 5 anos do estudo Syntax, que envolve pacientes com doença grave em geral, não só diabéticos. O estudo ainda não foi publicado, mas ficou claro que em seguimento de longo prazo, cirurgia reduz mortalidade e infarto, quando comparado a angioplastia. Aí está a demonstração de que a coisa vai além do diabético. E isso foi independente do escore Syntax.

FREEDOM (liberdade)

Na verdade, o estudo FREEDOM nos faz perder (não ganhar) algumas liberdades. De um lado, perde-se a liberdade de banalizar o tratamento da doença coronária severa com a supervalorização da angioplastia coronária, em detrimento da cirurgia. De outro lado, perde-se a liberdade de manter o tratamento clínico apenas em pacientes assintomáticos com doença coronária severa, que sejam de baixo risco cirúrgico. Agora (só agora) sabemos que cirurgia reduz mortalidade em pacientes triarteriais.

Importante salientar que nada disso justifica a pesquisa de doença coronária em pacientes assintomáticos. Isso continua inapropriado, como já comentado algumas vezes neste Blog. Em breve, abordaremos melhor este problema de overdiagnosis.

Papai Noel precisa de check-up antes do Natal?

$
0
0


Na noite passada, Papai Noel trabalhou 39 horas contínuas, entregando presentes a 700.000.000 de crianças, percorrendo uma distância de 342.510.000 Km ao redor do mundo, carregando um saco de 416.000 toneladas (assumindo que um presente médio pesa 660g) - segundo fonte recente.

Embora este velhinho tenha passado por todo este esforço, até então não ouvimos notícia de que Papai Noel infartou e está internado na UTI “de um hospital privado na cidade”. Talvez tudo tenha dado certo, pois Papai Noel seja precavido e tenha feito seu check-up cardiológico no início de dezembro, como muitos costumam fazer. Isso é o que pensaria o senso comum.

Entendam por check-up a série de exames realizados no intuito de detectar perigosas doenças ocultas. Daquele tipo que costumamos ver propagandas em revistas alocadas nas poltronas das principais linhas aéras brasileiras, usualmente encartes relacionados a hospitais paulistas.

Contrariando as expectativas, Papai Noel afirmou em entrevista recente de que não costuma fazer este check-up antes do Natal, o que soou como uma certa irresponsabilidade do bom velhinho.

Sendo assim, fica a questão: Papai Noel deveria ou não deveria ter feito um check-up cardiovascular em dezembro?

Considerando sua idade, 550 anos, é grande a probabilidade de doença coronária oculta. Desta forma, se Papai Noel resolvesse fazer uma pesquisa de doença coronária com testes não invasivos (teste ergométrico, cintilografia miocárdica, ressonância de perfusão ou tomografia de coronária) seria bem possível a detecção de aterosclerose obstrutiva. Qual seria o resultado disso?



Provavelmente o Natal das crianças seria adiado.

Sim, porque o screening seria positivo; normalmente este resultado positivo desemboca na realização de cateterismo cardíaco (principalmente em pacientes VIPS como Noel), cujo resultado automaticamente leva à indicação de um procedimento, seja angioplastia coronária ou cirurgia de revascularização.

Não daria tempo, não haveria condição de Papai Noel se recuperar para distribuir os presentes na madrugada de hoje.

Mas poderia ser que valesse a pena adiar este Natal, para garantir o Natal dos próximos anos. Não sejamos imediatistas, há males que bem para o bem.

Porém este não é o caso, este mal acontece de graça, pois não traz consigo um bem maior. Isso mesmo, o check-up cardiovascular em um indivíduo assintomático não traz benefício, mesmo que isto vá de encontro ao senso comum.

Sabemos que o screening da doença coronária não previne desfechos cardiovasculares maiores. Isso está demonstrado em trabalho que randomizou pacientes de risco cardiovascular elevado para realizar ou não realizar screening, mostrando semelhança na incidência destes desfechos. Além disso, estamos cansados de saber (ensaios clínicos) que angioplastia coronária não reduz infarto e não prolonga sobrevida, quando comparada ao tratamento clínico. Portanto, Papai Noel não teria seu infarto prevenido por um procedimento deste tipo que seria induzido por um diagnóstico de doença oculta.

Em casos de doença coronária severa (triarterial ou tronco), evidência recente do estudo FREEDOMnos sugere benefício da cirurgia de revascularização na redução de morte ou infarto. Porém em pacientes com a excelente classe funcional de Papai Noel é pouco provável uma doença coronária severa.

Neste tipo de discussão, entusiastas do excesso de exames normalmente usam algum exemplo de certo paciente assintomático, cujo teste não invasivo foi positivo, levando a um cateterismo que mostrou doença triarterial grave, se beneficiando de cirurgia de revascularização. Estou cansado de ouvir isso.

Este raciocínio mediano e equivocado desconsidera o pensamento epidemiológico, que deve ser probabilístico, baseado em dados coletivos. Ao pensarmos probabilisticamente, percebemos a outra face da moeda. Enquanto um paciente é beneficiado pela solicitação de exames, outro (ou outros) sofre do overdiagnosis.

No overdiagnosis, os casos anedóticos de benefício trazido pelo diagnóstico são anulados ou até mesmo superados pelo número de pacientes que se prejudicam pelo diagnóstico.

Seria o caso de Papai Noel fazer algum exame não invasivo, mostrando doença fora do alto espectro de gravidade do estudo FREEDOM (o mais comum), levando a uma angioplastia coronária que não prolongou sua vida, não reduziu probabilidade de infarto. Tudo isso na ausência de sintomas, que poderiam se melhorados se estivessem presentes, mas não estão presentes. Sem falar em complicações mais graves de procedimentos desnecessários. Desde óbito até sequelas importantes.

Perderíamos o Natal das crianças, em troca de nenhum benefício clínico para Papai Noel.

Esse é um equívoco comum no pensamento médico: justificar procedimentos com base na possibilidade de benefício em alguns pacientes, desconsiderando a possibilidade de malefício em outros. Como mencionamos previamente, somos mais movidos por resultados positivos e nossa mente tende a desconsiderar a possibilidade de desfechos negativos. Indicamos procedimentos porque alguns podem se beneficiar, mesmo que um número maior possa de prejudicar. Acontece porque fixamos em nossa memória desfechos favoráveis, nos esquecendo de desfechos desfavoráveis.

Em 2012, percebi uma crescente preocupação com esta questão, tendo surgido recomendações médicas voltadas para evitar o overdiagnosis. Neste ano, o US Prevention Task Force classificou como inadequada a realização de eletrocardiograma de esforço em pacientes assintomáticos. Seguindo essa conduta, como parte do programa Choosing Wisely, o American College of Cardiology aponta a realização de pesquisa de isquemia em assintomáticos como uma das cinco condutas a serem evitadas na prática cardiológica. 

Claro que este raciocínio não se aplica apenas a cardiologia. Universalmente se faz screeningpara câncer de próstata com PSA, porém neste ano esta conduta passou a ser contra-indicada pelo US Prevention TaskForce. Não tem utilidade. Deve-se também evitar mamografia de rotina em mulheres com menos de 50 anos, ressonância de coluna se a dor lombar tiver menos de 6 semanas, exames de imagem (tomografia ou ressonância de crânio) em pacientes com sincope sem sinais neurológicos.  Enfim, são inúmeras as condutas médicas que caracterizam o overdiagnosis.



No filme de Tim Burton, Nightmare Before Christmas (O Estranho Mundo de Jack), Papai Noel é raptado por Jack, um monstro do mundo do Halloween. Sem maldade e por inocência, Jack deseja substituir Papai Noel em sua função de alegrar as crianças. No entanto, Jack é um monstro e quando entra nas casas, não traz felicidade, mas sim horror às crianças. Isso é o que acontece com a postura médica do excesso de diagnóstico. Há intenção de fazer o bem, porém a visão equivocada provoca o fenômeno do overdiagnosis: diagnóstico correto, porém dispensável, com potencial de ser deletério ao paciente.

Vivemos hoje no estranho mundo do overdiagnosis, levando os nossos pacientes ao pesadelo de serem raptados da sua condição estável, para a criação de um problema (falso em sua magnitude) que será resolvido por uma solução (falsa em seu benefício).

Meus votos natalinos neste ano são de que Papai Noel nos traga a consciência de que vivemos neste estranho mundo.

Santa Claus Gets a Check-Up

$
0
0


Como resposta a nossa última postagem, nosso colega Mário Coutinho (MD, PhD) nos enviou este vídeo que utiliza o check-up de Papai Noel como tema de propaganda da indústria do check-up. Faz exatamente o raciocínio contrário ao nosso, utiliza o apelo do esforço que Papai Noel faria no Natal para promoter o idéia do check-up cardiovascular. Como disse Mário Coutinho, "a indústria do check-up não se importa em parecer ridícula."

Postagem de Ano Novo: Perspectiva versus Realidade

$
0
0


A maioria de nós possui um apreço especial pela mudança de ano, a despeito da realidadepermanecer a mesma após a meia-noite do dia 31 de dezembro. O que faz da passagem de ano um momento especial é um outro tipo de mudança: a que ocorre com nossa perspectiva.

Consciente ou inconscientemente, este é um momento reflexivo, avaliamos os acertos e erros no ano passado, imaginamos novos objetivos, assumimos novas perspectivas. Isso é suficiente para promover certa sensação de temporária de plenitude, mesmo que a realidade permaneça igual.

Perspectivaé diferente de realidade e a primeira tem maior impacto do que a segunda. Nossa satisfação depende mais da perspectiva do que da realidade. Isto está demonstrado cientificamente e o experimento que descreverei me permitirá fazer um link entre perspectiva e prática médica.

Cientistas analisaram experimentalmente o comportamento de dois macacos (vários experimentos seqüenciais com diferentes pares de macacos), confinados em jaulas diferentes. Em ambos os casos, o chão das jaulas disparava choques elétricos simultâneos e intermitentes. Na jaula esquerda havia um botão para o macaco desligar a descarga elétrica, interrompendo o choque. A jaula da direita não possuía esta botão, porém sempre que o macaco da esquerda apertava o botão, a eletricidade era também desligada na jaula da direita. Isso fazia com que os tempos de choque dos dois macacos fossem idênticos. A realidade dos choques era idêntica nos dois macacos. No entanto, o macaco da esquerda (o que apertava o botão) permaneceu saudável, ativo, feliz, enquanto o macaco da direita se tornou deprimido, emagreceu e adoeceu. Se os dois recebiam a mesma quantidade de agressão física, por que a resposta clínica foi diferente?

A diferença é que o macaco da esquerda tinha a impressão de controle sobre os choques, enquanto o macaco da direita ficava a mercê do choque ser desligado pela vontade de outrem. Nós humanos somos iguais a estes macacos. A perspectivade falta de controle sobre nossa realidadeincomoda bastante a mente humana. Por algum motivo, talvez instinto de sobrevivência, não aceitamos a perda de controle. Isto ocorre a despeito da realidade de que não temos controle absoluto sobre nosso destino, o qual  é regido prioritariamente pelo acaso social (encontros e desencontros) e acaso biológico (interações moleculares de um sistema complexo).  Ou, sob outra ótica, regido por uma “força maior” que se traduz com aparência de acaso.

E é exatamente esse fenômeno mental que nos distancia do paradigma da medicina baseada em evidências. Mesmo que não tenhamos controle, ter a perspectiva de controle é suficiente para nossa satisfação, tal como no caso do macaco que desligava o choque, mas não tinha controle sobre a quantidade de choques ou quando eles surgiam.

Em medicina, muitas condutas não mudam a realidade do indivíduo. Porém dão ao paciente e a seu médico a perspectivade estar fazendo alguma coisa, a ilusão de controle sobre o desfecho. Por este motivo, tratamentos complexos, dolorosos e de alto custo são usados mesmo que não mudem o desfecho (realidade) do paciente; exames desnecessários são utilizados, promovendo o fenômeno do overdiagnosis, prejudicando o paciente. Tudo isso para que tenhamos uma perspectiva de controle sobre nossa realidade.

Nestes casos, estamos nos comportando como os macacos dos experimentos. Perdemos a racionalidade.

Tratamentos quimioterápicos são usados até o último momento em pacientes terminais, pois o maior sofrimento seria a sensação de perda de controle, de jogar a toalha. Assim como angioplastias coronárias (desprovidas de benefício clínico) são realizadas em pacientes assintomáticos, apenas para trazer ao paciente e seu médico  a falsa sensação de ter resolvido o problema.

Na esfera diagnóstica, nos traz uma reflexão neste sentido o recente artigo publicado no New England Journal of Medicine, intituladoEffect of Three Decades of Screening Mammography on Breast-Cancer Incidence. O trabalho descreveu as incidências de câncer de mama em estágio inicial e em estágio avançado ao longo dos últimos 30 anos nos Estados Unidos, demonstrando o impacto da introdução da triagem de câncer na população. De fato, houve uma aumento relativo de 100% no diagnóstico de “câncer” em estágio inicial, de 122 para 234 casos diagnosticados a cada 100.000 mulheres. Com tantos “cânceres” diagnosticados em estágio inicial, seria de se esperar uma redução substancial dos cânceres em estágio avançado, pois estes passariam a ser diagnosticados mais precocemente. Porém a incidência de câncer avançado sofreu mínima redução, de 102 para 94 casos a cada  100.000 mulheres. Por que isso? O fato é que vários desses “cânceres” diagnosticados precocemente são “lesões” que não irão evoluir para um verdadeiro câncer. Esses “cânceres” precoces não são os precursores dos cânceres verdadeiros, aqui denominados de avançados. Por isso, ao diagnosticar e tratar um “câncer” em estágio inicial, não houve impacto sobre os verdadeiros cânceres (avançados). Porém este tratamento deve ter promovido piora da qualidade de vida nas mulheres, agora rotuladas de portadoras de um câncer, sendo submetidas a terapias agressivas, quimioterapia, radioterapia, mastectomias. É brincadeira?

O screening do câncer de mama serve para nos dar uma perspectiva de controle sobre essa doença. Quase que apenas isso, pois na prática a realidadenão muda. O risco de morte por câncer de mama permanece o mesmo. É baseado neste raciocínio que o US Prevention Task Force contra-indicou screeninganual para câncer de mama entre os 40 e 50 anos de idade, gerando revolta por parte de médicos que realizam o procedimento de mamografia.

Na mesma linha de raciocínio está  a ilusão da pesquisa de doença coronária no indivíduo assintomático, comentada na última postagem deste Blog. Sabe-se que (salvo extremos de gravidade) encontrar doença subclínica não reduz risco, pois procedimentos invasivos não trazem benefício. Trariam controle dos sintomas, se necessário, mas controle de sintomas no assintomático não é necessário.

Na esfera prognóstica, propagamos a idéia de que precisamos encontrar uma forma de predizer exatamente quem terá e quem não terá um infarto. Julgamos que nossas ferramentas atuais são fracas porque erram algumas vezes e determinamos a necessidade de novos biomarcadores. Novos biomarcadores surgem e são incorporados na clínica a despeito de pouco valor incremental do ponto de vista científico: proteína C-reativa, microalbuminúria, espessura médio-intimal de carótidas. Na verdade, predizer o futuro é um grande desafio, é natural errar algumas vezes, e nunca teremos um modelo perfeito de predição. A utilização sem base em evidência de novos biomarcadores serve para nos dar a falsa perspectiva de controle sobre nosso destino. Se pensarmos que a realidade nunca será totalmente previsível, ficaremos mais satisfeitos com ferramentas clínicas como o escore de Framingham e seremos mais racionais na análise critica de novos biomarcadores.

A realidadeé que não temos controle absoluto sobre desfechos clínicos e devemos evitar uma busca frenética por este controle, em detrimento da valorização de evidências científicas. Ao escrever isso, é meu hemisfério cerebral esquerdo (racional) que fala.

No entanto, o marketing do excesso de exames (check-up das revistas da TAM e GOL), da indústria farmacêutica e de materiais médicos não trabalha com o cérebro esquerdo. O marketing do consumismo trabalha com o nosso hemisfério cerebral direito, intuitivo, sentimental, mais facilmente seduzido.

O que é mais sedutor: “faça exames para diagnosticar sua doença antes que ela complique sua vida, melhor prevenir do que remediar” ou “check-up cardiovascular no indivíduo assintomático não muda desfecho. Se contente com a imprevisibilidade da vida (insustentável leveza do ser, segundo Milan Kundera), apenas adote medidas de controle dos seus fatores de risco e torça para não ser um azarado que terá morte súbita.” Claro que a primeira opção é mais sedutora.

Portanto, nossa necessidade de controle é um dos mecanismos mentais que nos leva a negligenciar princípios científicos, a procura da ilusão de que estamos tratando (mesmo sem tratar) e de que estamos prevenindo (mesmo sem prevenir).

Precisamos mudar de perspectiva. Podemos pensar na perspectiva da qualidade de vida. Com certeza, submeter pacientes assintomáticos a exames e tratamentos agressivos compromete qualidade de vida. E isso nem sempre é compensado por melhora de sobrevida.

Meus votos para 2013 é o de mudança de perspectiva. Refiro-me à idéia de que a eliminação de testes e tratamentos desnecessários pode melhorar nossa qualidade de vida, evitando efeitos adversos indesejados. Só precisamos separar o que é conduta médica benéfica e a que serve apenas de ilusão. Essa mudança de perspectiva será favorável ao raciocínio clínico científico.

O Politicamente Correto e as Recomendações de Hábitos de Vida

$
0
0


Nós médicos, em especial cardiologistas, vivemos recomendando exercício físico e dieta saudável (pobre em gordura saturada, ricas em frutas, vegetais, peixes) para prevenção cardiovascular. No entanto, poucos param para pensar no nível de evidências a respeito destas recomendações. Independente do nível de evidência, soa bem, é politicamente correto falar em hábitos de vida saudáveis, mesmo que o médico não os obedeça pessoalmente ou que em alguns casos a recomendação deixe o cliente mais frustrado do que protegido contra um infarto.

Nesta postagem, faremos uma revisão dos níveis de evidência destas recomendações, o que nos levará a uma análise crítica de seu impacto global.

Vale salientar que se tenho um conflito de interesse pessoal, este é a favor de atividade física e alimentação adequada, quem me conhece sabe disso. No entanto, meu aparente entusiasmo por estes hábitos se baseia mais na qualidade de vida que estes me proporcionam, do que na convicção de que estes fazem bem ao meu coração.

No meu caso, os hábitos me agradam, me servem de lazer, me tornam mais sociável. Porém imaginem uma pessoa que não gosta de fazer exercício. Por exemplo, um cientista amigo nosso, inteligência privilegiada, blogueiro, há alguns anos me falou que não gosta de se exercitar, não gosta mesmo. Será que como cardiologista devo dizer que ele perderá a oportunidade de reduzir seu risco cardiovascular se não se exercitar? Onde está a evidência disso?

A verdade é que isto não está definitivamente demonstrado. A maioria das evidências se resume a estudos observacionais e a história está repleta de exemplos indicando que estudos observacionais possuem grande possibilidade de errarem quanto ao impacto de hábitos de vida. Nestes estudos, aparentes benefícios são normalmente mediados por fatores de confusão que se associam aos hábitos. Estudos observacionais demonstram que chocolate faz bem ao coração, que café e vinho reduzem mortalidade geral e cardiovascular, que uso de suplementos vitamínicos reduzem câncer e doença cardiovascular e que terapia de reposição hormonal reduz risco de doença cardiovascular. Nos dois últimos casos, temos ensaios clínicos que contradizem estas observações, mostrando que estes efeitos não são verdadeiros, haviam sido mediados por fatores de confusão. Nos três primeiros casos, permanece a grande dúvida.

Considerando o potencial para fatores de confusão, é muito possível que estudos randomizados venham a contradizer os observacionais. Foi exatamente o que aconteceu com a idéia de prescrição de exercício em pacientes com insuficiência cardíaca. Ao contrário da expectativa, o ensaio clínico HF-ACTION não demonstrou benefício de programas de atividade física. 

Em prevenção primária, não há ensaio clínico randomizado avaliando se exercício reduz risco cardiovascular. Todos são estudos observacionais, repletos de fatores de confusão, pois quem se exercita é muito diferente do que aqueles que não se exercitam. É certo que o grupo que se exercita tem um perfil de saúde melhor do que os sedentários. Pode ser exatamente esse perfil que os faz (ou os permite) se exercitarem. E não o contrário. 

Vale salientar que os estudos observacionais utilizam de análise multivariada a fim de ajustar para estes fatores. Porém, sabe-se que sempre fica efeito de confusão residual. Esta solução estatística não é suficiente. Neste caso, seria essencial o método intervencionista randomizado, para anular os fatores de confusão. Quando randomizamos, os grupos tornam-se idênticos, não há mais confusão. Infelizmente, não há este desenho de estudo avaliando o impacto da atividade física em desfechos cardiovasculares. 

Portanto, não sabemos: exercício pode ser bom (como se espera), neutro ou ruim (inesperado, mas foi o caso da terapia de reposição hormonal; assim como da vitamina E aumentando risco de câncer de próstata).

No entanto, médicos ficam por aí superestimando o benefício destas medidas, tal como ouvi no rádio um dia desses: “se você se exercitar, reduzirá seu risco de infarto em 90%”. Puxa vida, nunca vi um tratamento que praticamente anule o risco.


US Prevention Task Force

Na semana passada, o US Prevention Task Forcepublicou as indicações sobre dieta e exercício para prevenção cardiovascular, definindo-as como grau de recomendação C. O Task Force utiliza o Sistema GRADE de recomendação, já comentado neste Blog. Só para lembrar, graus A e B recomendam a conduta, grau C é usado quando a conduta não é recomendada em geral, mas individualmente pode ser considerada, enquanto grau D é contra-indicação. Ou seja, o Task Force não contra-indica, porém chama atenção de que estas recomendações não são obrigatórias, podendo ser recomendadas a depender do caso.

Esse baixo nível de recomendação é justificado pela excelente revisão sistemática feita pelo Task Force: não existe ensaio clínico em exercício e, para desfechos clínicos, existe apenas um ensaio clínico em dieta saudável. Este é o Women’s Health Initiative, que randomizou 48.000 mulheres para aconselhamento intenso sobre dieta versusconduta padrão, não demonstrando tendência alguma a prevenção de desfechos cardiovasculares.

O restante dos ensaios clínicos avaliaram desfechos substitutos, como medida de colesterol, pressão arterial e adiposidade. A revisão demonstra que há melhora estatisticamente significante destes desfechos, porém de mínima magnitude, sem relevância clínica. Por exemplo, a redução do LDL-colesterol com medidas de hábitos de vida é da ordem de 5 mg/dl.

Neste contexto, aproveito para analisar o Lyon Diet Heart Study, um ensaio clínico randomizado que sugeriu ser a dieta do mediterrâneo capaz de prevenir reinfarto, com redução absoluta do risco de infarto de 16% (NNT = 6), um efeito impressionante, nunca alcançado por uma terapia farmacológica. Este é mais um exemplo da falta de poder estatístico fazendo com que o acaso promova resultados impressionantes em estudos pequenos. Este estudo tinha apenas 400 pacientes e nem mesmo cita o cálculo do poder estatístico. Além disso, este foi um estudo truncado, agravando ainda mais o risco (quase certo) deste inverossímil resultado ter sido obra do acaso. É um bom exemplo de um ensaio clínico cuja informação tem alta probabilidade de ser falsa.

Baseado nestes argumentos, o grau de recomendação C significa o seguinte: se for conveniente, recomende; do contrário, não encha o saco de seu paciente. 

Pessoalmente, eu faço exercício pois me é conveniente; se não fosse, eu não faria. Quanto à dieta, deve ser sugerido um padrão saudável, porém sem radicalismo ou sem a demonização de certos alimentos que fazer parte de nossa cultura do lazer. Acarajé, não devemos comer todo dia, até porque é muito calórica. Mas no domingo, não há problema. Se a pessoa tem colesterol elevado, deve usar estatina, isso sim. Parece óbvio o que estou falando, porém muitas vezes perdemos a perspectiva da evidência e sustentamos excessivamente nossa recomendação neste tipo de medida.

Que mal faria sermos politicamente corretos e enaltecermos (de forma falsa) o benefício dos hábitos de vida no consultório e na imprensa?

O Task Force traz esta reflexão:

Potential Harms: Harms may include the lost opportunity to provide other services with a greater health effect.

Em nome do politicamente correto, é comum a conduta de primeiro tentar medidas de hábitos de vida, em detrimento de terapias com eficácia comprovada. Ou seja, “se você ajustar os hábitos de vida, não será necessário o uso de remédio por enquanto (estatina, anti-hipertensivo).” Ora, seria trocar um tratamento cujo benefício clínico é largamente comprovado (e de grande magnitude em alguns casos), por outro cujo benefício clínico não está comprovado. E essa cultura prevalece no consciente coletivo, de forma que o paciente usualmente prefere tentar primeiro resolver o problema de forma mais natural. 

Natural é desenvolvermos doença cardiovascular na medida que a envelhecemos. Se não queremos esse natural, temos que usar medidas mais agressivas do ponto de vista preventivo, mesmo que soem como não anti-naturais.Se há condutas preventivas comprovadas, estas devem ser adotadas para quem precisa, e não ficar a mercê do politicamente correto.

Usualmente falo contra a medicalização da sociedade. Veja que nesse momento o discurso parece diferente. Tentar manter o mesmo discurso neste momento soaria como politicamente correto, mas o que importa é o benefício para o paciente. Quando a droga é benéfica, deve sim ser utilizada. 

Perda de Peso

Essa discussão pode ser ampliada para o problema da obesidade. Claro que é melhor não ser obeso e a recomendação de perda de peso deve ser feita nos consultórios médicos. No entanto, sabemos que as medidas dietéticas e farmacológicas para perda de peso são pouco eficazes (ensaios clínicos) e muito pouco efetivas (mundo real) em relação à magnitude da perda ponderal. Em crianças, educação alimentar pode remodelar definitivamente o biótipo da pessoa, ter o foco no peso é muito importante. Porém, são poucos os gordinhos que (sem cirurgia bariátrica, cujo impacto em desfechos clínico ainda precisa ser testado) conseguem se tornar definitivamente magros. Ou melhor, alguma dieta maluca até consegue isso temporariamente, porém a maioria volta ao seu estado natural tempos depois. 

Reconheço esse discurso como niilista, mas é assim mesmo. Essas pessoas passam a vida se martirizando, sentindo-se culpadas, inferiores. Os amigos e parentes passam a vida censurando essas pessoas. Obesidade não é bom. No entanto, não há demonstração clínica de que a perda de peso reduza eventos clínicos cardiovasculares.

Em outubro de 2012, resultados preliminares do ensaio clínico Look AHEAD foram anunciados na página do NIH, patrocinador do trabalho. Trata-se de uma ensaio clínico que randomizou 5.000 diabéticos obesos para programa intenso de dieta e exercício versus terapia padrão. Não houve redução de eventos cardiovasculares. Além disso, o impacto da perda de peso no controle do diabetes foi modesto.

Se fala tanto no problema epidemiológico da obesidade, porém a mortalidade cardiovascular está progressivamente diminuindo no Brasil e no mundo ocidental. Isto porque maior impacto está no controle do colesterol e da pressão arterial.

Observem bem, não estou defendendo a obesidade. A recomendação de perda de peso deve existir.  Porém deve existir na proporção da evidência que a suporta e não baseada na impressão visual ao ver uma pessoa acima do peso. Precisamos contextualizar o caso, quando se trata de uma pessoa que sempre foi acima do peso. Precisamos mudar o foco para qualidade de vida. E qualidade de vida depende de auto-estima. Portanto, se esta pessoa dormir bem (não tiver apnéia do sono), tiver colesterol controlado (com droga ou sem droga) e pressão normal, deixe ela ser feliz. Não diga “obesidade é uma doença”. Obesidade não é doença, é fator de risco.E como fator de risco é mediada por outros, que podem ser controlados. Se estas coisas estiverem bem, não precisamos demonizar o biotipo da pessoa.

O fato de uma fator ser associado a risco não é condição suficiente para que seu controle reduza o risco. Isso tem que ser demonstrado.

Medidas de hábitos de vida e perda de peso devem existir no diálogo com os pacientes, porém de forma inteligente e contextualizada.

Pensar no nível de evidência que suporta nossas recomendações pode trazer mais empatia ao diálogo com nossos pacientes. Temos quer ser mais enfáticos no controle do colesterol e da pressão arterial e na recomendação contra do tabagismo. Já nas recomendações sem comprovação de benefício, estas devem se basear mais na qualidade de vida que elas proporcionam. E se uma conduta traz qualidade de vida, isso depende muito do estilo e crença de nosso paciente.

No raciocínio medico, o politicamente correto serve de marketing pessoal. Um marketing medíocre.



Article 0

$
0
0
Colegas,

vejam neste linko excelente programa do III Congresso Brasileiro de Cardiologia Clínica, organizado pelo Departamento de Cardiologia Clínica da SBC. O evento ocorrerá nos dias 22 e 23 de março, em São Paulo, no Hotel Caesar Park. Esta será uma boa oportunidade para discutirmos assuntos clínicos diversos com o enfoque da medicina baseada em evidências, tal como planejou a comissão científica deste evento. 


A Dieta do Mediterrâneo e o Estudo PREDIMED

$
0
0


Parece até que foi resposta à nossa última postagem, quando discutimos a respeito do contraste entre o entusiasmo depositado em dieta saudável e a ausência de evidências definitivas de benefício cardiovascular. Naquela postagem, estendemos essa observação à dieta do mediterrâneo, tendo em vista a baixa qualidade científica do estudo de Lyon.

Poucas semanas após nossa postagem, foi publicado online o NewEngland Journal of Medicineo estudo PREDIMED (financiado pelo governo espanhol), o qual randomizou 7.447 indivíduos de alto risco cardiovascular para dieta do mediterrâneo versus dieta controle (hipolipídica), demonstrando que o grupo mediterrânico apresentou redução na incidência de eventos cardiovasculares.

Fui tomado por entusiasmo, pela primeira vez uma dieta de benefício cardiovascular demonstrado. A primeira impressão era excelente, um ensaio clínico randomizado e de grande tamanho amostral. No dia em que vi a notícia, mesmo antes de ler o artigo, cheguei a recomendar para um de meus pacientes de consultório a dieta do mediterrâneo, comentando sobre a publicação do estudo. Agora eu poderia indicar dieta baseada em evidências.

No domingo seguinte, assisti no programa Fantásticoreportagem de 5 minutos dando a boa notícia. O Fantástico foi até a Europa, mostrou do que se tratava a dieta, entrevistou donos de restaurantes ou de lojas de comida. Mais do que isso, o Fantástico fez uma apresentação formal de artigo científico, com critérios de inclusão, definição de desfechos, resultados encontrados.

Mas o que é mesmo essa tal dieta do mediterrâneo? Em resumo, consiste em grande quantidade de azeite de oliva, nozes, amendoim, frutas, vegetais, legumes, peixes, mariscos, preferência por carne branca e estímulo ao consumo moderado de vinho. Na verdade, uma dieta prazerosa, embora de custo mais elevado do que o brasileiro médio está acostumado.

Confesso que me deixei tomar pelo entusiasmo, até mesmo porque ceticismo científico não é torcer contra a demonstração de benefícios. Esta postura científica apenas sugere a aceitação de verdades com base em critérios pré-definidos que definam a evidência como suficiente para rejeitar a premissa inicial da hipótese nula. Uma vez essa hipótese rejeitada, devemos acreditar no fenômeno, como algo demonstrado frente ao mundo de incertezas que nos rodeiam. E foi com este espírito que comecei a ler o estudo PREDIMED, seguindo nosso tradicional check-listde erros sistemáticos ou aleatórios.

Análise de Erros Sistemáticos

Primeiro, um grande ensaio clínico randomizado, o que promoveu amostras idênticas, sem diferenças clínicas. Isso previne que fatores de confusão expliquem os resultados encontrados, como ocorre comumente em estudos observacionais. Esse problema não existe no PREDIMED. O desfecho primário foi o combinado de morte, AVC e infarto, desfechos duros (hards), pouco susceptíveis ao viés de aferição que ocorre com desfechos subjetivos, moles (softs). Como este é um estudo aberto (impossível cegar dieta), haveria maior risco de viés de aferição se os desfechos fossem softs, pela sua subjetividade. Mas sendo os desfechos hards, fica minimizada a possibilidade de interpretação enviesada dos investigadores quanto a ocorrência de desfechos. A análise foi corretamente por intenção de tratar e houve boa aderência à dieta proposta, dando confiabilidade aos resultados.

Desta forma, me parecia ser um estudo de qualidade no que diz respeito a vieses.

Análise de Erros Aleatórios (Acaso)

O valor de P nos deixa confortáveis quando a um menor risco de erro tipo I, aquele em que uma falsa diferença é encontrada. O valor de P foi significativo em relação ao desfecho primário. Sendo a conclusão baseada no desfecho primário, reduz-se a probabilidade do erro aleatório. Até então estávamos indo bem.

De repente, me surpreendi com a leitura de uma sentença:  on July 22, 2011, the data and safety monitoring board recommended stopping the trial on the basis of end points documented through December 1, 2010. Trata-se de um estudo truncado!

Estudo Truncado

Ao perceber isso, tentei rapidamente encontrar argumentos para me convencer que este seria uma problema menor.  Afinal, sendo um estudo de dieta, eu estava inclinado a ser menos rígido em minha análise. Já comentamos sobre estudos truncados várias vezes neste Blog. Sabe-se que quando o número de desfechos é maior do que 500, o estudo fica menos sujeito ao erro tipo I causado pelo truncamento. Ansiosamente, procurei na tabela este número e para minha frustração foram apenas 288 desfechos no estudo, tornando o estudo vulnerável ao erro tipo I.

Estudo truncado é aquele que é interrompido precocemente devido à demonstração de benefício. O problema é que antes de terminado o estudo, o resultado favorável tem maior risco de ser decorrente do acaso. Se este for o caso, ao truncar, perde-se a possibilidade de corrigir o acaso com o progredir do estudo. Embora o estudo tenha randomizado o número planejado, o seguimento dos pacientes foi reduzido pela metade, reduzindo o número de desfechos para muito abaixo do inicialmente planejado. O cálculo amostral foi baseado na expectativa de 12% de desfechos no grupo controle, no entanto se alcançou apenas 4.4% de eventos, o que reduz o poder estatístico. O plano era de 6 anos de acompanhamento para todos os pacientes, porém mais da metade teve menos de 5 anos de acompanhamento (mediana = 4.8 anos). O estudo portanto tem um poder estatístico menor, aumentando a possibilidade do resultado ser decorrente do erro tipo I.

Além do problema da redução de poder estatístico, todo estudo truncado é tendencioso por ser interrompido apenas quando o resultado está sendo favorável à hipótese.

Lembrem-se do estudo truncado do Xigris, cujo truncamento promoveu uma inverdade que durou anos, até a publicação de um estudo completo, que negou o benefício daquela droga.



Por que apenas AVC?

Ainda inconformado com a bobagem de terem interrompido esse marcante estudo, me deparei com uma outro problema que me deixou intrigado. A redução do desfecho combinado foi decorrente apenas da redução de AVC, sem redução numérica de morte ou infarto.

Havia dois grupos de dieta do mediterrâneo, um com mais azeite de oliva e outro com mais nozes.

A incidência do desfecho combinado foi 3.8% no grupo azeite versus4.4% no grupo controle. Essa diferença foi decorrente do desfecho AVC (1.9% versus 2.4%), sem diferença em infarto (1.5% versus 1.6%) ou morte cardiovascular (1.0% versus 1.2%).

A incidência do desfecho combinado foi 3.4% no grupo nozes versus4.4% no grupo controle. Essa diferença foi decorrente do desfecho AVC (1.3% versus 2.4%), sem diferença em infarto (1.3% versus 1.6%) ou morte cardiovascular (1.3% versus 1.2%).

Quanto a morte, é compreensível a dissociação com os outros desfechos, pois é mais difícil reduzir morte do que eventos não fatais. Por outro lado, os tratamentos que reduzem AVC, reduzem infarto também (estatina, anti-hipertensivo). Por que neste caso, houve redução apenas de um desses componentes? Isso é uma pista de que o achado pode ter realmente decorrido do acaso.

Além do acaso, há outra possibilidade, embora esta não se possa ser demonstrada. AVC é um desfecho particularmente prevenido por redução de pressão arterial. Por ser aberto, este é um estudo que pode sofrer de performance bias, visto que o número de visitas com nutricionista, reuniões, enfim, a atenção dada ao grupo mediterrâneo foi maior do que ao grupo controle. Isso pode ter resultado em melhor controle da pressão, seja por medidas não farmacológicas ou até farmacológicas decorrentes de um melhor acompanhamento multidisciplinar destes pacientes. Neste caso, seria importante que os autores comparassem o nível de controle da pressão arterial durante o estudo entre os dois grupos. Isso iria tirar essa dúvida. Porém este dado não foi fornecido.

O grupo da dieta do mediterrâneo tinha reuniões motivacionais com a equipe controladora da dieta a cada 3 meses, enquanto o grupo controle apenas recebia panfletos em casa durante os primeiros 3 anos do estudo. No meio do estudo, os autores decidiram mudar o protocolo para uma maior número de visitas no grupo controle, com receio de que isso representasse um viés. É interessante notar que a diferença entre os grupos surgiu precocemente, coincidindo exatamente com esse período inicial de melhor atenção dada ao grupo mediterrâneo. O protocolo foi mudado, mas o estrago já estava feito...



Toda esta análise demonstra que não basta que o estudo seja randomizado e tenha grande tamanho amostral. Independente do tamanho amostral, o acaso pode ocorrer quando o número de desfechos é pequeno e o estudo é interrompido tendenciosamente a favor do benefício. Além disso, o estudo ideal é o cego, pois previne efeito placebo, interpretação duvidosa de desfechos e performance bias. A diferença nítida de atenção entre os grupos, coincidindo com a precocidade do benefício justamente antes da correção parcial deste problema, gera muita preocupação.

Enfim, para minha frustração ao final da leitura, percebi que estava com um estudo com baixo nível de veracidade, demonstrando uma nítida dissociação entre entusiasmo e evidência.

Magnitude do Benefício

Na fantástica reportagem do Fantástico, foi mencionado por um dos especialistas que “o benefício da dieta foi tão grande que o estudo precisou ser interrompido precocemente.” Como se avalia magnitude do benefício mesmo? Simples, calculando o NNT. O NNT foi de 166 para dieta com mais azeite e 100 para dieta com mais nozes. Ou seja, a redução de risco não foi grande, pelo contrario, foi pequena (NNT > 50 à custa de evento não fatal). De uma certa forma, isso é compatível com o impacto de um medida não farmacológica.

Conversa com o Cliente

Como conversar com nossos clientes sobre dieta após o estudo PREDIMED? Acredito que possa ser mencionado que seria de bom tom a preferência por azeite do oliva em relação ao óleos saturados, além de frutas, saladas, peixes, etc. Utilizar um pouco da definição de dieta mediterrânea para explicar o que é um comportamento saudável pode fazer sentido.

No entanto, isso é diferente de recomendar esta dieta como terapia preventiva. Ou seja, não temos embasamento para dizer ao cliente que use pelo menos 4 colheres de sopa ao dia de azeite, nozes, 3 porções de frutas ao dia, 2 porções de salada ao dia, peixe 3 vezes por semana, 7 taças de vinho por semana. Isso dá trabalho e custa dinheiro para ser recomendada sobre a premissa de benefício. O que devemos sugerir é que a pessoa tenha hábitos saudáveis e este tipo de dieta pode ser um exemplo de saudável.


Reflexão

Interessante perceber o tipo de entusiasmo de “especialistas” a respeito deste estudo. É um entusiasmo baseado no resultado do trabalho, porém desprovido de análise metodológica. Por exemplo, observem o vídeo de cinco minutos em que Eric Topol fala sobre o estudo PREDIMED no Medscape. Em nenhum dos cinco minutos há uma análise da metodologia do trabalho, apenas elogio ao tamanho amostral. O entusiasmo a respeito de um trabalho deve guardar relação com o nível de evidência que este oferece e não apenas com o resultado apresentado pelo estudo.

Lembremos da frase de Peter Gann: Epidemiology teaches that every association has only 3 possible explanations: bias, chance and cause. Antes de considerar a relação causal, precisamos afastar viéses e acaso.

Mas por que será que falta análise critica? Francis Bacon dizia que "somos muito mais movidos pelas afirmações do que pela negação". Ou seja, nossa mente é tão atraída por resultados positivos, que rejeitamos facilmente a dúvida. Aceitamos argumentos fracos. A mente humana apaixona-se pelas associações positivas. E como se sabe, paixão é cega. Alguém apaixonado não vê as falhas do objeto da paixão, apenas as virtudes. Somos sentimentais, usamos nosso cérebro direito quando na análise de evidências deve prevalecer o hemisfério cerebral esquerdo.

A dieta do mediterrâneo deve ser vista como uma hábito alimentar razoável, porém não como um tratamento preventivo. Não temos este nível de evidência.

Não basta ser grande e randomizado. Em medicina baseada em evidências, a primeira impressão nem sempre fica. 

Ensaio sobre a Medicina Baseada em Fantasia

$
0
0


A mente humana tem propriedades que parecem adequadas, mas que podem nos trair. Aqui me refiro ao fenômeno da mente crente, termo que reflete nossa tendência de nos excitarmos mais por afirmações do que por negações. Temos um interessante tropismo pela crença, mesmo que a idéia tenda mais para a fantasia do que para realidade. Em contraste com essa nossa tendência, o pensamento científico moderno prega o ceticismo: a crença deve depender da prova, principalmente quando estamos tomando decisões racionais.

Somos crentes por duas razões evolutivas. Primeiro, a necessidade de entender como o universo funciona. No início, quando quase nada sabíamos, tendíamos a fazer conexões causais desprovidas de lógica, em uma incessante tentativa de entender os fenômenos a nossa volta. Era compreensível que nossos ancestrais acreditassem no absurdo (p.e., a dança para atrair chuva). Em segundo lugar, havia o instinto de sobrevivência. Quando o vento balançava as árvores, era mais seguro achar que poderia ser um animal perigoso se aproximando e correr. Facilmente acreditávamos no perigo e em suas soluções fictícias.

Com a evolução científica, deveríamos ter nos tornado mais rigorosos no acreditar, porém nosso processo mental ainda guarda características primitivas. Por este motivo que acreditamos facilmente que coisas inocentes fazem mal e acreditamos que falsos tratamentos fazem bem. Assim surgem os mitos relacionados a assuntos de saúde.

Dizem que frango de granja é deletério à saúde, devido a sua grande quantidade de hormônios (o que poderia provocar câncer), gerando o culto à galinha caipira. Isso não faz sentido, pois uma dose de hormônio custa mais caro do que o frango inteiro. Na verdade, o frango de granja é maior porque é condicionado a comer mais, de forma confinada. Porém, prefere-se um frango caipira, este mais vulnerável a doenças infecciosas por ter contato livre com outros tipos de animais e por se alimentar de qualquer coisa que acha pela frente. Mesmo assim, alguns preferem pagar mais caro pelo mito.

Vejam o mito de que adoçante artificial causa câncer. Essa idéia foi negada de forma consistente por grande conjunto de estudos epidemiológicos, publicados em revistas médicas de alto impacto, demonstrando que adoçante não causa câncer, independente do tipo de produto (New Engl J Med 1980;302:537-41). No entanto, o poder de afirmações é maior do que negações, permanecendo o mito, em detrimento do conhecimento científico. Essa crença predispõe à preferência por utilizar açúcar, predispondo à obesidade, este sim um problema real.

Também adoramos atribuir falsos benefícios a coisas inertes ou maléficas.

Parece lógico pensar que vitaminas trazem benefício à nossa saúde, pois estas tem ação anti-oxidante e oxidação faz parte do mecanismo de doenças. Sendo assim, a lógica diz que o uso de vitaminas traz benefício à saúde. Essa lucrativa crença sobrevive ao longo de décadas. No entanto, todos os grandes ensaios clínicos demonstram que vitaminas não previnem câncer, nem doença cardiovascular. Não servem para nada, a não ser para dar lucro.

Acima usei o exemplo de homens acreditando que a dança influenciava na probabilidade de chuva. Isto parece absurdo, o que nos faz pensar que naquela época éramos muito mais ingênuos. Mas pensando bem: qual a diferença entre esta crença (dança-chuva) e a crença de que a posição dos astros no exato momento do nascimento de uma pessoa vai influenciar nos acontecimentos de toda uma vida? Qual o pensamento mais absurdo? Os dois exemplos me parecem desfrutar do mesmo grau de realismo fantástico, os dois representam crenças não comprovadas por trabalhos que utilizam paradigmas da metodologia científica contemporânea. Seria fácil e interessante realizar um estudo de coorte prospectiva, multicêntrico, avaliando o valor preditor de informações astrológicas. Por que será que isso não é realizado?

Esta comparação mostra que nossa mente hoje em dia aceita o absurdo de forma semelhante à mente de nossos ancestrais há milhares de anos atrás. É o fenômeno da mente crente.

Por outro lado, em relação a coisas como astrologia, há um atenuante. Neste caso, as pessoas não estão comprando astrologia achando que isto é ciência. Isto é bastante diferente de um cliente recebendo aconselhamento médico, situação na qual o coitado acredita que a conduta recomendada é algo estabelecido cientificamente. Astrologia não é algo que se compra sob a premissa de que a atividade tem comprovação científica. Está mais para religião, crença ou fé, e como diz o ditado popular, “religião não se discute”.

Por outro lado, quando falamos de atividade profissional em serviços de saúde, a coisa fica mais séria: “vender” um falso benefício ou um benefício não devidamente estudado (como se fosse algo comprovado) se aproxima da desonestidade. Ou pelo menos é ignorância do profissional que aceita presunções sem questionamento.

O maior exemplo é a homeopatia. Do ponto de vista do pensamento científico moderno, não há lógica alguma: Para curar um problema, nós precisamos administrar uma substância que cause este mesmo problema. Segunda regra, antes de administrar nós devemos diluir tanto essa substância que não sobre nenhuma molécula na solução. Desta forma, a solução (água) terá um efeito curativo e quanto mais diluído, melhor. À luz da ciência do século XXI: claro que não, isso é ridículo. Mas de onde veio uma idéia tão estranha. Dá para explicar, essa idéia foi criada pelo médico alemão Samuel Hahnemann em 1796, época em que a medicina parecia mais uma fábrica de horrores. Fazer nada muitas vezes era melhor do que as terapias propostas na época. 

Em segundo lugar, está comprovado cientificamente que homeopatia não possui efeito ativo além do placebo. Portanto, não se pode vender isso como uma conduta médica. Seria aceitável apenas se isso fosse classificado como uma atividade religiosa, espiritual. Aquele tipo de coisa que não precisa ser tratado pela ciência moderna. 

Se quiser considerar homeopatia como ato médico, esta terá que passar pelo mesmo crivo das terapias clássicas. O crivo científico, comensaios clínicos de fase I, II e III. Do contrário, estará mais para religião ou fanatismo.

Na história médica recente, várias condutas mitológicas foram aplicadas a pacientes críticos, sendo abandonadas quando ensaios clínicos apropriados mostraram ausência de benefício ou até mesmo malefício: terapia de reposição hormonal para prevenção cardiovascular na mulher menopausada, levosimedan na ICC descompensada, Xigris no choque séptico, controle intensivo da glicemia, transfusão saguínea liberal, uso de cateter de swan-ganz, apenas para citar alguns.

Como disse o historiador Richard Gordon, “A história da medicina é, em grande parte, a substituição da ignorância por mentiras.”

O Prejuízo do Fanatismo

Pagamos um preço alto pelo fanatismo médico e esta é a razão de evitarmos este tipo de postura. Abaixo enumero os principais custos da prática não embasada em evidências.

Primeiro, podemos fazer algo maléfico sob a crença de benefício. A incerteza existe para os dois lados, por isso que a análise estatística dos trabalhos é sempre bicaudal.Quando não sabemos se algo é benéfico, não sabemos também se é maléfico. Os exemplos da terapia de reposição hormonal, do tratamento agressivo da glicemia em pacientes críticos ou da transfusão sanguínea liberal são condutas que se provaram maléficas no final das contas.

Segundo, ao focar em um tratamento complexo e inútil, desfocamos de condutas benéficas, que fariam muita diferença se fossem corretamente aplicadas. Inúmeras publicações evidenciam grandes lacunas entre a comprovação do benéfico e a correta aplicação destas condutas. Portanto, antes de adotar condutas fantásticas e não comprovadas, poderíamos nos preocupar com a qualidade assistencial. Gerenciamento de risco e adoção de protocolos sistematizados trazem a efetividade (mundo real) mais próxima da eficácia demonstrada nos ensaios clínicos.  Há razões para acreditarmos que a correta implementação do que já sabemos tem maior impacto potencial do que a invenção de novos tratamentos, os quais usualmente possuem NNT modesto.

Terceiro, um tratamento de eficácia não comprovada pode não fazer mal à saúde do paciente, mas pode causar sofrimento sem a garantia de benefício. Amigdalectomia foi realizada de forma indiscriminada na década de 70 (eu fui uma dessas crianças). Não sai sequelado, porém me lembro que não foi muito agradável o internamento, o medo que senti da cirurgia, o pós-operatório. Só valeu mesmo por alguns dias livres da escola.

Quarto, o custo financeiro. Quanto se gastou com Xigris desnecessariamente? Muitas dessas novas terapias têm alto custo, gerando grande prejuízo ao sistema de saúde.

Quinto, o prejuízo científico. É o fenômeno de medical reversal, termo que ilustra como o conhecimento científico muda a toda hora, em um vai e vem incessante, uma hora a coisa é boa, daqui a pouco já não é mais. Muito acreditam que isto ocorre porque a ciência evolui rapidamente, porém a verdade é que as idéias são criadas de forma precipitada, sem a evidência científica adequada. São verdades criadas sob alicerces tão fracos que qualquer vento que passa as derruba. 

Isso causa desorganização no processo de acúmulo do conhecimento científico, confundindo os médicos em relação à verdade científica. Embora criados sob fracos alicerces, certas coisas são tão repetidas que passam a se tornar verdade no consciente coletivo. “Uma mentira repetida muitas vezes vira verdade.” Estes mitos são tão consolidados pela repetição, que evidências científicas demonstrando falta de benefício não são suficientes para derrubar tais falsos paradigmas. Por este motivo que os médicos continuam abrindo tardiamente artérias em paciente com infartos instalados, continuam fechando forâmen oval patente, continuam fazendo angioplastias em pacientes com isquemia silenciosa, mesmo com a demonstração de que nada disso tem benefício.

Reflexão sobre a Medilândia

Reconheço que o discurso que aqui faço não é sedutor. Imaginem um profissional de educação física sendo entrevistado por Ana Maria Braga em seu programa matinal e, ao ser perguntado sobre benefícios cardiovasculares, responder que não há comprovaçãode que exercício físico previne infarto. E ainda mais, dizer que exercício físico não reduz peso, nem pressão arterial, nem colesterol, de acordo com ensaios clínicos randomizados. Na verdade, esta crença vem da ilusão criada por efeitos de confusão de estudos observacionais. Se a resposta fosse honesta e acurada, o programa perderia audiência, o profissional perderia clientes e nunca mais seria convidado para aparecer na Globo. Nada sedutor.

Porém o que temos que perceber é que a verdade não existe para ser sedutora. Por acaso, quando estamos a seduzir uma mulher (ou um homem), somos totalmente transparentes? A fantasia, esta sim, é apaixonante. Esta paixão é adequada quando estamos em lugares como Disneylândia. Por outro lado, é inadequada quando estamos no consultório médico ou à beira do leito de um paciente. Nestas situações, não podemos adotar o paradigma da Disneylândia. Não podemos adorar a medilândia.

No âmbito espiritual, a fé pode ser benéfica. Seja por efeito psicológico, seja porque de fato energias cósmicas podem vir a nos beneficiar. Sendo assim, ter fé pode ser uma boa opção e dependerá da escolha de cada um. Por outro lado, no âmbito profissional, não podemos ser fanáticos, não temos este direito.

Em algum momento, temos que fazer esta reflexão e decidirmos entre duas opções. A primeira é a opção por uma postura equilibrada, pouco emotiva, adotando condutas demonstradas cientificamente. A segunda opção é pelo fanatismo, optando por condutas médicas embasadas em fantasia. Qual destas duas opções nos parece mais adequada?

É a escolha entre medicina baseada em evidências e medicina baseada em fantasia (medilândia). 

Ensaio sobre a Cegueira

$
0
0


Embora a visão seja um atributo essencial à percepção da realidade, a cegueira exerce importante função científica e clínica. Função científica, como parte da metodologia de trabalhos científicos. Função clínica, na medida em que o pensamento diagnóstico deve levar em conta certas variáveis, porém deve fazê-lo de forma cega em relação a outras variáveis confundidoras. Explicaremos nesta postagem o valor clínico da cegueira, o qual é em geral pouco compreendido.

Um dos mais influentes pensadores, Immanuel Kant (século XVIII), nos trouxe a perspectiva de que a imagem que construímos do mundo a nossa volta não se baseia apenas no que existe, mas também do que nós criamos mentalmente. Ou seja, nossa percepção da realidade resulta da interação entre visãoe mente. E quando falo em visão, me refiro aos sentidos em geral.

Realidade = sentidos + mente.

A neurociência confirma a visão de Kant, demonstrando cientificamente que os sentidos não são suficientes para construir uma noção completa da realidade. Portanto, faz-se necessário que ações mentais completem as lacunas deixadas pelos sentidos. Este é um processo mental necessário, porém esta dependência da mente na construção da realidade torna subjetiva a percepção desta mesma realidade, nos sujeitando a armadilhas de nosso inconsciente. Estas armadilhas surgem quando interpretamos nossos sentidos com base em pré-conceitos da realidade.


O Raciocínio Clínico

Analisemos o raciocínio diagnóstico. Este é feito com base em um conjunto de informações que devem se somar, nos convencendo de que o paciente é portador de uma dada condição clínica. Neste caso, para que uma nova informação tenha valor incremental à informação prévia, estas duas devem ter caráter independente.

Por exemplo, eu posso desconfiar (suspeita diagnóstica) que um indivíduo está com um quadro de insuficiência cardíaca com base da história clínica (primeira informação). Em seguida, este paciente é examinado e ausculta-se uma terceira bulha (segunda informação). A informação da presença da terceira bulha deve incrementar nossa desconfiança de que o paciente tem insuficiência cardíaca. No entanto, percebam que a terceira bulha só vai incrementar a suspeita de insuficiência cardíaca, se esta segunda informação for obtida de forma independente da primeira. Do contrario, ela é redundante, não incrementa.

Informações obtidas de forma independente possuem caráter confirmatório muito mais forte do que informação obtidas de forma dependente. Se a ausculta da terceira bulha é realizada com o conhecimento de uma forte suspeita de insuficiência cardíaca, a dependência das duas informações fazem da terceira bulha um informação redundante à primeira. Ou seja, corremos o risco de não estar confirmando a suspeita, apenas repetindo o mesmo conceito prévio, de forma não incremental. 

Esta é a diferença entre informação redundante e informação incremental.

Faz sentido, não?

Mas por que auscultar o paciente sob conhecimento da suspeita de insuficiência cardíaca torna a terceira bulha redundante? A resposta está em nosso inconsciente. Observem que ausculta é algo muito subjetivo, mais ainda no paciente taquicárdico. Ao crer que um paciente tem insuficiência cardíaca, nossa percepção da presença da terceira bulha fica fortemente influenciada. E é impossível controlar a ação do inconsciente. 

O exemplo da terceira bulha é uma forma de mostrar a influência de uma informação prévia na leitura de uma nova informação. No entanto, na prática clínica é difícil dissociar a história do exame físico, pois ambas são feitas pela mesma pessoa. Nos resta fazer um esforço consciente para auscultar tentando não se impressionar pela história clínica.

Por outro lado, o que aqui discutimos tem bastante aplicação na leitura de exames complementares, pois estes são usualmente realizados por médico diferente do clínico do paciente, sendo possível que a leitura do exame seja cega. Quando o exame complementar é lido sem o preconceito gerado pela noção do quadro clínico, seu valor incremental se torna otimizado.


O Erro Histórico

A despeito da lógica apresentada no raciocínio acima, historicamente os médicos são treinados a considerar o quadro clínico na leitura dos exames. É isso que chamo de erro histórico do treinamento médico, o qual provoca heurísticas na interpretação clínica, tornando-a menos acurada.

Erradamente, os médicos pensam que devem saber o quadro clínico do paciente antes de ler um exame de imagem, por exemplo. Pensam que isso aumenta a probabilidade de acerto. Mas o que aumenta é a probabilidade do exame concordar com a suspeita clínica, o tornando redundante. Assim, o exame fica mais como um algo confirmatório de uma suspeita, que pode estar certa ou errada.

Com isso não estou dizendo que a clínica não é importante, nem muito menos negando a tradicional frase “a clínica é soberana”. Mas a clínica deve ter uma função diferente da situação descrita acima. A falta desta percepção provoca o tal erro histórico. Vamos então esclarecer como a clínica deve ser utilizada.

Em primeiro lugar,o valor da clínica está em apresentar ao médico realizador do exame o conhecimento do motivo de sua realização.Ao ler uma tomografia de abdômen, é útil que o radiologista saiba que o objetivo do exame é pesquisar apendicite, pois ele vai olhar o apêndice de forma mais atenta, em meio a todas as estruturas abdominais. No entanto, ele não deve saber a probabilidade clínica de apendicite: baixa, média ou alta. Pois se ele souber que é uma alta probabilidade, tenderá a descrever como espessado apêndices que em outras circunstâncias nem chamariam a atenção.

Percebam a diferença entre saber o motivo do exame versussaber a probabilidade pré-teste do diagnóstico. Não podemos confundir os dois.

Um bom exemplo são os exames não invasivos de pesquisa de isquemia miocárdica. Digamos, cintilografia miocárdica. Ao receber um paciente para estudo da perfusão miocárdica, já está implícito o motivo do exame, claro que é pesquisa de doença coronária. Daí o médico não precisa saber mais nada, do contrário ele tenderá a ver isquemia nas subjetivas imagens cintilográficas de pacientes cuja suspeita é forte ou desconsiderar certos achados em pacientes com fraca suspeita. Percebam que neste caso o exame perde valor incremental, se aproximando de uma postura redundante em relação do quadro clínico. No entanto, é comum que o médico, antes de interpretar a imagem, procure saber se o paciente tem dor típica e observe cuidadosamente o eletrocardiograma de esforço do paciente. Este equívoco mutila em grande parte o valor da imagem, cuja interpretação passa ser influenciada por informações de menor acurácia, como sintomas e teste ergométrico. Principalmente quando as imagens tem caráter intermediário, o que é muito comum.

Correto é o médico interpretar a imagem evitando informações prévias que gerem preconceito mental. Evitando a influência do inconsciente.

E onde fica o quadro clínico então, desprezado? De jeito nenhum, pois no raciocínio probabilístico (já muito comentado neste Blog), o medico do paciente fará o cálculo da probabilidade de doença, com base na probabilidade pré-teste e no resultado do teste. Isso é o raciocínio Bayesiano, o qual pressupõe que as duas informações tenham caráter independente.

Desta forma, a segunda utilidade do quadro clínico está no cálculo da probabilidade pré-teste, que cabe ao médico do paciente.  De fato, a clínica é muito importante.

Assim, há duas funções do quadro clínico. 

Em primeiro lugar, o médico operador deve saber o objetivo da solicitação, quando se trata de um exame que avalia múltiplas variáveis, como o ecocardiograma, por exemplo. Neste caso, a técnica correta é realizar o exame inicialmente cego e após ter criado sua imagem mental da realidade do paciente, procurar saber o motivo do exame. Isto para confirmar se ele deu devida atenção às valvas quando a suspeita for endocardite; ou se ele olhou direito o septo interventricular quando a suspeita for CIV. 

Em segundo lugar, o médico que receber o resultado do exame deve fazer o raciocínio probabilístico, o qual considera do quadro clínico (probabilidade pré-teste). 

Desta forma, fica clara a importância da clínica, a qual não deve ser confundida com permissividade da influência do inconsciente na leitura de uma informação. Para evitar a força do inconsciente, devemos utilizar da cegueira.


Por que Pensamos Errado ?

Devemos analisar os motivos que distanciam o pensamento médico do valor da cegueira. Estes motivos também residem em nosso inconsciente.

Como já comentado em nossa última postagem, nossa mente tem um tropismo especial por informações positivas. Nos sentimos melhores médicos quando damos um laudo positivo. Este tropismo ocorre em detrimento da importância de laudos negativos. Lembremos que um exame acurado deve ter duas propriedades, sensibilidade (encontrar os doentes) e especificidade (encontrar os saudáveis). Em nossa mente, prevalece o valor da sensibilidade sobre a especificidade. Não queremos que nenhum achado passe desapercebido por nossos experientes olhos, enquanto nos preocupamos menos com as consequências de uma falsa afirmação. Desta forma, o ecocardiografista quer saber se o paciente tem alta probabilidade clínica de TEP, pois assim seu exame será mais capaz de encontrar uma mínima dilatação do ventrículo direito (verdadeira?); o ecocardiografista quer saber se o paciente teve um infarto, para que nenhuma alteração segmentar deixe de ser descrita, mesmo hipocinesias discretas (verdadeiras?). Aqui uso exemplos de ecocardiografia, não por achar que esta especialidade é mais equivocada do que as demais, mas porque fazendo este exame em minha prática clínica, tornando mais fácil achar exemplos. Porém enfatizo que isso não é um fenômeno limitado à ecocardiografia. É geral.

Além do tropismo pelo positivo, quando o laudo de um exame concorda com a pensamento do clínico, ficamos todos de acordo e isto é agradável. A hipótese diagnóstica foi confirmada, parece que tudo faz sentido. O médico que realiza o exame fica como um ótimo médico aos olhos do clínico que suspeitou da doença, pois é agradável ter sua inteligente hipótese confirmada. Sinto nitidamente a decepção na expressão do intensivista quando digo que não há sinais de embolia pulmonar no ecocardiograma. 

É muito interessante e peculiar como o pensamento médico é influenciado por nossas emoções. Neste momento entra um novo fator, a paixão pelo diagnóstico.


A Paixão pela Hipótese Diagnóstica

Nós médicos, intrinsecamente vaidosos, nos apaixonamos por nossas hipóteses diagnósticas. Isto provoca o fenômeno de ancoragem, predispondo a mais heurísticas. 

Ocorre da seguinte forma: ao fazer uma hipótese diagnóstica, buscarei de forma apaixonada (paixão carece de razão) fatos que confirmem minha hipótese e inconscientemente darei menos importância a fatos que falem contra esta hipótese. Mais uma vez, a valorização do positivo em detrimento do negativo.

Vejam como acontece. De forma aparentemente perspicaz, faço a suspeita original de que a dispnéia é por embolia pulmonar. A partir daí vou procurar dados que confirmem minha ideia. Vejo uma subjetiva oligoemia no Rx de tórax. Embora este seja um dado de baixa acurácia, supervalorizo a informação, desconsidero os dados negativos e passo a considerar o caso como provável embolia pulmonar. Chamo o ecocardiografista e digo a ele o que estou pensando. Este não encontra hipertensão pulmonar, nem disfunção de ventrículo direito, mas fica na dúvida se este ventrículo está discretamente dilatado. Considerando minha forte suspeita, ele prefere relatar a leve dilatação, praticamente confirmando minha inteligente hipótese de embolia pulmonar. Fico feliz em estar no caminho certo e solicito uma angiotomografia, que vem negativa. O paciente idoso terminou em uso de contraste, desnecessário, pois caso todos os dados (positivos e negativos) fossem considerados (escore de Wells, por exemplo) veríamos que seria baixa a probabilidade de embolia. 

Observem que a falta de cegamento, nos fez encontrar certos dados (oligoemia, dilatação discreta do ventrículo direito) que provavelmente não seriam descritos na ausência de um pensamento preconceituoso. A paixão pelo diagnóstico nos torna tendenciosos, a cegueira nos torna isentos.

Repito assim a frase acima: é muito interessante e peculiar como o pensamento médico é influenciado por nossas emoções. 

Desta forma, o fenômeno de ancoragem ocorre quando nós procuramos dados para ancorar nossa crença diagnóstica. Isto é muito comum. Mesmo quando é impossível a cegueira completa, devemos tentar evitar esse fenômeno.



O Pensamento Estatístico

Estatisticamente, informações para serem complementares precisam ser independentes. Por este motivo, um escore diagnóstico ou prognóstico deve ser criado apenas por variáveis que tenham associação com o desfecho, independente das outras co-variáveis. Apenas os preditores independentes na análise multivariada devem fazer parte de um modelo probabilístico (escore), do contrário as variáveis do modelo serão redundantes e não incrementais. Percebam como a estatística nos ajuda a entender a importância da cegueira na avaliação de dados diagnósticos incrementais.

Erro Tipo I versus Erro Tipo II

O equívoco de priorizar sensibilidade ao invés de especificidade se torna mais claro quando percebemos que o erro de afirmar algo falso (“mentir”) tende a ser pior do que deixar de afirmar uma verdade (“omitir”). Ao afirmar algo falso, umas cascata de consequências toma parte da realidade; por outro lado, omitir uma verdade não gera grandes consequências, as condutas permanecem como estão. Salvo em situações de extrema gravidade onde a omissão é grave (nessas situações o quadro clínico é geralmente exuberante), na maioria das vezes o falso positivo é pior do que um falso negativo. Além disso, na presença de uma alta probabilidade pré-teste, um exame negativo não afastaria a doença, pois o médico de raciocínio Bayesiano pediria um segundo teste.

Estatisticamente, o parágrafo acima guarda relação com os erros aleatórios. Voltando à estatística, toleramos muito menos o erro tipo I, do que o erro tipo II. Em ciência, aceitamos um probabilidade de apenas 5% em afirmar uma falsa associação devido ao acaso (erro tipo I), enquanto aceitamos um probabilidade de 20% em não encontrar uma associação verdadeira pela falta de poder estatístico (erro tipo II). Essa diferença de tolerância reforça o quando mais grave é o falso positivo em relação ao falso negativo.


O Pensamento Médico

Esta apologia à cegueira pode causar estranheza a alguns. Isso decorre de omissões históricas na formação do médico, o qual não é treinado para evitar heurísticas e vieses em seu pensamento. Medicina parece ser interpretada como uma profissão cujo talento é suficiente, nos deixando a mercê de nossa intuição no aprendizado da maneira de pensar. Devemos discutir e aprimorar as técnicas de pensamento, isso vai muito além do talento. Dizem que um músico de técnica refinada e muitas horas de treinamento é melhor do que um músico talentoso com poucas horas de treinamento. Precisamos aprender e treinar a correta forma de pensamento médico.

O estudo do pensamento médico é parte essencial da medicina baseada em evidências, pois sem saber pensar é impossível aplicar corretamente as evidências científicas. Os exemplos clínicos discutidos nessa postagem devem ser norteados pelo pensamento diagnóstico Bayesiano, que requer evidências científicas de acurácia dos métodos, modelos de probabilidade pré-teste validados por artigos científicos e finalmente a noção de que as partes integrantes desse raciocínio devem ser adquiridas de forma independente. Sem o correto pensamento médico é impossível aplicar estas evidências científicas da forma certa, o que faria desaparecer a medicina baseada em evidências.

Portanto não basta interpretar criticamente evidências científicas de forma crítica. É necessário saber aplicar as evidências de qualidade, nessa hora entra o julgamento clínico. Porém o julgamento clínico deve ser feito de forma científica, correta, pensada. Por este motivo, o estudo do pensamento médico é parte integrante da medicina baseada em evidências.

A importância da cegueira tem sido negligenciada na prática clínica. Este é apenas um dos exemplos de necessidade de evolução do pensamento médico. A evolução da medicina no presente século não dependerá tanto de tecnologia, dependerá muito mais do aprimoramento da forma de pensar.

Saber olhar quando devemos ver ou desviar o olhar quando devemos nos cegar faz parte da vida cotidiana e deve ser parte integrante da técnica do pensar médico. O bom olho clínico é o que sabe se fechar e se abrir nos momentos certos.

O Movimento da Ruas e a Medicina Baseada em Evidências

$
0
0


Nessa época de indignação que vinha adormecida há muito tempo, foi bonito ver a manifestação dos médicos ontem pelo país a fora. Cobramos melhores condições de trabalho e mostramos que não é com soluções fictícias que se resolverá o problema da saúde no Brasil. As soluções apresentadas pela presidente deste país evidenciam claramente a desordem que habita a mente presidencial, as virtuais propostas representam mais coisa de marqueteiro do que de estadista. De fato, Dilma está longe de ser um estadista e esse momento requer um desses. De médicos cubanos a “20.000 unidades de atendimento médico” essas são as soluções até então apresentadas.

Qual a relação da medicina baseada em evidências com esse momento que o país está vivendo? Além de ir às ruas para exigir condições melhores de trabalho, talvez os médicos possam usar esse momento para refletir se a responsabilidade está toda nos governantes ou se tem alguma que seja nossa também. Ou somos apenas vítimas?

É aí que entra a medicina baseada em evidências, pois além de propor que decisões médicas sejam baseadas em análise científica voltada para eficácia e segurança, o pensamento vai ao encontro da racionalização dos gastos médicos. Deveríamos pensar de forma sistemática em eficácia, efetividade e eficiência (custo-efetividade). Perceberíamos que a melhoria não depende apenas do governo, mas também de como nós, médicos, “administramos” os recursos oferecidos. Senti falta de algunscartazes com esse tom de amadurecimento em relação a nossas próprias responsabilidades. Desta forma, seguindo o estilo presidencial, apresentarei cinco propostas baseadas em evidências, que representam um pouco que podemos fazer por um sistema de saúde mais eficiente.

1.  Utilizar do princípio mais básico da medicina baseada em evidências:uma conduta terapêutica deve ser instituída como rotina quando houver comprovação científica de seu benefício (exceção às situações de plausibilidade extrema). Neste quesito, devemos evitar o fanatismo por condutas nãodemonstradas e, de forma responsável, implementar rotinas com base no demonstrado. Assim, economizaríamos bilhões na medida em que coisas como Xigrisnão seriam implementadas antes da hora. Cada especialista pode rapidamente identificar os inúmeros exemplos de procedimentos de alto custo que foram utilizados por muito tempo apenas para depois entendermos que aquilo de nada valia. Isso é rotina na prática médica, trazendo prejuízos financeiros, clínicos (quando a conduta na verdade é maléfica) e científicos (criação de falsos paradigmas, difíceis de derrubar retroativamente).

2.  Evitar a cultura de exames inapropriados. Grande parte dos exames que solicitamos não vão ajudar o raciocínio diagnóstico (atrapalham), nem muito menos melhoram o desfecho do paciente. No entanto, vivemos e propagamos a cultura dos exames, a cultura do check-up. Vejam o caso do teste ergométrico, em que os médicos reclamam tanto o pagamento de míseros 50 reais pelos planos de saúde. Estudo realizado por nosso grupo (tese de Antônio Marconi, de Petrolina) mostrou que 85% das solicitações de testes ergométricos para pesquisa de doença coronária em sua região são inapropriadas, ou seja, testes realizados em pacientes assintomáticos ou com baixa probabilidade pré-teste. Essa amostra tinha tanto pacientes do SUS, como de convênio. Ora, se a gente banaliza tanto um exame, nossa remuneração fica banalizada também, claro. Um exame que praticamente todo adulto faz anualmente, precisa ser muito barato mesmo. Por que não sentamos na mesa e negociamos? “Vou pedir menos exame desnecessário e você aumenta o valor do exame.” Isso sem falar na peregrinação que um paciente do SUS tem que fazer quando um médico “caneta” a solicitação inapropriada de um teste ergométrico. Peregrinação esta que muitas vezes termina em uma clínica popular, com o paciente pagando (desnecessariamente) pelo exame, pois o SUS não tem (nem nunca terá) condição de fazer tanto teste, em tanta gente. Vai até de encontro ao Ato Médico, pois não tem médico para fazer teste em 100% dos adultos brasileiros. Vai acabar tendo que importar médico de cuba mesmo. Estão vendo a incoerência?

3.  Evitar overdiagnosise overtreatment: muitos dos exames desnecessários acabam sendo positivos (verdadeiramente), mas isso não significa que haja necessidade de tratamento. Angioplastia está indicada em paciente assintomático com entupimento de 75% de uma de suas artérias? Depois de um PSA (contra-indicado como exame de triagem), vem a biópsia, que muitas vezes dá positiva para uma adenocarcinoma localizado, em paciente assintomático. Quase sempre resulta em prostatectomia. Estamos no caminho certo ao diagnosticar e tratar pseudo-doenças? Isso merece uma reflexão.

4.   Pensar em custo-efetividade: mesmo terapias de comprovada eficácia, devem ser analisados sob o crivo da magnitude de seu benefício. Utilizemos o paradigma do NNT. Benefícios verdadeiros, porém de baixo impacto, pouco mudam a vida do paciente. E às vezes são de alto custo. Mesuremos o benefício e avaliemos o custo deste benefício. Há terapias de alto custo (novidades), cujo impacto devem ser analisado na razão de seu benefício. Sejamos responsáveis ao propor que o SUS passe a oferecer stents farmacológicos. Vela a pena mesmo? Onde chegaremos? Precisamos entender melhor o pensamento de custo-efetividade.

5. Propagar o desenvolvimento do pensamento científico: esta deve ser ferramenta crucial para o médico. Nos livra do lobby da indústria farmacêutica, de interesses pessoais, da excessiva hierarquia de conhecimento, a qual inibe o desenvolvimento de nossa forma de pensar. Ciência se desenvolve com base no debate informal, troca de idéias. Em nossos congressos, pouco discutimos ideias, pouco reavaliamos nossos paradigmas. Nos limitamos a repetir o que é dito tradicionalmente, repetir o texto de guidelines. Assim não há risco de discordância, porém corremos o risco de estagnação. Ciência é democracia.

Temos poder de modificar e melhorar a qualidade da saúde pública. E também da saúde  complementar, por que não? Embora nosso aprimoramento não seja suficientepara resolver as questões, este é necessário. Sem a racionalização da medicina, as mudanças reivindicadas não serão resolutivas. Há exemplos de países desenvolvidos com medicina socializada, que aplicam os recursos de forma muito mais racional do que nosso pobre país. Precisamos mudar nossa cultura. Devemos exigir desse governo mediano, como fizemos ontem. Mas podemos também oferecer nossa contra-partida. 

LOOK AHEAD

$
0
0


Recentemente, foi publicado no New England Journal of Medicine o estudo LOOK-AHEAD, o qual demonstrou ausência de benefício clínico do exercício físico e dieta para perda de peso em pacientes diabéticos. Será que é verdade?

Citamos este estudo na polêmica postagem O Politicamente Correto e as Recomendações de Hábitos deVida. Naquele momento, o resultado do LOOK-AHEAD estava anunciado, porém o artigo não havia sido publicado na íntegra. Agora podemos fazer a avaliação deste trabalho, sendo uma boa oportunidade para discutir como analisar veracidade de estudos negativos.

O resultado do LOOK-AHEAD vai de encontro a uma forte crença: exercício e dieta para perda de peso trazem benefício clínico. Esta crença é tão forte que a comunidade médica nem mesmo achava que este trabalho seria necessário, tal a “certeza” do benefício destas intervenções. Agora com o artigo publicado, devemos dissecar a evidência. Neste caso, faremos uma análise ainda mais detalhada do que o habitual, devido à surpresa do resultado negativo. Quem achar cansativo, simplesmente acredite na veracidade do trabalho, pule as próximas três partes e leia a parte final, que fala do conforto cognitivo.  Mas quem quiser aproveitar para revisar como se avalia um estudo negativo, leia tudo.

Um estudo pode ser negativo por dois motivos: de fato pode não haver benefício da conduta testada; ou pode ser negativo devido a erros: sistemáticos (vieses) ou aleatórios (acaso). Temos que diferenciar as duas circunstâncias. O resultado de qualquer estudo deve ser visto com ceticismo até que se aplique a análise sistemática da veracidade da evidência. Ceticismo é bom, pois nos deixa mais atentos. 

Erros Sistemáticos (vieses)

Que falhas metodológicas poderiam fazer deste um estudo falso negativo? Observem na equação de um ensaio clínico que de um lado há a intervenção, do outro lado há o desfecho.

INTERVENÇÃO  => DESFECHO

Erros podem acontecer na aplicação da intervenção ou aferição do desfecho.

A intervenção foi descrita pelo protocolo do estudo como “intensa”, caracterizada por reuniões de aconselhamento toda semana, durante os 6 primeiros meses. A dieta recomendada tinha 1.200 a 1.800 calorias/dia e o exercício 175 minutos de atividade moderada-intensa por semana. Parece um bom planejamento, mas o que temos que questionar é se a intervenção promoveu as alterações antropométricas e fisiológicas que teoricamente resultariam em benefício clínico. Esta análise mostra que de fato os pacientes perderam 8.6% de peso no primeiro ano, tal como havia sido planejado pelo estudo. Mais do que isso, sustentaram boa parte dessa perda de peso aos longos dos 13 anos de estudo, terminando com 6% de peso a menos do que no início do estudo. Isso parece pouco, 6-8% de redução em população de 100 Kg em média. De fato, não é uma perda de peso que deixa ninguém esbelto, mas é o que se consegue com dieta; e é dieta que está sendo aqui testada. Inclusive, essa perda de peso supera o que se verifica em estudos de droga para obesidade. Por exemplo, a “aclamada” Sibutramina reduziu 4.5% do peso no estudo SCOUT. Desta forma, o estudo conseguiu testar uma intervenção que de fato reduziu peso; ou melhor reduziu o peso que dieta consegue reduzir. Portanto, não houve viés de aplicação da intervenção.

E quanto ao exercício? Este também foi eficaz em promover mudanças fisiológicas, tendo gerado ganho de capacidade funcional, medido em METS.

Ainda dentro da análise da intervenção, é importante verificar se o grupo controle de fato fez o papel de controle. Um bom controle tem que ser diferente da intervenção, gerando um contraste que provoque diferença de desfecho entre os grupos. Por questões éticas, o grupo controle também recebeu aconselhamento, em menor intensidade. Isso promoveu perda de peso progressiva ao longo dos anos, reduzindo um pouco o contraste entre os grupos. Mas isso não foi suficiente para fazer o contraste desaparecer: em média, ao longo dos anos de estudo, a diferença de peso entre os grupos foi 4 Kg, o que se considera significativo em estudos que avaliam perda de peso com dieta. Na verdade, em estudos de hábitos de vida, é esperado que o grupo controle tenha algum tipo de melhora simplesmente pela motivação de estarem no estudo. O que temos que avaliar é se essa melhora foi grande o suficiente para invalidar o estudo. Aqui não parece ter sido o caso.

Desta forma, quando à intervenção não identificamos vieses preocupantes.

E quanto ao desfecho? Este foi um desfecho composto apenas de eventos duros, objetivos e de importância clínica: morte, infarto e AVC. Isto torna improvável a possibilidade de viés de aferição dos desfechos. Mesmo em estudos abertos como o LOOK-AHEAD (não poderia deixar de ser, por questões óbvias), estes tipos de desfechos raramente sofrem erros de aferição, pois são muito objetivos. Além disso, os autores tiveram o cuidado de tornar cega a adjudicação (auditoria) destes desfechos, evitando que estes pesquisadores soubessem da alocação dos pacientes. Mesmo assim, um eventual viés de aferição, se ocorresse, possivelmente seria a favor do grupo intervenção, visto que a noção de que um paciente experimentou perda de peso e praticou atividade física nos deixa mais propícios a acreditar em melhora prognóstica para estes indivíduos.

Uma virtude deste estudo é o tempo de follow-up, cuja mediana foi de 10 anos. Usualmente os estudos de prevenção primária têm em torno de 5 anos de segmento (vide estatinas, anti-hipertensivos). Por se tratar de intervenções relacionadas a hábitos de vida, poderia ser que os resultados demorassem mais a aparecer. Portanto, os autores tiveram o cuidado de realizar um longo follow-up, quase sem precedentes em estudos de intervenção. Isso dá mais consistência ao resultado negativo, que não pode ser atribuído a tempo insuficiente para se detectar benefício clínico.

Portanto, aqui temos um estudo confiável quanto à intervenção e quanto à aferição dos desfechos.

Mas ainda analisando erros sistemáticos, resta outra possibilidade: o viés de confusão, que ocorre quando os dois grupos são diferentes e essas diferenças podem provocar heterogeneidade de desfechos. Isso pode explicar o resultado consistente dos estudos observacionais, que demonstram associação entre exercício físico e menor risco cardiovascular. Quem faz exercício é diferente de quem não faz (menos doentes, mais cuidadosos com a saúde) e essas diferenças podem ser as verdadeiras causas do melhor prognóstico destes pacientes. Como solucionar? Fazendo ensaios clínicos randomizados, pois a “mágica da randomização” garante que os grupos sejam semelhantes.

Paradoxalmente, as pessoas não atentam muito para a grande necessidade de ensaios clínicos randomizados e insistem em citar estudos observacionais como evidências definitivas do benefício de hábitos de vida, como é o caso do exercício. São exatamente os hábitos de vida que mais precisam de estudos randomizados, pois estes hábitos trazem consigo várias características demográficas, clínicas, antropométricas, sociais, econômicas de seus praticantes. Portanto, às viúvas do exercício ou perda de peso, por favor, não critiquem o LOOK-AHEAD citando estudos observacionaispositivos. O potencial viés do desenho observacional é maior do que qualquer outro.

O LOOK-AHEAD é um estudo randomizado e como podemos perceber na tabela de características clínicas, as duas amostras (intervenção e controle) são idênticas.

Porém ainda há um detalhe que normalmente não se percebe e não é considerado na análise de fatores de confusão. Às vezes, os pacientes são semelhantes no momento basal, mas ao longo do estudo se tornam diferentes.  É o que resolvi denominar de fator de confusão prospectivo. Será que o grupo controle foi melhor tratado com drogas por uma reação compensatória dos médicos para com os pacientes que não foram randomizados para a intervenção? Seria um viés de desempenho, típico de um estudo aberto. De fato, houve maior freqüência do uso de estatinas e anti-hipertensivos. Isso foi o que mais me preocupou como potencial viés. Isto poderia ter feito o grupo controle menos predisposto a desfechos, anulando uma eventual superioridade do grupo intervenção. Fui atrás dos detalhes e o material suplementar do artigo traz as informações. Na verdade, a diferença de uso de estatina foi mínina (74% versus 71%), o mesmo com anti-hipertensivos (88% versus 87%).

Erros Aleatórios

Quando um estudo é negativo (não encontra associação), devemos nos questionar se isto ocorreu devido ao que se chama de erro tipo II: não encontrar uma associação que na verdade existe, devido a falta de poder estatístico. Assim, devemos começar por ler o cálculo do tamanho amostral (usualmente no final dos métodos, no item de análise estatística), observando quatro questões:

Primeiro: qual poder estatístico o autor propõe para seu estudo? Este poder deve ser de pelo menos 80%, pois a maior probabilidade de erro tipo II aceitável é 20%. Observem que a probabilidade do erro tipo II é o complemento do poder estatístico (100% - 80% = 20%). Neste quesito, nunca um autor vai propor ter um poder estatístico menor que 80% (seria um tiro no pé). Assim, geralmente o planejado é um poder de 80%, 85% ou 90%. O que pode acontecer é o autor omitir o cálculo do tamanho amostral, justamente por não ter um poder de pelo menos 80%. Isso levantaria suspeita, mas não foi o caso aqui. No LOOK-AHEAD, o poder proposto foi 80%.

Segundo: qual a diferença de desfecho entre os grupos que o autor se propõe detectar? Esse item é muito importante. Na verdade, não existe um único tamanho amostral necessário para cada estudo, pois este depende da diferença que o autor faz questão de encontrar. Quanto menor essa diferença, maior o tamanho amostral necessário, pois para detectar coisas pequenas, precisamos de uma lente grande. Aqui a lente do estudo é seu tamanho amostral. Se o autor faz questão de encontrar uma diferença pequena, seu tamanho amostral necessário grande. Se a diferença que ele faz questão de encontrar é grande, seu tamanho amostral pode ser menor. Quando digo “encontrar diferença” significo obter um valor de P < 0.05.

O que devemos analisar é se faz sentido o grau de diferença que o autor faz questão de encontrar. Ou colocado de outra forma, qual a diferença que ele tolera não encontrar. Devemos avaliar se nesta proposta o autor está aceitando não encontrar algo que seja clinicamente relevante. Idealmente, o estudo deve ter tamanho amostral para detectar as diferenças que sejam relevantes em magnitude, não necessitando demonstrar diferenças sem importância.

Neste estudo, o autor parte das premissas de que a incidência do desfecho no grupo controle seria de 2% ao ano e de que o tratamento traria um redução relativa de 18% no desfecho. Uma redução relativa de 18% em cima de uma incidência de 2% resulta em 0.4% de redução absoluta ao ano. Parece algo razoável, ou seja, ele não está tolerando que grandes reduções não sejam detectadas, pois tem capacidade de detectar 0.4% de redução absoluta. 

Terceiro: devemos agora olhar nos resultados se realmente a incidência de 2% ao ano ocorreu no estudo, do contrário o estudo não teria um numero de desfechos necessários para oferecer tal poder estatístico. Vejam nos resultados que a incidência do desfecho foi 1.9% ao ano, ficando bem próximo ao que o autor se propôs.

Observem então que a análise do poder não se resume à leitura do planejamento do estudo, mas também à leitura de se o resultado do estudo correspondeu à premissa de incidência do desfecho. Se o autor imaginou que a incidência do desfecho seria X e sua incidência foi menor, o estudo terá um poder menor do que ele planejou.

No LOOK-AHEAD a incidência ficou bem próximo no planejado. Sendo assim, podemos afirmar que o autor tinha um poder de 80% para detectar uma redução relativa de 18%, o que julgamos ser adequado.  Ou seja, o erro tipo II deixa de ser uma preocupação maior.

Quarto: por fim, devemos olhar as diferença de desfecho entre os dois grupos. Observem abaixo a curva de incidência cumulativa. É muito próxima, não há diferença alguma. A suspeita de erro tipo II faz mais sentido quando há alguma diferença que não alcançou significância estatística, o que não é o caso aqui.



Aplicabilidade e Diabetes

O resultado deste trabalho se aplica apenas a diabéticos? Já comentamos várias vezes neste Blog sobre o Princípio da Complacência. Ensaios clínicos são experimentos intensamente controlados, que utilizam de uma população-alvo restrita para prova de conceito. Uma vez este conceito demonstrado, devemos (até certo limite) permitir sua extrapolação para que uma população abrangente se beneficie. Esta conduta é respaldada, pois uma vez demonstrado um conceito, é raro que o conceito mude com a mudança do tipo de paciente. Isto porque interação é um fenômeno raro, é só verificar na análise de subgrupo dos ensaios clínicos em geral. A definição de diabetes como critério de inclusão tem sido usada em ensaios clínicos para identificar uma amostra de risco elevado, o que favorece o poder estatístico do estudo. E não porque o interesse da pergunta diz respeito apenas em diabéticos. Isso tem sido um engano, assim como o não entendimento do Princípio da Complacência tem sido talvez o mais importante equívoco de raciocínio em medicina baseada em evidências.

Desta forma, o presente estudo mostra que a intervenção não é benéfica em diabético. Quanto ao não diabético, o estudo pelo menos reduz a probabilidade de que a intervenção seja benéfica. Há alguma aplicabilidade. Pode não fechar a questão em não diabéticos, mas coloca um forte ponto de interrogação, reforçando a necessidade de que isso seja testado, antes de ficarmos afirmando benéficos não demonstrados.

Conforto Cognitivo

Embora bem desenhado e a despeito de nossa criteriosa análise, não faltarão críticas ao LOOK-AHEAD. Estas críticas serão de múltiplas ordens, e ocorrerão devido ao fenômeno de leitura seletiva, quando rejeitarmos evidências que vão de encontro às nossas crenças e abraçamos as evidências que vão ao encontro de nossas crenças.

Os psicólogos dão algumas explicações para isto e uma delas é o interessante fenômeno de conforto cognitivo. Acreditamos no que é mais confortável, pois é desconfortável ter seus valores questionados, dá trabalho de pensamento. Mudança de paradigma é sempre uma ruptura com a tradição. É mais confortável ouvir alguém falar o que já pensamos, dá menos trabalho mental, por mais monótono que isso possa ser. É interessante perceber a feição das pessoas quando falamos em público. Dá para perceber nitidamente o sorriso, a satisfação de alguém quando estamos falando algo com que a pessoa concorda, enquanto percebemos nítida mudança de expressão quando algo controverso entre em conflito com o pensamento vigente. Uma mentira repetida várias vezes vira verdade, pois se torna confortável ouvir uma idéia comum. Conforto cognitivo é um fenômeno psicológico demonstrado cientificamente. É confortável ouvir falar que exercício e dieta são condutas benéficas, é desconfortável ouvir falar o contrário.

Pode ser que uma intervenção que promova perda mais substancial de peso (dieta não consegue de forma sustentada, isso é um fato) ofereça benefícios clínicos. Nesta questão, necessitamos de ensaios clínicos randomizados a respeito do impacto de longo prazo da cirurgia bariátrica em desfechos duros, tais como os avaliados no LOOH-AHEAD. 

Na construção do conhecimento científico, devemos fazer um esforço para nos livrar do conforto cognitivo, estando abertos a novos paradigmas, mesmo que estes sejam transgressores da tradição. O rabino Nilson Bonder nos traz em seu livro “A Alma Imoral” a idéia de que transgressão promove evolução, tradição promove estagnação.E quando a transgressão é baseada em evidências (como é o caso da conclusão do estudo em questão), melhor ainda.

Neste aspecto, este trabalho tem um nome perfeito, até visionário em relação ao resultado aqui apresentado: LOOK-AHEAD. Precisamos olhar para frente, sair na zona de conforto cognitivo e nos permitir transgressões de velhos paradigmas, desde que estas sejam baseadas em evidências científicas. Assim, evoluiremos científica, filosófica e clinicamente.

O sucesso do Bahia é estatisticamente significante?

$
0
0


Sou Bahia e vibro com a terceira posição do tricolor no Brasileirão. Poderia deixar meu cérebro direito (emoção, paixão) prevalecer, argumentar que nosso time atualmente é um dos melhores e que corremos o risco de sermos campeões mais uma vez. Esse argumento não estaria errado, pois futebol é paixão. Por outro lado, este Blog é científico e serve para exercitarmos o cérebro esquerdo, racional, matemático, realista. Portanto, farei uma abordagem de torcedor estatístico.

Neste contexto, surge a seguinte questão. O Bahia está bem mesmo? Observem que o que temos neste momento não é o campeonato brasileiro inteiro, é apenas uma amostra (uma parte) do campeonato, representado pelas primeiras 10 de um total de 38 rodadas. Isso se assemelha às evidências científicas, que em geral são observação obtidas em amostras populacionais e depois extrapoladas para a população. Quando utilizamos amostras para obter informações a cerca da população, devemos fazer uso da estatística, que serve para quantificar a incerteza a respeito de nossas conclusões amostrais. 

Formulando esse problema sob a forma científica, precisamos testar a hipótese de que o Bahia de 2013 é melhor do que o Bahia de 2012. Ao comparar a posição do Bahia após a décima rodada do campeonato, percebemos que hoje estamos na 3o posição, muito melhor do que no ano passado, que nesta altura estávamos na (pasmem) 19oposição. Que diferença gritante!


No entanto, o que percebemos nessa amostra pode ou não ser representativa da realidade do campeonato por inteiro. Quando estamos com uma amostra, existe a possibilidade da diferença entre os campeonatos ter sido obra do acaso e não uma concreta melhora de qualidade do time. Foi apenas sorte do Bahia?


Teste de Hipótese

Vou aproveitar este exemplo futebolístico para explicar como funciona teste de hipótese em estatística. Primeiro, começamos a premissa da hipótese nula, que prima pela inexistência do fenômeno (Bahia está melhor). Daí nos perguntamos: se a hipótese nula for verdadeira (Bahia não está melhor), qual a probabilidade desta diferença entre os dois campeonatos se fazer presente?

Se na presença da hipótese nula, for alta a probabilidade da diferença observada, pode ser que tudo não passe do acaso. Daí não vamos acreditar no fenômeno, vamos ficar com a hipótese nula. Estatisticamente falando, não podemos rejeitar a hipótese nula.

O que a estatística faz é calcular a probabilidade do resultado observado aparecer na vigência da hipótese nula. Essa probabilidade é o valor de P.

Sendo assim, calculei o valor de P da diferença da proporção de vitórias do Bahia nas primeiras 10 rodadas de 2013 versus 2012. Sendo uma diferença de proporção, usei o teste de Fisher, que se adéqua melhor a pequenas amostras (N = 10 jogos). Encontramos o seguinte: o Bahia ganhou 40% dos primeiros 10 jogos em 2013, comparado a 10% de vitórias em 2012, sendo o valor de P = 0.30. Isso significa que há 30% de probabilidade dessa diferença aparecer, mesmo na vigência da hipótese nula. Se o time for tão ruim quanto 2012, há ainda 30% de probabilidade da campanha destas primeiras rodadas se fazer presente. Ou seja, essa campanha não é suficientemente diferente de 2012 para rejeitar mos a hipótese nula.

Como todos sabem, para rejeitar a hipótese nula, é necessário valor de P < 0.05. O que significa isso? Se aparecer um resultado que seja muito improvável na vigência da hipótese nula, a gente começa a duvidar da hipótese nula, que era nossa premissa inicial. Se essa probabilidade ficar abaixo do limite de 5%, a gente para de insistir na hipótese nula, rejeita esta hipótese e fica com a hipótese alternativa de que o fenômeno é verdadeiro. Neste caso, seria a hipótese alternativa de que o Bahia está de fato melhor.

Assim funciona teste de hipótese. Partindo do ceticismo científico, nossa tendência é proteger a hipótese nula. Porém só até um certo ponto. Na presença de um resultado muito improvável (uma diferença muito grande, com P < 0.05), faz mais sentido achar que a hipótese nula é falsa, achar que de fato o Bahia está melhor.

O porquê de 5% ser o limite para rejeição da hipótese nula será tema de futura postagem. Mas adianto que este valor específico é uma convenção do que se considera matematicamente muito improvável.

Podemos também fazer uma comparação dos pontos obtidos pelo Bahia a cada rodada. Em 2012, o Bahia obtinha uma média de 0.90 pontos por jogo, com desvio-padrão de 0.88. Em 2013, a média de pontos por jogo subiu para 1.6, com desvio-padrão de 1.27. A diferença de 0.90 ± 0.88 versus 1.6 ± 1.27 resulta em valor de P = 0.28. Ou seja, 28% de probabilidade dessa diferença aparecer mesmo a hipótese nula sendo verdadeira.

O Fenômeno de Regressão à Média

Sendo assim, o que vimos até então pode ser mera obra do acaso e não garante que o Bahia esteja melhor. Se isso for por acaso, a tendência será o desempenho do Bahia regredir à média. Ou seja, com o passar das rodadas o Bahia vai caindo de posição, terminando em uma posição abaixo do que a atual. Este é o fenômeno estatístico de regressão à média, já comentado em detalhes nesse Blog (vale a pena rever esta e esta postagens). Em resumo, este fenômeno indica que na presença de resultados extremos (Bahia muito bom ou muito ruim), na medida em que se aumenta o tamanho amostral, a observação vai tomando uma forma mais próxima do usual. Vai regredindo à média.

Observem o progredir do campeonato. Pode ser um grande exemplo de regressão à média.


Poder Estatístico

Quando diante de um estudo negativo (ausência de diferença estatística entre os grupos), devemos considerar duas possíveis explicações: (1) de fato não há diferença ou (2) o estudo sofreu o erro tipo II, aquele no qual uma diferença verdadeira não foi encontrada por falta de poder estatístico (estudo pequeno).

De fato, este é um estudo pequeno e para a diferença observada no percentual de vitórias, o poder estatístico é de apenas 15%. Como comentado na última postagem, um estudo deve ter pelo menos 80% de poder estatístico.

Desta forma, é possível que o Bahia esteja melhor e o estudo não foi capaz de encontrar significância pois ainda tem muito pouco jogo. Mas percebam que esta análise não nos permite concluir que quando aumentar os jogos, vai se comprovar que o Bahia está melhor. O baixo poder estatístico nos permite apenas concluir que o resultado negativo não é definitivo e que estudos maiores podem (ou não) mostrar um resultado positivo. Mas por enquanto devemos ficar com a hipótese nula, a qual não foi rejeitada neste estudo.

O que ocorre muitas vezes em medicina é a utilização inadequada do argumento de que um estudo não tem poder estatístico para rejeitar a hipótese nula. Por exemplo, alguém é a favor de um tratamento. Este tratamento foi semelhante ao placebo em um estudo pequeno, que não tinha poder estatístico ideal. Daí a pessoa diz que foi erro tipo II e com isso considera que o tratamento deva ser utilizado. Isso é errado! A interpretação certa é que este estudo não demonstrou benefício, portanto o tratamento não deve ser utilizado. Em segundo lugar, por este estudo ser pequeno, a questão ainda não está fechada. Estudos maiores podem (ou não) mostram resultados favoráveis. Devemos esperar estes estudos.

Portanto, devemos analisar o progredir do campeonato para avaliar se a diferença regride à média ou se torna estatisticamente significante com o aumento do tamanho amostral.

Viés de Comparação

Falamos até então da possibilidade de que tudo seja decorrente do acaso, de erro aleatório. Porém, estudos podem também sofrer de outro tipo de erro, o sistemático, denominado vieses. Estes vieses representam erros no métodos dos trabalho. Na questão desta postagem, podemos estar sofrendo do viés do grupo de comparação. Ou seja, o melhor resultado do Bahia em 2013 pode decorrer dos times que lhe servem de comparação (adversários em campo) estarem piores do que em 2012, e não do Bahia estar melhor. Que diga o Fluminense, campeão no ano passado que acaba de demitir o técnico devido a  5 derrotas consecutivas; ou o São Paulo, atualmente na zona de rebaixamento. 


Plausibilidade versus Realidade

Como já vimos, plausibilidade é um dos critérios de causalidade propostos por Bradford Hill. Devo reconhecer que existe certa plausibilidade do Bahia estar melhor. Uma delas é o aspecto motivacional. Observem que esta melhora coincide com o afastamento de um presidente questionável do ponto de vista ético. Imagine a situação (hipotética) de uma empresa cujo suposto líder é corrupto. Isso torna o grupo de trabalho desmotivado, sendo motivação algo essencial para ganhar competições. Agora imaginem que esse líder é afastado. Isso pode ter um impacto enorme sobre a motivação dos funcionários. Uma esperança de melhora no ambiente de trabalho.

Sendo assim, me parece plausível que o Bahia esteja de fato melhor. Porém devemos lembrar que, cientificamente, plausibilidade não garante realidade. Não basta que um tratamento tenha plausibilidade de benefício, para que seja adotado. Sua eficácia deve ser demonstrada. Portanto, não é porque faz sentido que já podemos ir achando que o Bahia está ótimo. Vamos esperar...

Ainda dentro da plausibilidade, podemos ouvir muitos comentários de especialistas em futebol (os comentaristas), mostrando os porquês do Bahia estar tão bom. Caímos na mesma situação, onde plausibilidade não representa realidade. Até porque estas explicações vem depois dos resultados. Observem (que diga Milton Neves) como os comentaristas erram as previsões dos resultados dos jogos. Aliás se fossem bons preditores, estariam todos ricos com a loteria esportiva. Isso é muito bem retratado no filme Moneyball, em que o personagem de Brad Pitt, manager de um time de baseball, dispensa os velhos especialistas na contratação de jogadores e traz um jovem estatístico, capaz de indicar contratações muito mais efetivas do que as escolhidas pelos entendidos no assunto. A mente do especialista não funciona estatisticamente, funciona de acordo com suas crenças e emoções, ficando sujeitas a vieses de pensamento e fatores de confusão. Isso ocorre muito com especialistas médicos, tema de postagem futura.

Considerações Finais

A vida baseada em evidências (assim como a medicina baseada em evidências) evita de toda forma o dogmatismo. Dogma é quando a gente acredita em uma coisa porque quer acreditar e pronto. Se embasar em evidência é estar de mente aberta e olhar para os dados de maneira fria, estatística, a procura da melhor conclusão. Dizer que o Bahia tem chance de ser campeão é algo que se aproxima mais de fé ou fantasia. É o cérebro direito funcionando mais do que o esquerdo. No esporte, não tem nada de errado nisso, pois esporte é paixão, emoção, sangue, suor e lágrimas. Mas em medicina, tem que ser diferente. Não podemos ser dogmáticos e (por exemplo) propor congelar cérebros de pacientes pós-parada (hipotermia) antes de que surjam evidências melhores do que as primeiras 10 rodadas do brasileirão.

A foto abaixo retrata a última vez que meu cérebro direito me guiou no caso do Bahia. Estava eu ali, entusiasmado com meus sobrinhos, entrando na nova Arena. Para que? Para ver o Bahia perder de 7 x 3 do Vitória. Depois dessa, ficarei com a hipótese nula, até que se prove o contrário (P < 0.05).

Agora, fazendo uma previsão realista. Vai haver uma regressão à média, o Bahia vai cair da 3o posição. Talvez não termine na 15o como no ano passado, terminará algo como na 10o posição. Veremos ...

OBS: Percebam que não sou do tipo de torcedor do Bahia que fico pensando no Vitória. Desta forma, nem mencionei este time em minha postagem. Prefiro convidar o professor de estatística da pós-graduação de medicina da UFBA, meu amigo Paulo Rocha, a escrever sobre seu Vitória. Espero que ele utilize o cérebro esquerdo em sua análise.

* Agradeço ao acadêmico de medicina Marcos Correia, pela assessoria esportiva neste postagem.




Sessão Clínica do HUPES-UFBA de Medicina Baseada em Evidências

$
0
0




Professor Antônio Alberto Lopes Convida:

SESSÃO DE MEDICINA BASEADA EM EVIDÊNCIAS - HUPES, UFBA 

Data: 9/8/2013
Horário: 14:00 - 15:30 horas
Local: Sala D do HUPES (segundo-andar)

Situação da Prática Médica: Homem de 55 anos, com hipertensão arterial detectada há 10 anos. Os níveis mais elevados de pressão arterial (PA) foram 160/100 mm Hg há 4 anos. A PA vem se mantendo controlada com clortalidona, 25 mg/dia (120/70 mm Hg a 130/80 mm Hg). Exame Físico: pulso 72 bpm, PA-120/80 mm Hg, altura - 170 cm, Peso - 65 Kg, índice de massa corporal = 22,49 kg/m². Eletrocardiograma e ecocardiograma normais, exame de urina normal, uréia-30 mg/dL, creatinina - 0,8 mg/dL, glicemia - 80 mg/dL, colesterol HDL – 30 mg/dL, colesterol LDL - 160 mg/dL.
A médica considerou a introdução de estatina para o paciente e solicitou marcadores sorológicos de injúria muscular.

Questão ClínicaNo manejo de um paciente hipertenso controlado, não diabético, com idade de 55 anos, LDL colesterol de 160 mg/dL,  a introdução de estatina adiciona benefício no sentido de reduzir o risco de eventos cardiovasculares.

Artigo para apresentação e avaliação crítica: ALLHAT Collaborative Research Group. Major outcomes in moderately hypercholesterolemic, hypertensive patients randomized to pravastatin vs usual care: The Antihypertensive and Lipid-Lowering Treatment to Prevent Heart Attack Trial (ALLHAT-LLT). JAMA 2002; 288:2998-3007.

Debates: A apresentação do artigo será seguida de debates enfocando a situação apresentada, a questão clínica e a evidência científica. 
-- 
Antonio Alberto Lopes, MD, MS, MPH, PhD
Professor Associado Doutor, Livre Docente
Medicina Interna/Nefrologia e Medicina Baseada em Evidências  
Faculdade de Medicina da Bahia, Universidade Federal da Bahia
Chefe do Núcleo de Epidemiologia Clínica e Medicina Baseada em Evidências do Hospital Universitário Professor Edgard Santos

Cirurgia Precoce em Endocardite - Analisando um Estudo Pequeno

$
0
0



No último número do New England Journal of Medicine foi publicado o primeiro ensaio clínico randomizado que testou a hipótese de que cirurgia precoce reduz o risco do desfecho combinado de morte ou embolia sistêmica em pacientes com endocardite e grande vegetação em valva nativa. Este trabalho randomizou 76 pacientes para cirurgia em 48 horas da randomização ou tratamento convencional, demonstrando que o grupo cirúrgico reduziu significativamente o risco deste desfecho combinado (3% vs. 23%; P = 0.03), à custa de prevenção de evento embólico (mortalidade foi igual).

Mesmo tendo alcançado significância estatística, ensaios clínicos pequenos como este merecem uma análise crítica mais cuidadosa. Seguindo nosso roteiro de análise critica (1234, 5), vamos avaliar veracidade, relevância e aplicabilidadedestes resultados.

Veracidade

O valor de P < 0.05 indica que é pouco provável que este resultado tenha decorrido do acaso. Ou seja, se a hipótese nula fosse verdadeira, a probabilidade de um resultado tão diferente entre os dois grupos (3% vs. 23%) ter aparecido aleatoriamente é de apenas 3%. Isso rejeita a hipótese nula e ficamos com a hipótese alternativa de que a cirurgia é melhor do que o tratamento convencional.

Porém seria simplório parar por aqui. Quando um estudo pequeno assim alcança significância estatística para desfechos duros ficamos a nos questionar se este valor de P representa a realidade. Revisando, o que poderia gerar um valor de P inacurado?

Primeiro, um resultado proveniente de desfecho secundário. Neste caso há o problemas das múltiplas comparações (muitos desfechos testados simultaneamente), fazendo com que haja uma maior probabilidade de significância estatística na ausência de diferença real. Não é o caso deste estudo,  pois a conclusão é baseada no desfecho primário, que foi pré-definido e o tamanho amostral dimensionado para oferecer um poder de 80%.

Segunda preocupação, um estudo truncado pode gerar um valor de P significativo, por acaso. Também não á o caso deste estudo, pois o tamanho amostral planejado de 74 pacientes foi alcançado e o seguimento hospitalar foi completado.

Sendo assim, acreditamos que o valor de P de 0.03 é representativo da realidade.

Mas ainda há um problema capcioso, mas que é real: para um estudo pequeno ter um resultado estatisticamente significante (P < 0.05) em relação a um desfecho categórico (evento ou não evento), é necessário que haja uma diferença absoluta tão grande que esta pode se tornar inverossímil.  A diferença pode ser tão inverossímil que passamos a acreditar mais na possibilidade de que o estudo caiu naqueles 3% de probabilidade desta diferença aparecer na presença da ausência de benefício real (hipótese nula verdadeira). Ou seja, aqui não estamos questionando o valor de P de 3%, este deve está certo. Mas a questão é se o estudo caiu exatamente nestes 3% de probabilidade do resultado ter aparecido aleatoriamente.

Lembram-se do estudo de Poderman, do beta-bloqueador em pré-operatório de cirurgia não cardíaca? Tinha apenas 112 pacientes e mostrou redução de mortalidade (3.4% vs. 17%, P = 0.02). Este enorme benefício é inverossímil, pois nenhuma droga cardiovascular provocou tal redução de mortalidade (nem trombólise no IAM, cuja redução de mortalidade é 1/3 desta), quanto mais beta-bloqueador em cirurgia não cardíaca. Como sabemos, estudos posteriores mostraram que esse benefício não é verdadeiro.

Portanto, devemos nos perguntar se uma diferença absoluta de 20% neste estudo é plausível. Primeiro, 23% de eventos é o que se espera de embolia sem a cirurgia? Parece que sim, de acordo com registros prévios citados pelo próprio autor. Segundo, faz sentido praticamente eliminar o risco de embolia com a cirurgia? Também parece fazer sentido, pois se a vegetação é retirada, não vai embolizar.

Portanto, este resultado não parece ter sido devido ao acaso, devemos acreditar no valor de P e acreditar que um valor de P < 0.05 sugere benefício, pois neste caso a diferença é clinicamente plausível.

Ainda resta a possibilidade dos resultados serem decorrentes de efeito de confusão ou vieses. Efeito de confusão não parece existir, pois a randomização foi suficiente para que as amostras fossem homogêneas. Quanto a vieses, nos preocupamos com o fato do estudo ser aberto poder gerar erro na aferição dos eventos embólicos (tendenciosidade). Porém estes desfechos foram definidos de forma bastante objetiva: embolia teria que ser um evento muito bem caracterizado clinicamente e demonstrado por exame de imagem. Sendo assim, é pouco provável que o resultado seja decorrente deste viés. Quanto ao tratamento, todos os pacientes do grupo cirúrgico foram operados; e apesar de que 70% do grupo convencional foram operados também, estas cirurgias foram bem tardias e todos os eventos registrados nesse grupo ocorreram antes da cirurgia. Portanto, o estudo é adequado para avaliar o benefício da cirurgia precocemente indicada.

Sendo assim, concluímos que o benefício é verdadeiro, de fato a cirurgia previne embolia sistêmica.

Relevância

Se formos calcular, ficaremos impressionados com um NNT de 5. Muito baixo, benefício de magnitude quase nunca observado. É verdade? Tal como mencionamos na postagem do estudo da tenecteplase no AVC, estudos pequenos não possuem precisão na medida do NNT.

Só de olhar o intervalo de confiança do hazard ratio percebemos a imprecisão na magnitude do benefício. Vejam, os autores descrevem um hazard ratio de 0.10, mas com intervalo de confiança que varia de 0.01 a 0.82. Vejam que imprecisão, a redução relativa do risco pode ser tão grande quando 99% a tão pequena quando 16%.  Mas a medida do hazard ratioé relativa, precisamos ir para a redução absoluta e calcular o NNT. O autor não faz isso, porém podemos calcular os intervalos de confiança com um simples software estatístico (WINPEPI, por exemplo):

Risco de embolia/morte no grupo cirúrgico = 3% (95% IC = 0.1% a 13% - que imprecisão!)
Risco de embolia/morte no grupo convencional = 23% (95% IC = 12% a 38% - que imprecisão!)

Sendo assim, a redução absoluta do risco (risco cirúrgico - risco convencional) tem o intervalo de confiança variando de 1% a 38%. Portanto, o NNT (100/RAR) pode variar de 100 (pequeno impacto) a 2.6 (impacto enorme).

Portanto, este estudo não é suficiente para nos garantir que o benefício é de grande magnitude. Isto seria importante, pois se soubéssemos que a magnitude é enorme, insistiríamos em cirurgia mesmo para pacientes de muito alto risco ou instáveis clinicamente. Mas diante da incerteza na magnitude do benefício, a escolha deve ser mais ponderada, caso a caso.

Aplicabilidade

Conhecendo os pacientes pela tabela de características clínicas, 3 aspectos julgo dignos de nota.

Primeiro, o mais óbvio: todos tinham vegetação > 10 mm, tal como definido pelo critério de inclusão. Portanto aqui nos referimos a pacientes com vegetação grande, não qualquer vegetação. Seguindo o raciocínio da postagem anterior (aplicabilidade), há razão para acreditarmos que se a vegetação for pequena, o benefício pode não existir. Como estamos falando de cirurgia cardíaca, um procedimento agressivo, os resultados não devem ser extrapolados para vegetação muito menores que isso.

Segundo, aqui não se tratam de pacientes com infecção descontrolada, sépticos, daqueles que os cirurgiões não gostam de colocar na sala. Digo isso pois os tempo sem febre teve uma mediana de 2 dias, com 75% dos pacientes com mais de um dia sem febre (intervalo interquartil = 1 – 3). Há razão para o resultado cirúrgico ser pior em pacientes sem controle da infecção? Acho que sim. Portanto, não devemos extrapolar estes resultados para pacientes com infecção descontrolada, pois o resultado cirúrgico pode não ser o mesmo.

Corroborando com esta observação, a grande maioria dos casos era por infecção estreptocócica, a mais branda de todas, sendo apenas 10% dos pacientes com infecção por estafilococos.

Conclusão

Embora o resultado seja visualmente impressionante (vide gráfico acima), nossa conclusão deve ser mais ponderada, em se considerando as características deste estudo.

Devemos indicar cirurgia precoce de rotina na endocardite de valva nativa na presença de grandes vegetações e quadro infeccioso parcialmente ou plenamente controlado (em sépticos há incerteza). Mesmo assim, considerando a imprecisão da magnitude do benefício, devemos ponderar a decisão quando nos deparamos com risco cirúrgico muito alto, desconforto do cirurgião quanto às condições do paciente ou desejo do paciente em evitar cirurgia.

Seríamos mais enfáticos na indicação se a mesma magnitude de benefício fosse demonstrada em estudo de grande porte, de maior precisão. Mas este provavelmente nunca existirá ...

Sessão de Medicina Baseada em Evidências - HUPES

$
0
0



Professor Antônio Alberto Lopes convida:

Sessão de Medicina Baseada em Evidências do Hospital Universitário Professor Edgard Santos da Universidade Federal da Bahia (HUPES-UFBA)

Local: Sala D do HUPES
Data: 16/08 (sexta-feira)
Horário: 14:00 – 15:30 h
Apresentação e avaliação crítica da evidência: Dra. Adriana Latado e Dr. Luis Cláudio Correia.
Coordenação: Núcleo de Epidemiologia Clínica e Medicina Baseada Baseada em Evidências do HUPES.

Cenário Clínico: Mulher de 55 anos, secretária executiva, portadora de diabetes melito tipo 2 há 5 anos em tratamento com metformina. Pressão Arterial 130/70 mm Hg sem uso de anti-hipertensivos, peso 80 kg, altura 168 cm, IMC 28,34 Kg/m2 . Hemograma sem alterações, creatinina sérica - 0,8 mg/dL, LDL-C 130 mg/dL, HDL-C 40 mg/dL, triglicerídeos 208 mg/dL. A paciente está preocupada com o IMC acima do recomendado e com a informação do maior risco cardiovascular em diabéticos, e por isto procura um cardiologista para orientação sobre tipo/nível de atividade física e outras modificações que deve adotar no seu estilo de vida visando melhorar a sua saúde de modo geral.

Questão Clínica (PPR): Em uma paciente com diabetes melito tipo 2 com sobrepeso, existe benefício de intervenção baseada em dieta e atividade física visando perda de peso na redução da morbidade cardiovascular e no aumento da sobrevida?

Artigo: Wing RR, Bolin P, Brancati FL, et al. Cardiovascular effects of intensive lifestyle intervention in type 2 diabetes. N Engl J Med 2013;369:145-54.

O Estranho Mundo do Overdiagnosis

$
0
0


Neste mês, o ex-presidente americano George W. Bush fez um teste de esforço, recebeu o diagnóstico de doença coronariana, e foi submetido a implante de stentem uma das artérias de seu coração. Na alta hospitalar, saiu acreditando que se beneficiou, porém mal sabe ele que sofreu do que a literatura médica internacional denomina overdiagnosis.

Overdiagnosisé um diagnóstico verdadeiro, porém desnecessário, com maior potencial de causar danos do que benefícios. Este fenômeno decorre da cultura do check-up, propagada pelo lobby em prol do excesso de exames em pessoas saudáveis. Em contraposição, o pensamento médico-científico propõe que a realização de exames se justifique pela existência de um benefício clínico advindo do diagnóstico. E não pela falsa perspectiva de proteção gerada pelo exame. Em pessoas saudáveis, assintomáticas, há exames que devem e outros que não devem ser realizados.

O senso comum sugere que o “desentupimento” da artéria de Bush foi benéfico. No entanto, isto vai de encontro à totalidade das evidências científicas de qualidade (COURAGE, BARI 2D, FAME-II): no paciente estável, “desentupimentos” não previnem morte cardiovascular, nem infarto. Isto ocorre porque a intervenção é feita na placa de gordura que mais impressiona visualmente, sendo que o infarto por decorrer de qualquer das inúmeras placas invisíveis que residem em todo leito coronário. O que previne infarto é o controle dos fatores de risco. Principalmente controle do colesterol elevado, da hipertensão arterial e tabagismo. Este deve ser o verdadeiro enfoque preventivo.

O benefício do procedimento que Bush recebeu é útil para controlas dos sintomas de angina. Porém Bush não pode desfrutar deste benefício, pois não sente nada, tendo recentemente pedalado 30 milhas em um evento que homenageou veteranos da guerra do Iraque. Desfrutou, isto sim, do estresse psicológico do internamento, do desconforto de uma intervenção invasiva, da necessidade de uso prolongado de drogas antiplaquetárias, além do alto custo de seu procedimento.

Outra exemplo de overdiagnosisé o rastreamento indiscriminado de alguns cânceres em pessoas assintomáticas. Por exemplo, a realização anual do exame de PSA para pesquisa de câncer de próstata em homens assintomáticos. Embora câncer de próstata em alguns casos possa ser fatal, está provado cientificamente que fazer PSA de rotina não reduz probabilidade de morte por esta doença. Isto porque na prática, a detecção de cânceres precoces e localizados não necessariamente previne cânceres avançados, como sugere o senso comum. Em contrapartida, a cada 1000 homens que realizam PSA, 200 sofrem biópsias desnecessárias, 29 terminam impotentes e 18 com incontinência urinária devido a previsíveis efeitos advindos do tratamento resultante do overdiagnosis. Por este motivo, no ano passado US Prevention Task Force (órgão americano que recomenda exames preventivos) contraindicou o uso de PSA em homens assintomáticos. Paradoxalmente, PSA continua sendo um dos mais populares exames em nossa prática médica. Isto não quer dizer que a pesquisa do câncer de próstata e seu tratamento cirúrgico não esteja indicada em certos casos, principalmente em pacientes com sintomas. O overdiagnosisse refere ao uso do exame em qualquer pessoa, independente de seus fatores de risco ou quadro clínico.

Esta discussão não propõe que passemos a negligenciar a medicina preventiva. Propõe que os exames certos sejam realizados nas pessoas certas. Ao solicitar um exame, tenhamos em mente que em última instância o objetivo é beneficiar o sujeito clinicamente. Há casos em que o rastreamento para câncer e a pesquisa da doença coronária devem ser realizados. Segundo, devemos lembrar que prevenir não é necessariamente fazer exames, há situações em que a prevenção vem de outras condutas. 

Quando presidente, George W. Bush diagnosticou que o Iraque representava uma ameaça ao mundo ocidental e promoveu uma guerra de benefícios questionáveis e eventos adversos evidentes. Dez anos se passaram e agora seus médicos fizeram o mesmo: diagnóstico desnecessário e tratamento fútil. Tudo não passa do estranho mundo dooverdiagnosis.

* Artigo publicado ontem no Jornal A Tarde por Luis Correia.

Limites da Relação Médicos / Indústria Farmacêutica

$
0
0

Artigo escrito por Guilherme Brauner Barcelos, autor dos blogs Evidence Biased Medicine e Medicina Hospitalar.

Recentemente estive em evento onde a farmacêutica Sanofi foi patrocinadora e esteve fisicamente presente através de estande / propagandistas. Ao perceber que buscavam gestores e médicos para divulgar uma iniciativa, resolvi me aproximar e conversei com um dos promotores.

Trata-se do Programa "TEV Safety Zone", uma iniciativa global de educação continuada e outras ações para prevenir o tromboembolismo venoso no ambiente hospitalar. O objetivo é auxiliar os hospitais, por meio de palestras para profissionais da saúde, auxílio para implantação de comissões hospitalares de prevenção de TEV e protocolos, e apoio para o treinamento da enfermagem. O programa contribui também para que os hospitais que estejam em processo de acreditação recebam sua certificação, segundo fonte oficial

Quando questionei se o projeto tinha algum site de apresentação em língua portuguesa, o funcionário da indústria orientou-me a procurar informações via portal do HC/FMUSP, valorizando ainda a existência de um banco de dados eletrônico conjunto, com informações sobre o tema envolvendo diversas instituições hospitalares. Acabei encontrando o material abaixo dentro do portal da Disciplina de Clínica Médica e Propedêutica da USP, sem nenhuma referência visual ou textual à parceria com o laboratório:

"Banco de dados desenvolvido para que hospitais e clínicas cadastrados tenham acesso a uma ferramenta para registro de profilaxia de tromboembolismo venoso (TEV) em pacientes clínicos e cirúrgicos internados. Uma senha e usuário serão criados para o diretor do hospital ou clínica e para mais duas pessoas por ele designadas – tipicamente o profissional médico envolvido no programa e o responsável por alimentar o banco de dados. Os dados são registrados de maneira padronizada e é obrigatória a obtenção de consentimento pós-informação, ou de autorização do CEP local que libere a necessidade do consentimento, para que os dados aqui compilados possam ser utilizados em publicações científicas ou apresentações em congressos" - saiba mais aqui.

Sequer tenho convicção de que bati corretamente as informações ou de que não existem outros espaços virtuais do próprio HC/FMUSP onde apresentem a parceria abertamente, mas, de qualquer forma, alguns pontos merecem ser discutidos em uma perspectiva sistêmica:

1. Devem grupos que lidam diretamente com ensino médico em graduação e estudantes de Medicina participar deste tipo de aliança?

2. É relevante alguma referência ao vínculo com indústria farmacêutica por parte de autarquias estaduais ou outras organizações tuteladas pelo Estado brasileiro em projetos desta natureza? Por quê?

3. É indiscutível a complexidade dos processos necessários para adequada e bem sucedida implantação de protocolos nas organizações de saúde. Mas realmente é preciso parceria com a indústria na elaboração de recomendações e treinamentos locais? Quais são os reais desafios para homogeneização de práticas e condutas a partir de protocolos institucionais e para a capacitação de corpo funcional dos hospitais? Se entendo mais fácil o papel da indústria no grandes congressos médicos, alguns quase espetáculos circenses, nessas situações faz a diferença? E se faz, como? Vantagens e desvantagens?

No hospital em que trabalho em Porto Alegre dispomos de inúmeras comissões ativas e produtivas no campo da qualidade e segurança, não sendo necessário em nenhuma delas este tipo de suporte. Uma parceria com a indústria para implantação de comissões hospitalares de prevenção de TEV, onde vislumbram "um grupo multidisciplinar envolvido, constituído de profissionais dos principais serviços, como clínica médica, terapia intensiva, cardiologia, pneumologia, cirurgia geral, enfermagem e farmácia", não se presta muito mais a estimular o contato de lideranças e formadores de opinião com a empresa?

Considerando que a empresa produz especificamente o CLEXANE®, o processo de decisão da instituição entre marcas e tipos de anticoagulantes semelhantes poderia ser influenciado de alguma forma?

Já o "trabalho de apoio para o treinamento da enfermagem" fez-me lembrar de iniciativa semelhante que vivenciei em instituição onde no passado trabalhei. Uma indústria de tecnologias promoveu capacitação de enfermeiros e técnicos e, amparados pela premissa [verdadeira] de que "em sepse, tempo é vida", estimulava os profissionais a trazerem dispositivos já prontos para o uso (com a embalagem aberta).

E por fim, chamo atenção de que anunciam construir todas as recomendações técnicas a partir da Diretriz Brasileira de Profilaxia de TEV em Pacientes Clínicos Internados (AMB/CFM). Neste documento, onde declaram os conflitos de interesse envolvidos, informam que o grupo elaborador contou com o apoio logístico da Sanofi-Aventis do Brasil, havendo consultores da empresa entre os autores, bem como membros do Advisory Board da Sanofi-Aventis do Brasil.

Em momento tão complicado para os médicos brasileiros, em que estamos sendo jogados contra a população pelo Governo, na tentativa de melhorar nossa imagem, não seria oportuno abandonarmos a soberba de acreditar que políticos se perdem quando envolvidos em relacionamentos complicados, mas médicos jamais? Mesmo reconhecendo que a maioria dos médicos e sociedades médicas age corretamente perante conflitos de interesse, mas na falta de barreiras efetivas e transparentes para o contrário, não seria um bom momento para mostrar que também queremos parecer publicamente que agimos bem? E então evoluir em políticas de relacionamento com elementos além da simples declarações de conflitos de interesse?

Que esta e outras questões sirvam para debate construtivo...

Check-list para Análise Crítica de Artigo sobre Conduta Terapêutica

$
0
0


Em duas de nossas principais postagens, há aproximadamente dois anos,  descrevemos textualmente como analisar a veracidade e relevância de evidências sobre condutas terapêuticas. Nesta postagem, organizamos os detalhes metodológicos sob a forma de check-list, sistematizando a análise crítica deste tipo de evidência. Estes check-list servirá de guia para nossas análises e postagens futuras.


Análise de Veracidade

I. Erros Sistemáticos (vieses)

Quanto à Intervenção

1. Efeito de confusão:há diferenças entre os grupos que possam simular ou anular o benefício da intervenção? Ensaio clínico randomizado?
2. Aplicação da intervenção:o tratamento foi corretamente aplicado aos indivíduos do grupo intervenção?
3. Aplicação do controle:o grupo controle recebeu tratamento que possa atenuar o contraste com o grupo intervenção?
4. Intenção de tratar: os pacientes forma analisados de acordo com sua randomização inicial?
5. Viés de desempenho:caso o estudo seja aberto, pode ter havido melhor qualidade de assistência aos pacientes do grupo intervenção que gere um falso benefício do tratamento? Ou melhor de qualidade compensatória aos pacientes do grupo controle que atenue o efeito da intervenção?

Quanto ao Desfecho (viés de aferição do desfecho)

6. Subjetividade: o desfecho é subjetivo o suficiente para provocar erros de aferição?
7. Efeito placebo: em um estudo aberto, o desfecho em questão é vulnerável ao efeito placebo?
8. Desfecho criado pelo médico:em um estudo aberto, o desfecho se constitui em uma conduta médica, que possa ser influenciada pela caráter aberto do estudo (por exemplo, indicação de cirurgia por suposta falência do tratamento clínico).
9. Seguimento: houve perda significativa de seguimento dos pacientes (> 10%).

II. Erros Aleatórios (acaso)

Em estudo positivo (P < 0.05), condições de baixa confiabilidade do valor de P:

1. Conclusão baseada em desfecho secundário? (problema das múltiplas comparações)
2. Conclusão positiva baseada em análise de subgrupo de estudo negativo?
3. Estudo truncado?
4. Estudo com baixo poder estatístico?

Em estudo negativo (P > 0.05), avaliar:

5. O estudo tem poder estatístico satisfatório para testar benefício clinicamente relevante?



Análise de Relevância

I. Análise Qualitativa

1. O desfecho é substituto ou clínico? O primeiro apenas gera hipótese; o segundo modifica conduta.
2. Em sendo desfecho clínico, qual a importância do desfecho na vida do indivíduos (hardvs.soft).
3. Caso o desfecho clínico seja composto, o resultado resulta do efeito em cada componente do desfecho ou apenas nos menos importantes?

II. Análise Quantitativa

1. Cuidado com redução relativa de risco, pode causar ilusão de grande benefício.
2. Prefira redução absoluta do risco (risco grupo 1 – risco grupo 2).
3. Calcule o NNT para avaliar  a magnitude do benefício da terapia.
-       NNT = 100/redução absoluta de risco
-       NNT < 50 é considerado satisfatório.

Curso de Bioestatística

Less is More versus More is More: Estudo PRAMI

$
0
0


Nesta semana, o estudo PRAMIfoi publicado no New England Journal of Medicine, simultâneo à apresentação de seus resultados no Congresso Europeu de Cardiologia. O resultado deste estudo muito me chamou atenção, pois vai de encontro a um quase onipresente princípio, o less is more.

O paradigma less is moreprevalece na maioria das condutas médicas em que se comparou tratamento intenso versus tratamento moderado. São consistentes e repetidas as evidências de que fazer menos exames (indicar para as pessoas certas) ou evitar tratamento exagerado (glicemia, pressão arterial, transfusão) traz maior probabilidade de benefício líquido aos indivíduos. Daí a surge a aplicação da expressão menos é mais em medicina.

Em postagem antiga, demos várias exemplos de comprovação deste princípio em diferentes situações médicas.

Esta expressão foi difundida em meados no século XX pelo alemão LudwigMies van der Rohe, um dos pais da arquitetura moderna, que primava pelo estilo claro e simples, expressando o espírito da era pós-guerra, em contraposição ao estilo gótico ou barroco. Percebemos este estilo nas obras de Frank Lloyd Wright (Guggenheim) ou Oscar Niemeyer. Esta tendência surgiu na renascença, quando Leonardo da Vinci afirmou “simplicidade é a sofisticação mais requintada”. Um exemplo moderno da aplicação deste princípio estético foi o fascínio de Steve Jobs pelo less is more, criando produtos cuja estética reside principalmente em sua linearidade e simplicidade tecnológica. Há algo mais simples do que um telefone sem teclas?

Porém, é na medicina que este paradigma é verdadeiramente comprovado por evidências científicas. A editora da revista JAMA Internal Medicine, Rita Redberg, criou a série de artigos Less is More, já com 83 publicações, que envolvem as mais diferentes situações clínicas em que este paradigma se faz presente. 

Mas por que o estudo PRAMI contradiz o paradigma less is more?

O ensaio clínico PRAMI estudou pacientes submetidos a intervenção coronária primária no infarto com supradesnível do ST e que tinham outras placas provocando estenose > 50%, além da lesão culpada. Estes pacientes foram randomizados para realizar intervenção apenas da artéria culpada pelo infarto (conduta corrente, less is more) versusintervenção não só da lesão culpada, mas também das demais placas presentes (more is more). Pois bem, o PRAMI demonstrou que o more is more foi superior ao less is more na prevenção do desfecho combinado de óbito, infarto e angina refratária em seguimento de 2 anos. 

Este é o tipo de evidência capaz de mudar nosso paradigma de tratamento do infarto com supradesnível do ST. Em medicina baseada em evidências, devemos aceitar evidências de qualidade, independente de nossa crenças (less is more). Mas antes precisamos avaliar a qualidade das evidências. 

Análise Crítica da Evidência do PRAMI

Em primeiro lugar, devemos perceber que este é um ensaio clínico relativamente pequeno, apenas 465 pacientes randomizados, um número bem menor do que o normalmente visto em ensaios clínicos de fase III. Por si só, isto não invalida do trabalho, porém o deixa mais vulnerável aos efeitos de erros aleatórios ou sistemáticos.

Seguindo o check-list de nossa última postagem, o estudo passa na maioria das checagens de erros sistemáticos (vieses), porém um deles necessita melhor avaliação: este é um estudo aberto.

Neste estudo, o paciente e seu médico sabem quem foi randomizado para intervenção em todas as artérias ou apenas na artéria culpada. Vale salientar que seria perfeitamente possível cegar este estudo, pois os procedimentos foram feitos no mesmo momento e apenas a equipe intervencionista precisaria saber o que foi realizado. O paciente poderia estar perfeitamente cego.

Este caráter aberto pode ter um efeito catastrófico quando combinado a desfechos softs, tal como angina refratária, sozinho responsável por 57% dos desfechos neste estudo. Analisemos detalhadamente.

O desfecho angina é sujeito ao efeito placebo de um estudo aberto. Ou melhor, ao inverso do efeito placebo: ao saber que não foi plenamente revascularizado, os pacientes deste grupo ficam mais propensos a relatar angina. Lembre-se que dor é um dos desfechos mais influenciados pelo placebo. 

O ideal em um estudo aberto seria considerar apenas desfechos hards. Porém sendo este um estudo pequeno, desfechos hards não teriam a frequência necessária para gerar um poder estatístico satisfatório. Portanto a solução deveria ser cegar o estudo e isto não foi feito.

Nota-se que os autores tiverem o “cuidado” de considerar apenas anginas que fossem refratárias. A primeira vista isso parece tornar o desfecho mais duro, porém percebam a realidade: ter angina ou não ter é algo mais objetivo do que definir se a angina é refratária ou não. Uma vez tendo angina, isto pode gerar um ajuste de droga, porém o paciente que sabe que ficou com lesão não abordada tende a julgar que o ajuste farmacológico não foi suficiente para o controle de seu sintoma. Isto mostra que no caso de um estudo aberto, qualificar um sintoma pode ser mais subjetivo do que simplesmente avaliar se o sintoma ocorreu ou não. Desta forma, em um estudo aberto a definição de refratária não torna o desfecho angina menos vulnerável ao viés de aferição, pode tornar até mais vulnerável. 

Da mesma forma aparentemente “cuidadosa”, os autores consideraram apenas as anginas que tinham isquemia miocárdica demonstrada por exames funcionais. Este é outro detalhe que a primeira vista sugere um desfecho mais criterioso (hard), porém faz exatamente o contrario. Claro que um paciente que tem lesão residual tem maior probabilidade de ter isquemia quando comparado ao paciente que fez abordagem de todas as suas lesões. Este critério, na verdade, gera um preconceito de que os pacientes do grupo mais conservador terão mais angina refratária. Foi incorreto utilizar um critério de imagem para definir um desfecho clínico, principalmente porque, independente do desfecho, um grupo com certeza terá mais isquemia no exame de imagem. Esta foi uma forma pré-concebida de garantir que o desfecho angina fosse mais frequente no grupo que não realizou revascularização completa. 

Por fim, precisamos falar de morte cardiovascular. Tenho dito que morte é o desfecho mais hard que existe, ninguém vai errar sua aferição. Por outro lado, morte de causa específica (cardiovascular) é um desfecho sujeito a interpretações das mais diversas: imaginem um paciente interna por infarto, realiza coronariografia, desenvolve insuficiência renal por contraste e morre - esta morte é cardiovascular ou renal? Ou um paciente interna por pneumonia, durante o curso da infecção apresenta um infarto e morre - morte cardiovascular ou infecciosa? Independente das respostas corretas, observem que há justificativa para qualquer das definições do desfecho.

Desta forma, percebam que uma “cuidadosa” definição de desfechos, aliada ao caráter aberto da observação, pode definir a priori o resultado do estudo de acordo com o interesse do investigador. Este estudo é bom exemplo disso.

Passando para a segunda parte de nosso check-list, entramos na questão do erro aleatório, proveniente do acaso. Vejam os quatro pontos a checar e adivinhem onde está a falha. 

Este é um estudo truncado!! De novo? Por que isso, interromper um estudo tão pequeno justamente no momento em que o resultado está favorável à hipótese testada? Justamente porque ao continuar o estudo, corre-se o risco do resultado (que pode ser por acaso) desaparecer. Já exemplificamos neste Blog inúmeros casos de estudos truncados (Xigrisé o mais famoso, inclusive com postagem específica sobre esse tema). Como mencionamos previamente, um interessante trabalho publicado no JAMA mostrou que quando o número de desfechos é menor que 200, o risco de um resultado superestimado fica bem mais alto. Este é o caso do PRAMI.

Observem então que o PRAMI combina algumas características perigosas. Fazendo uma teoria de conspiração, é como se os autores pensassem: vamos fazer um estudo bem pequeno, ajustar os desfechos de forma a favorecer nosso interesse e quando o estudo mostrar positividade, a gente interrompe na hora, para garantir o resultado.

Implicações Práticas

O resultado do PRAMI, caso verdadeiro, mudaria um importante paradigma no tratamento do infarto. Nesta circunstância clínica, trocaria o paradigma do less is more para o more is more

Pode até ser que o resultado do PRAMI seja verdadeiro, mas não é uma garantia. O princípio científico da hipótese nula afirma que na ausência de evidência forte o suficiente, devemos permanecer com a ideia da ausência do fenômeno. Nesta discussão, não estamos afirmando que o tratamento das múltiplas angioplastias não seja benéfico. Estamos apenas chamando a atenção de que não podemos afirmar que seja benéfico. Percebam o detalhe filosófico. 

Esta mudança de paradigma promoveria aumento significativo da (já enorme) quantidade de intervenções coronárias, gerando um curso logístico e econômico ainda mais elevado do que o já existente.

Sou totalmente a favor de mudanças de paradigma, em postagem recente fiz uma apologia à transgressão, quando citei Nilton Bonder. No entanto, mudanças de paradigmas devem ser mediadas por argumentos mais fortes do que aqueles que sustentam a ideia corrente. O estudo PRAMI não tem nível suficiente para promover esta mudança.
Viewing all 225 articles
Browse latest View live