↧
Nosso Curso Intensivo de Análise Multivariada - Novembro
↧
O Complexo de Deus
Esta semana estive em Campos de Jordão, para proferir uma Keynote Lecture no International Back Pain Forum (Simplifying the Complex and Complicating the Simple). Este é um evento que reúne cientistas em dor lombar de diversas partes do mundo. Setenta por cento dos participantes eram estrangeiros, predominando Austrália, Reino Unido, Dinamarca, Holanda, de acordo com minha estatística visual. Chamo a atenção desta estatística, pois me pareceu predominar países onde se exerce uma medicina mais racional e socializada. Fico otimista quanto interajo nestes ambientes, onde percebo que os princípios da medicina baseada em evidências de fato fazem parte do consciente ou inconsciente coletivo.
Na semana anterior, deu-se em Brasília o Congresso Brasileiro de Cardiologia. Este é um ambiente em que percebo grande avidez por parte dos cardiologistas por discussões reflexivas e baseadas em evidências. Isso também me deixa otimista, vejo um futuro promissor, estamos evoluindo. No entanto, em contraste com o ambiente científico de Campos de Jordão, o Complexo de Deus ainda é muito prevalente no meio cardiológico, principalmente por parte dos “formadores de opinião”.
Leonardo Costa, organizador do evento em Campos, me pediu para retratar como os princípios científicos influenciam (ou não) o raciocínio cardiológico, para fazer um paralelo com a realidade deles. Sendo assim, o tema de minha conferência foi o Complexo de Deus, cujo conteúdo está apresentado na postagem abaixo.
O Complexo de Deus
O maior obstáculo para a implementação dos princípios da medicina baseada em evidências é o Complexo de Deus. Esta enfermidade psicológica de alta prevalência entre médicos é caracterizada pela presunção de que podemos inventar condutas baseadas em lógica e considerá-las benéficas sem testá-las devidamente.
O Complexo de Deus é promovido pela ignorância de dois fatos importantes: a incerteza do pensamento lógico e a existência de fenômenos ilusórios no universo.
A Incerteza do Pensamento Lógico
Como serem humanos, temos uma tendência natural a acreditar, muito mais do que duvidar. Assim evoluiu nossa mente ao longo destes 200.000 anos. Nos primórdios na humanidade, nossa característica crente foi necessária para um entendimento inicial do universo e por questões de sobrevivência de nossos ancestrais. Naquela fase, não havia conhecimento coletivo organizado, o que obrigava nossos ancestrais em acreditar e aplicar qualquer coisa. Algumas davam certo e eles iam começando a entender o universo e encontrando soluções para coisas básicas. O mundo evoluiu, hoje entendemos o universo de forma mais profunda e não há mais sentido em ser crente. Porém nossa mente evoluiu de forma crente e permanece com esta característica que um dia teve razão de ser.
Além deste tropismo pela crença, nosso raciocínio evoluiu de forma cartesiana. Geralmente pensamos em uma ou duas causas e planejamos intervir nessas poucas causas como forma de solucionar nossos problemas. O que não nos damos conta é que o mundo é formado de sistemas complexos, especialmente o mundo biológico. Um sistema complexo pode ser definido como aquele no qual o desfecho é resultado de um multiplicidade de causas, que interagem entre si de forma imprevisível, tornando impossível garantirmos o efeito de uma intervenção com base em nossa lógica. Isto promove a incerteza do pensamento lógico.
O problema é que não nos damos conta disso e nossa mente crente nos faz confiar cegamente nas predições lógica. Em medicina, são inúmeros os pensamentos lógicos (plausibilidade biológica) que são negados quando propriamente testados? Inúmeras postagens deste blog contam essas histórias.
Uma vez acreditando fortemente em nossa lógica, um outro processo cognitivo se encarrega de validar nossa crença: o viés de confirmação.
Imaginem que eu acredite que a posição de uns planetas no momento do nascimento define a personalidade das pessoas (astrologia). Não é difícil olhar ao meu redor e encontrar dentre meus amigos pessoas cuja personalidade coincidem com seu signo. Ao encontrar essas pessoas, registro mentalmente estes casos e minha crença é validada. Por outro lado, não registro os casos em que a personalidade não coincide com o signo. Isso é o processo natural de memória seletiva pelo qual o viés de confirmação atua. Ou seja, o viés de confirmação se aproveita das coincidências (acaso) para validar nossas crenças.
Percebam como nossa mente nos engana. Como dizia Kant, a percepção do universo não depende apenas dos sentidos, resulta da interação dos sentidos com nossa mente (nossas crenças). Vemos o que queremos ver.
Para corrigir este processo crente, existe a ciência. Sim, a função da ciência é diferenciar causa de acaso. Se as personalidades fossem causadas mesmo pelos astros, haveria mais acertos do que erros por parte dos astrólogos. Bem, isso foi testado. Em 1985, foi publicado na Revista Nature um elegante estudo, no qual os astrólogos acertaram de forma cega a personalidade de parte dos indivíduos. No entanto, erraram na mesma proporção. Em suma, não houve associação estatisticamente significante entre mapa astral e personalidade. Pronto, está apropriadamente testado e a crença está desconstruída por uma observação não enviesada do universo.
Isto ocorre o tempo todo com condutas médicas, que entram na rotina clínica com base na crença lógica, e depois estudos apropriados mostram que estas nunca deveriam ter sido adotadas. Tudo isso decorre do nosso Complexo de Deus, que nos impede de reconhecer a incerteza do pensamento lógico.
Fenômenos Ilusórios no Universo
Outro mecanismo mediador do Complexo de Deus é a ignorância de que o mundo a nossa volta é repleto de associações que parecem, mas não são, causais. Já comentamos neste Blog uma associação verdadeiramente existente e estatisticamente significante entre consumo de chocolate per capita e conquista de prêmio nobel por países. Difícil pensar nesta como uma associação causal, muito provavelmente isto decorre de vies de confusão, ou seja, variáveis associadas ao consumo de chocolate e às premiações, promovendo uma ligação ilusória entre estas duas coisas.
Assim se acreditou que vitaminas tinham efeito anti-cancerígeno, efeito não confirmado quando avaliado por desenhos de estudos que ajustam para variáveis de confusão (ensaios randomizados). Isto demonstra o segundo papel da ciência, que é diferenciar causa de viés.
Diferenciando causa de acaso e causa de viés, a ciência discrimina mito e realidade.
No entanto, nosso Complexo de Deus nos faz desconsiderar a incerteza do pensamento lógico e a existência de fenômenos ilusórios presentes no universo. Preferimos acreditar em nossas crenças. Preferimos instituir terapia de hipotermia pós-parada baseada em crença falsamente validada por fenômenos ilusórios promovidos por dois estudos repletos de viéses. E mesmo depois de um estudo apropriado ter demonstrado a ausência de benefício, as pessoas continuam propondo este tratamento, com base em subterfúgios de pensamento. Como gosto deste exemplo ...
Mesmo depois da ciência demostrar ausência de benefício, continuamos a dilatar coronárias de pacientes assintomáticos, com base na crença lógica de que é sempre bom desentupir o que está entupido.
E continuamos a afirmar enfaticamente que exercício físico previne eventos cardiovasculares maiores, mesmo depois da negatividade do estudo LOOK-AHEAD.
O problema é o que Complexo de Deus traz prejuízos clínicos, financeiros e culturais. Um dos grandes prejuízos que experimentamos recentemente foi a vexatória derrota de 7 x 1 contra a Alemanha, na Copa do Mundo dentro do Brasil. Sim, isso decorreu da crença de que éramos um bom time, de que iríamos ganhar aquele jogo e a copa do mundo. Se uma visão realista sobre aquele time estivesse presente, o Brasil entraria no jogo de forma defensiva, retrancada. Poderíamos até perder, porém não da forma como ocorreu. Assim fizeram brilhantemente nossos irmãos argentinos.
Somos assim, sofremos do Complexo de Deus. Nossa presunção impede que evidências científicas tenham um papel de protagonista na construção de nossas ideias. O Complexo de Deus torna o homem dogmático, acredita por acreditar. Ou acredita motivado por conflitos de interesse.
Nosso raciocínio lógico deve servir para a geração de hipóteses a serem testadas cientificamente, diferenciando associações causais de acaso ou vies. O pensamento científico propõe uma posição de humildade do homem perante os fenômenos do universo.
↧
↧
Curso de Medicina Baseada em Evidências (FMB)
↧
“Não há evidência para tudo”
Esta é uma das frases mais utilizadas por quem sofre do Complexo de Deus e deseja ter a liberdade de definir condutas médicas com base em crenças. Como não há evidência para tudo, podemos fazer quase tudo.
Às vezes esta afirmação vem quantificada, dando ainda mais força ao complexo: "apenas 30% das condutas necessárias possui evidências". Porém, isto é um grande equívoco.
Na realidade, ao utilizar sequencialmente os princípios da medicina baseada em evidências, concluiremos que muitas das condutas correntes não deveriam ser praticadas, enquanto haverá respaldo para as condutas que devem ser utilizadas. Vamos ver.
Primeiro, o princípio da hipótese nula diz que devemos partir da premissa de ausência do fenômeno e só considerar algo como verdadeiro após devida demonstração científica. Este é um princípio científico básico, essencial para a organização do pensamento e prevenção de falsas afirmações. Portanto, muitas das condutas que se faz, não deveriam estar sendo feitas. Estas não devem ser computadas no percentual de condutas necessárias, porém sem evidências.
E dentre as condutas que devem ser adotadas? Essas possuem 3 tipos de justificativas. A primeira é exatamente a rejeição da hipótese nula por um estudo válido e relevante, realizado em amostra populacional e realidade semelhante à de nosso paciente. Estão são evidências diretas, que justificam aproximadamente 30% das condutas corretas.
Em segundo lugar, entra o princípio da complacência, o qual orienta a utilização de evidências indiretas. O processo ocorre da seguinte forma: um trabalho científico tem a função de gerar a prova de conceito. Uma vez provado o conceito (por amostra populacional e método específicos para prevenção de erros aleatórios e sistemáticos), este deve ser individualizado para uma gama mais ampla de pacientes e realidades práticas; desde que não haja uma grande razão para que não se aplique a seu paciente ou à sua realidade.
Quando utilizamos beta-bloqueador para o tratamento da insuficiência cardíaca em um paciente de 85 anos, estamos aplicando o princípio da complacência, pois este paciente foi pouco (ou não foi) representado pelos estudos que validaram este tratamento. Esta é uma evidência indireta para o nosso paciente, como ocorre em boa parte dos casos. O que precisamos julgar é se há incerteza suficiente para limitar a aplicação do conceito. Por exemplo, aos 95 anos, a evidência fica mais indireta, aos 105 anos mais indireta ainda, e nossa reflexão precisa ser mais ponderada na aplicação do conceito. Se há razão para moderada incerteza, devemos ficar com a hipótese nula e não utilizar a evidência indireta.
Este princípio se baseia no fato de que interação entre tipo de paciente e efeito da conduta é um fenômeno raro. Ou seja, uma vez demonstrado um benefício, este se reproduz na maioria das situações. Observem como acontece com as análises de subgrupo de estudos positivos. Normalmente, todos os subgrupos reproduzem o resultado.
Este princípio se baseia no fato de que interação entre tipo de paciente e efeito da conduta é um fenômeno raro. Ou seja, uma vez demonstrado um benefício, este se reproduz na maioria das situações. Observem como acontece com as análises de subgrupo de estudos positivos. Normalmente, todos os subgrupos reproduzem o resultado.
Outra grande equívoco de pensamento ocorre na forma de utilização da conduta. Hipoteticamente, um estudo utilizou uma dose fixa de beta-bloqueador, pois teria que ser um estudo cego (prevenção de viés), não permitindo que o médico tateasse a dose. Uma vez provado o benefício, o médico não deve ser obrigado a utilizar aquela mesma dose do beta-bloqueador em todos os pacientes, não deve “copiar o artigo”. O certo é se nortear pelo conceito provado pelo artigo e individualizar a dose do beta-bloqueador para diferentes tipos de pacientes. Ao usar uma dose reduzida em um paciente com frequência mais baixa ou uma dose aumentada em um paciente com frequência mais alta, estamos aplicando uma evidência indireta (dose intermediária). Porém esta é a melhor forma de fazer.
Medicina baseada em evidências não é copiar o artigo científico; medicina baseada em evidências é individualizar para o paciente um conceito demonstrado no artigo científico.
Sendo assim, evidências indiretas quanto ao tipo de paciente ou forma de aplicação justificam em torno de 40% de nossas condutas. Neste ponto, já cobrimos 70% das condutas médicas.
E os 30% restantes?
Estes são justificados pelo princípio da plausibilidade extrema. Estas são situações tão óbvias que se torna incontestável que devemos adotar a conduta. Seria anti-ético realizar um ensaio clínico. O melhor exemplo é o uso do para-quedas em indivíduos que pulam de um avião. Esse device reduz mortalidade e sabemos disso sem realizar um ensaio clínico. Desfibrilar um paciente cujo monitor mostra fibrilação ventricular. Faríamos um ensaio clínico para esta situação? Claro que não. Plausibilidade extrema é algo que incontroverso, ninguém teria uma opinião contrária. Esta é a evidência do óbvio.
Dentro deste princípio, existem as condições de curso clínico inexorável. Na década de 80, o neurocirurgião Ben Carson "curou" uma criança epiléptica, que sofria 30 convulsões ao dia e já tinha tentado todos as medicações possíveis. Ele realizou a retirada de todo o hemisfério cerebral esquerdo da criança, interrompendo as convulsões e deixando poucas sequelas. Esta é uma condição diferente do para-quedas, pois havia pouca garantia de sucesso. Mas a garantia estava no insucesso de não tentar nada. Este é um outro tipo de plausibilidade extrema, embora sejam exemplos mais raros.
Desta forma, de acordo com estes três princípios, todas as condutas que devemos realizar são respaldadas pelo raciocínio médico baseado em evidências. Enquanto parte das condutas não deveriam estar sendo adotadas, pois representam o Complexo de Deus propondo tratamentos embasados em lógica, mentalidade do médico ativo ou conflitos de interesse.
↧
Em que candidato a Medicina Baseada em Evidências votaria?
Se a medicina baseada em evidências fosse uma pessoa, ela procuraria para eleger um candidato que reconhecesse a incerteza de suas propostas. Isso mesmo, pois ciência é em primeiro lugar reconhecer as incertezas, fazer as perguntas certas e procurar responder estas questões com base em experimentação.
A medicina baseada em evidências votaria no candidato que entendesse a complexidade dos problemas, considerasse que soluções criadas com base em lógica são incertas, e propusesse ensaios que comparassem estratégias. Por exemplo, o problema da saúde. Um candidato científico apresentaria três possíveis soluções, que seriam alocadas em diferentes cidades por processo de randomização em cluster. As estratégias seriam avaliadas quanto à melhora de um desfecho primário definido de forma objetiva o suficiente para evitar o viés político de aferição. Após identificada a estratégia de melhor eficácia, esta seria implementada nas demais regiões do país. Claro que neste processo o governo deveria avaliar aplicabilidade, ou seja, até que ponto aquela evidência aplicada a uma cidade terá o mesmo resultado em outra cidade. Avaliaria eficácia e efetividade. Seria um governo embasado em evidências.
A medicina baseada em evidências também votaria em um candidato cuja equipe realizasse revisões sistemáticas de relatos bem e mal sucedidos, procurando gerar fontes secundárias de evidências que norteariam suas ações.
A medicina baseada em evidências votaria em um candidato que utilizasse o paradigma da racionalidade, do less is more, concentrando os recursos disponíveis em medidas de maior custo-efetividade e utilidade.
O problema é que parece não existir este candidato. Incertezas nunca são reconhecidas, propostas são feitas de forma presunçosa, promete-se tudo e mais um pouco de forma demagógica, nunca sendo mencionada a racionalidade das escolhas, a boa aplicação dos sempre finitos recursos.
Na ausência de preditores de um governo embasado em evidências, ficamos em território de incerteza de qual seria o candidato ideal. Reconhecendo esta incerteza, a solução seria randomizar uma amostra de Brasis para Dilma ou Aécio, verificando o resultado de cada um dos candidatos em desfechos duros, tais como os parâmetros relacionados à educação, saúde, corrupção, infraestrutura. Porém não temos uma amostra de vários Brasis. Temos apenas um Brasil.
Daí me ocorreu a solução de realizar um ensaio clínico do tipo N = 1. Em certas circunstâncias, este é um desenho aceitável, aplicável quando precisamos de uma evidência para um paciente em particular, sendo este o mesmo paciente a ser testado no experimento. Em ensaios clínicos N = 1, uma primeira estratégia é implementada (estratégia A), depois trocada pela estratégia B, comparando-se o momento do paciente quando estava com a estratégia A versus B (desenho quasi-experimental - antes e depois). Imaginem dois analgésicos oferecidos desta forma a um paciente, sendo que o analgésico que melhor sedou a dor seria o escolhido par uso crônico.
Lembra alguma coisa? Sim, lembra o Brasil que tem problemas crônicos e já realizou a primeira etapa do ensaio N = 1. Caso julguemos que o país está indo bem, torna-se dispensável transitar para a estratégia B. Caso julguemos que o problema clínico persiste, devemos prosseguir o ensaio clínico e cruzar as estratégias. É uma questão de julgamento.
Assim faria a medicina baseada em evidências se ela fosse um eleitor.
Assim faria a medicina baseada em evidências se ela fosse um eleitor.
↧
↧
Como calcular o intervalo de confiança do NNT
Na postagem sobre o estudo PARADIGM-HF, analisamos a medida pontual do número necessário a tratar (NNT) do LCZ696. Naquela oportunidade prometi que voltaria ao assunto a fim de discutir como avaliar a precisão da estimativa do NNT. Isto é importante, pois devemos nos condicionar a avaliar não apenas a medida pontual, mas também os limites do intervalo de confiança, os quais representam a estimativa na pior e na melhor hipótese. No contexto de um ensaio clínico, isso vale para as medidas do risco relativo, hazard ratio, risco absoluto e NNT.
Normalmente, o NNT não vem descrito pelos trabalhos, o que fazemos é calcular a redução absoluta do risco (subtraindo o risco de um grupo por outro) e fazendo 100/redução absoluta do risco = NNT.
Mas como saber o intervalo de confiança do NNT ?
Em termos de precisão, o PARADIGM-HF nos forneceu apenas o intervalo de confiança do hazard ratio. Mas o bom é que podemos usar este para chegar ao intervalo de confiança do NNT. Sabemos que hazardé diferente de risco (postagem antiga - hazard leva em conta o tempo livre do evento e não apenas o evento), mas para simplificar usarei hazard ratio como se fosse um risco relativo para o cálculo que virá a seguir.
O risco relativo foi de 0.80, com intervalo de confiança entre 0.73 e 0.87. Desta forma, podemos calcular o intervalo de confiança da redução relativa do risco (1 - risco relativo), que fica entre 13% (1 - 0.73) e 27% (1 - 0.87).
O segredo para estimar o intervalo de confiança da redução absoluta de risco está em utilizar a incidência do desfecho no grupo controle, como representante do que seria esperado de risco sob o tratamento usual com enalapril (risco basal).Este risco no grupo controle foi 26.5%.
Agora, para saber a redução absoluta de risco, devemos multiplicar a redução relativa de risco pelo risco basal. Por exemplo, se eu ganhar 50% de uma herança (relativo), para saber o valor que receberei, multiplico 50% pelo valor absoluto da herança (50% x 10.000.000 = me dei bem).
No PARADIGM-HF, a pior hipótese da redução relativa do risco é 13%. Sendo assim, na pior das hipóteses, a redução absoluta do risco será de 3.4% (13% x 26.5%).
Na melhor das hipóteses, a redução relativa do risco é 27%. Sendo assim, na melhor das hipóteses, a redução absoluta do risco será de 7.2% (27% x 26.5%).
Portanto, o intervalo de confiança da redução absoluta do risco é 3.4% a 7.2%.
Agora vamos usar esse intervalo de confiança da redução absoluta do risco para saber o intervalo de confiança do NNT: 100/3.4% a 100/7.2%. Ou seja, enquanto a estimativa pontual do NNT é de 21 (tratamento de grande impacto) e seu intervalo de confiança fica entre 14 e 29. Observem que isso é preciso, pois na pior das hipóteses o NNT seria de 29, o que se considera um benefício relevante. Se fizermos essa análise para morte, o NNT seria de 30, com intervalo de confiança entre 21 e 55. Na pior das hipóteses a redução de mortalidade seria de magnitude moderada.
Este estudo de grande tamanho amostral nos fornece uma satisfatória precisão do NNT. Lembro que embora o NNT sugira grande magnitude, este estudo tem problema sério de aplicabilidade pois não se definiu como um estudo de prova de conceito ou pragmático (vide postagem anterior).
Percebam que para realizar essa análise, pensamos se a pior hipótese do NNT ainda seria uma número razoável. Essa é a técnica, pensar sempre na pior hipótese.
De intervalo de confiança em intervalo de confiança (RR - RRR - RAR - NNT), terminamos por encontrar o intervalo de confiança do NNT.
Agora vamos a outro exemplo, onde a medida pontual do NNT sugere grande impacto, porém o estudo não tem precisão.
Em postagem antiga do Blog discutimos um ensaio clínico de apenas 76 pacientes com endocardite bacteriana e vegetação grande, que foram randomizados para cirurgia imediata ou tratamento conservador (cirurgia apenas se instabilidade). O trabalho mostra que a cirurgia precoce reduz o desfecho primário combinado de morte e embolia sistêmica de 23% (controle) para 3% (intervenção) - a custa apenas de redução de embolia. Observem que isso resulta em redução absoluta do risco de 20% (23% - 3%), o que dá um impressionante NNT = 5.
Embora esta cirurgia seja de alto risco (paciente usualmente com quadro infeccioso ainda não controlado, muitas vezes instável clinicamente), um NNT de 5 nos motivaria a aventurar esta conduta. Porém devemos nos perguntar qual a precisão deste NNT = 5 ?
Observem que o hazard ratio do estudo é 0.10 (90% de redução do hazard), porém o intervalo de confiança deste hazard ratio vai de 0.01 a 0.82. Isto indica que a redução relativa do risco (hazard) é muito imprecisa, com intervalo de confiança de 18% a 99%. O risco basal (grupo controle) é 23%. Aplicando estas reduções relativas do risco ao risco basal, encontramos que a redução absoluta do risco pode ser tão grande quanto de 22.77% (99% x 23%) ou tão pequena quanto 4,14% (18% x 23%).
Sendo assim, este NNT = 5 tem um intervalo de confiança variando de 4 (100/23) a 25 (100/4). Ou seja, é muito impreciso. E considerando a possibilidade de um NNT = 25 para prevenir um evento embólico (sem reduzir mortalidade), ficamos muito na dúvida se devemos arriscar complicações advindas de uma cirurgia em momento não ideal. Este é um exemplo de estudo pequeno não garantindo precisão suficiente do NNT.
Uma das utilidades de meta-análises é obter um intervalo de confiança do RR mais estreito e permitir melhor precisão do intervalo de confiança do NNT. Da mesma forma que os artigos, as meta-análises não trazem este dado, mas podemos calcular pelo intervalo de confiança do RR e pela medida basal do risco demonstrado da meta-análise.
* Para análise de magnitude de efeito quando o desfecho é numérico, acesse esta postagem do Blog H1 Estatística.
↧
Less is More versus More is More: Estudo PRAMI
Nesta semana, o estudo PRAMIfoi publicado no New England Journal of Medicine, simultâneo à apresentação de seus resultados no Congresso Europeu de Cardiologia. O resultado deste estudo muito me chamou atenção, pois vai de encontro a um quase onipresente princípio, o less is more.
O paradigma less is moreprevalece na maioria das condutas médicas em que se comparou tratamento intenso versus tratamento moderado. São consistentes e repetidas as evidências de que fazer menos exames (indicar para as pessoas certas) ou evitar tratamento exagerado (glicemia, pressão arterial, transfusão) traz maior probabilidade de benefício líquido aos indivíduos. Daí a surge a aplicação da expressão menos é mais em medicina.
Em postagem antiga, demos várias exemplos de comprovação deste princípio em diferentes situações médicas.
Esta expressão foi difundida em meados no século XX pelo alemão LudwigMies van der Rohe, um dos pais da arquitetura moderna, que primava pelo estilo claro e simples, expressando o espírito da era pós-guerra, em contraposição ao estilo gótico ou barroco. Percebemos este estilo nas obras de Frank Lloyd Wright (Guggenheim) ou Oscar Niemeyer. Esta tendência surgiu na renascença, quando Leonardo da Vinci afirmou “simplicidade é a sofisticação mais requintada”. Um exemplo moderno da aplicação deste princípio estético foi o fascínio de Steve Jobs pelo less is more, criando produtos cuja estética reside principalmente em sua linearidade e simplicidade tecnológica. Há algo mais simples do que um telefone sem teclas?
Porém, é na medicina que este paradigma é verdadeiramente comprovado por evidências científicas. A editora da revista JAMA Internal Medicine, Rita Redberg, criou a série de artigos Less is More, já com 83 publicações, que envolvem as mais diferentes situações clínicas em que este paradigma se faz presente.
Mas por que o estudo PRAMI contradiz o paradigma less is more?
O ensaio clínico PRAMI estudou pacientes submetidos a intervenção coronária primária no infarto com supradesnível do ST e que tinham outras placas provocando estenose > 50%, além da lesão culpada. Estes pacientes foram randomizados para realizar intervenção apenas da artéria culpada pelo infarto (conduta corrente, less is more) versusintervenção não só da lesão culpada, mas também das demais placas presentes (more is more). Pois bem, o PRAMI demonstrou que o more is more foi superior ao less is more na prevenção do desfecho combinado de óbito, infarto e angina refratária em seguimento de 2 anos.
Este é o tipo de evidência capaz de mudar nosso paradigma de tratamento do infarto com supradesnível do ST. Em medicina baseada em evidências, devemos aceitar evidências de qualidade, independente de nossa crenças (less is more). Mas antes precisamos avaliar a qualidade das evidências.
Análise Crítica da Evidência do PRAMI
Em primeiro lugar, devemos perceber que este é um ensaio clínico relativamente pequeno, apenas 465 pacientes randomizados, um número bem menor do que o normalmente visto em ensaios clínicos de fase III. Por si só, isto não invalida do trabalho, porém o deixa mais vulnerável aos efeitos de erros aleatórios ou sistemáticos.
Seguindo o check-list de nossa última postagem, o estudo passa na maioria das checagens de erros sistemáticos (vieses), porém um deles necessita melhor avaliação: vies de aferição do desfecho. O desfecho primário deste estudo é o combinado de morte cardiovascular, infarto e angina refratária. Este último é sozinho responsável por 57% dos desfechos do estudo e por ser mais subjetivo (soft), fica mais sujeito a enviesamento.
Em um momento pontual do texto, o trabalho é descrito como single blind, indicando que apenas uma das partes, o médico ou o paciente, está cega em relação à alocação. Embora não esteja especificado qual das partes, deduzo que seja o paciente cego, sendo que o pesquisador tem conhecimento da alocação. Cegar o paciente previne que o efeito placebo corrompa este desfecho. Por outro lado, o pesquisador pode interpretar um desfecho como angina refratária ao saber que o paciente não foi plenamente revascularizado.
O ideal em um estudo aberto seria considerar apenas desfechos hards. Porém sendo este um estudo pequeno, desfechos hards não teriam a frequência necessária para gerar um poder estatístico satisfatório. Portanto a solução deveria ser cegar o estudo e isto não foi feito plenamente.
Nota-se que os autores tiverem o “cuidado” de considerar apenas anginas que fossem refratárias. A primeira vista isso parece tornar o desfecho mais duro, porém percebam a realidade: ter angina ou não ter é algo mais objetivo do que definir se a angina é refratária ou não. Uma vez tendo angina, isto pode gerar um ajuste de droga, porém o pesquisador que sabe que ficou com lesão não abordada tende a julgar que o ajuste farmacológico não foi suficiente para o controle de seu sintoma. Isto mostra que no caso de um estudo aberto, qualificar um sintoma pode ser mais subjetivo do que simplesmente avaliar se o sintoma ocorreu ou não. Desta forma, em um estudo aberto a definição de refratária não torna o desfecho angina menos vulnerável ao viés de aferição, pode tornar até mais vulnerável.
Da mesma forma aparentemente “cuidadosa”, os autores consideraram apenas as anginas que tinham isquemia miocárdica demonstrada por exames funcionais. Este é outro detalhe que a primeira vista sugere um desfecho mais criterioso (hard), porém faz exatamente o contrario. Claro que um paciente que tem lesão residual tem maior probabilidade de ter isquemia quando comparado ao paciente que fez abordagem de todas as suas lesões. Este critério, na verdade, gera um preconceito de que os pacientes do grupo mais conservador terão mais angina refratária. Foi incorreto utilizar um critério de imagem para definir um desfecho clínico, principalmente porque, independente do desfecho, um grupo com certeza terá mais isquemia no exame de imagem. Esta foi uma forma pré-concebida de garantir que o desfecho angina fosse mais frequente no grupo que não realizou revascularização completa.
Da mesma forma aparentemente “cuidadosa”, os autores consideraram apenas as anginas que tinham isquemia miocárdica demonstrada por exames funcionais. Este é outro detalhe que a primeira vista sugere um desfecho mais criterioso (hard), porém faz exatamente o contrario. Claro que um paciente que tem lesão residual tem maior probabilidade de ter isquemia quando comparado ao paciente que fez abordagem de todas as suas lesões. Este critério, na verdade, gera um preconceito de que os pacientes do grupo mais conservador terão mais angina refratária. Foi incorreto utilizar um critério de imagem para definir um desfecho clínico, principalmente porque, independente do desfecho, um grupo com certeza terá mais isquemia no exame de imagem. Esta foi uma forma pré-concebida de garantir que o desfecho angina fosse mais frequente no grupo que não realizou revascularização completa.
Por fim, precisamos falar de morte cardiovascular. Tenho dito que morte é o desfecho mais hard que existe, ninguém vai errar sua aferição. Por outro lado, morte de causa específica (cardiovascular) é um desfecho sujeito a interpretações das mais diversas: imaginem um paciente interna por infarto, realiza coronariografia, desenvolve insuficiência renal por contraste e morre - esta morte é cardiovascular ou renal? Ou um paciente interna por pneumonia, durante o curso da infecção apresenta um infarto e morre - morte cardiovascular ou infecciosa? Independente das respostas corretas, observem que há justificativa para qualquer das definições do desfecho.
Desta forma, percebam que uma “cuidadosa” definição de desfechos, aliada ao caráter aberto da observação, pode definir a priori o resultado do estudo de acordo com o interesse do investigador. Este estudo é bom exemplo disso.
Passando para a segunda parte de nosso check-list, entramos na questão do erro aleatório, proveniente do acaso. Vejam os quatro pontos a checar e adivinhem onde está a falha.
Este é um estudo truncado!! De novo? Por que isso, interromper um estudo tão pequeno justamente no momento em que o resultado está favorável à hipótese testada? Justamente porque ao continuar o estudo, corre-se o risco do resultado (que pode ser por acaso) desaparecer. Já exemplificamos neste Blog inúmeros casos de estudos truncados (Xigrisé o mais famoso, inclusive com postagem específica sobre esse tema). Como mencionamos previamente, um interessante trabalho publicado no JAMA mostrou que quando o número de desfechos é menor que 200, o risco de um resultado superestimado fica bem mais alto. Este é o caso do PRAMI.
Observem então que o PRAMI combina algumas características perigosas. Fazendo uma teoria de conspiração, é como se os autores pensassem: vamos fazer um estudo bem pequeno, ajustar os desfechos de forma a favorecer nosso interesse e quando o estudo mostrar positividade, a gente interrompe na hora, para garantir o resultado.
Implicações Práticas
O resultado do PRAMI, caso verdadeiro, mudaria um importante paradigma no tratamento do infarto. Nesta circunstância clínica, trocaria o paradigma do less is more para o more is more.
Pode até ser que o resultado do PRAMI seja verdadeiro, mas não é uma garantia. O princípio científico da hipótese nula afirma que na ausência de evidência forte o suficiente, devemos permanecer com a ideia da ausência do fenômeno. Nesta discussão, não estamos afirmando que o tratamento das múltiplas angioplastias não seja benéfico. Estamos apenas chamando a atenção de que não podemos afirmar que seja benéfico. Percebam o detalhe filosófico.
Esta mudança de paradigma promoveria aumento significativo da (já enorme) quantidade de intervenções coronárias, gerando um curso logístico e econômico ainda mais elevado do que o já existente.
Pode até ser que o resultado do PRAMI seja verdadeiro, mas não é uma garantia. O princípio científico da hipótese nula afirma que na ausência de evidência forte o suficiente, devemos permanecer com a ideia da ausência do fenômeno. Nesta discussão, não estamos afirmando que o tratamento das múltiplas angioplastias não seja benéfico. Estamos apenas chamando a atenção de que não podemos afirmar que seja benéfico. Percebam o detalhe filosófico.
Esta mudança de paradigma promoveria aumento significativo da (já enorme) quantidade de intervenções coronárias, gerando um curso logístico e econômico ainda mais elevado do que o já existente.
Sou totalmente a favor de mudanças de paradigma, em postagem recente fiz uma apologia à transgressão, quando citei Nilton Bonder. No entanto, mudanças de paradigmas devem ser mediadas por argumentos mais fortes do que aqueles que sustentam a ideia corrente. O estudo PRAMI não tem nível suficiente para promover esta mudança.
↧
O Mito do Fio Dental
Certa feita deixei o consultório de meu dentista refletindo se aquelas recomendações de utilização do fio dental eram efetivas. Naquele momento eu nem questionava eficácia, minha dúvida residia na efetividade de uma medida tão trabalhosa, que requer intensa disciplina. Além disso, eu me perguntava a respeito da eficiência (custo-efetividade), sendo que o maior custo aqui é o tempo investido diariamente na aplicação do fio dental.
No caminho de casa, minha curiosidade foi aumentando e cheguei ao ponto de questionar a eficácia daquele lucrativa medida: há ensaios clínicos randomizados comparando fio dental versus controle?
Ainda no carro, tentei pesquisar no iPhone, quando parado no semáforo, mas não deu tempo. Ao chegar em casa, fui direto para o computador e pesquisei no Medline: "dental floss", filtrado por "Systematic Reviews". Nem especifiquei desfecho ou populacão de interesse, dada a curiosidade. Me surpreendi, pois o primeiro artigo que me aparece é uma revisão sistemática da Cochrane, que selecionou apenas ensaios clínicos randomizados. Estes trabalhos tiveram o cuidado de incentivar a escovação em ambos os grupos.
Resultado: fio dental não reduz a placa bacteriana!!!
Observem abaixo que foram 6 estudos que avaliaram este desfecho após 1 mês de tratamento, 5 não mostraram efeito e apenas um mostrou efeito. O efeito sumário da meta-análise mostra uma diferença média padronizada de - 0.23, porém intervalo de confiança no nível 95% envolvendo ao zero (-0.52 a 0.06).
Três trabalhos que avaliaram 6 meses de uso de fio dental, sendo todos negativos e a diferença média padronizada da placa bacteriana não foi estatisticamente significante = - 0.06 (95% IC = - 0.23 a 0.12).
OBS: Neste ponto, vale a pena explicar o que é diferença média padronizada. Observe que aqui estamos com uma meta-análise de trabalhos que avaliam o efeito de uma intervenção em um desfecho numérico, representado por alguma (s) escala (s) de placa bacteriana. O tamanho do efeito do fio dental seria representado pela diferença entre as medias da placa bacteriana nos dois grupos. No entanto, em meta-análises pode ser que diferentes trabalhos utilizaram diferentes escalas. Sendo assim, é necessário uniformizar as escalas, para que o efeito possa ser compilado. Essa uniformização é denominada padronização (standardization), sendo feita pela divisão do valor absoluto da diferença pelo desvio-padrão daquela medida no estudo. Agora não importa mais a medida absoluta, mas sim quantos desvios-padrão um grupo difere do outro. Esta técnica também é utilizada quando o valor absoluto da escala não tem grande significado, preferindo-se a medida de quantos desvios-padrão estas diferem. De fato, para mim que não sou dentista e não entendo muito dessas medidas de placa bacteriana, fica mais fácil olhar a diferença média padronizada. Quanto esta diferença é > 0.8, considera-se uma tamanho de efeito significativo; quanto < 0.5 considera-se algo de pequena relevância.
Observem abaixo que foram 6 estudos que avaliaram este desfecho após 1 mês de tratamento, 5 não mostraram efeito e apenas um mostrou efeito. O efeito sumário da meta-análise mostra uma diferença média padronizada de - 0.23, porém intervalo de confiança no nível 95% envolvendo ao zero (-0.52 a 0.06).
Três trabalhos que avaliaram 6 meses de uso de fio dental, sendo todos negativos e a diferença média padronizada da placa bacteriana não foi estatisticamente significante = - 0.06 (95% IC = - 0.23 a 0.12).
OBS: Neste ponto, vale a pena explicar o que é diferença média padronizada. Observe que aqui estamos com uma meta-análise de trabalhos que avaliam o efeito de uma intervenção em um desfecho numérico, representado por alguma (s) escala (s) de placa bacteriana. O tamanho do efeito do fio dental seria representado pela diferença entre as medias da placa bacteriana nos dois grupos. No entanto, em meta-análises pode ser que diferentes trabalhos utilizaram diferentes escalas. Sendo assim, é necessário uniformizar as escalas, para que o efeito possa ser compilado. Essa uniformização é denominada padronização (standardization), sendo feita pela divisão do valor absoluto da diferença pelo desvio-padrão daquela medida no estudo. Agora não importa mais a medida absoluta, mas sim quantos desvios-padrão um grupo difere do outro. Esta técnica também é utilizada quando o valor absoluto da escala não tem grande significado, preferindo-se a medida de quantos desvios-padrão estas diferem. De fato, para mim que não sou dentista e não entendo muito dessas medidas de placa bacteriana, fica mais fácil olhar a diferença média padronizada. Quanto esta diferença é > 0.8, considera-se uma tamanho de efeito significativo; quanto < 0.5 considera-se algo de pequena relevância.
Os resultados relativos a gengivite foram um pouco melhores. A diferença média padronizada foi - 0.71 (95% IC = -1.09 a -0.35) nos estudos de 6 meses. Conforme enfatizado em nossa última postagem, é importante avaliar os limites do intervalo de confiança, considerando a pior hipótese. Observem que embora - 0.71 possa significar um efeito moderado, o limite superior do intervalo de confiança é - 0.35, o que representa um efeito pequeno. Além disso, deve-se considerar o que diz a revisão sistemática a respeito do risco de viés dos estudos. Foram 4 estudos que fizeram essa avaliação aos 6 meses, porém 3 classificados como qualidade unclear e um como alto risco de viés. Sendo assim, fica questionável a veracidade deste achado. Vejam abaixo o forrest plot da gengivite.
Quanto à incidência de cárie, que seria um desfecho mais duro, a revisão sistemática demonstrou que não existem estudos para este desfecho.
Desta forma, fica evidente a dissociação entre a importância dada a esta recomendação e ao nível de evidência a este respeito.
Cada vez mais me impressiono como nossa percepção do universo é influenciada por fatores de confusão. No cotidiano, dentistas de fato percebem melhores condições dentárias nas pessoas disciplinadas no uso do fio dental. Porém a questão é se a melhor condição dentária é causada pelo fio dental ou se este hábito é apenas um marcador da qualidade da escovação dentária. Para saber isso, precisamos olhar o mundo sob o filtro da observação científica. Esse filtro ajusta para fatores de confusão. A randomização garante que as pessoas em uso de fio dental sejam iguais ao grupo controle. Anula-se portanto o efeito da escovação, fazendo desaparecer o benefício do grupo fio dental, que parecia ocorrer no mundo real, porém era mediado pelo efeito de confusão de uma melhor escovação.
Exemplos como este, que mostram importante dissociação entre o que observamos no cotidiano e o que se observa em ambiente controlado cientificamente, reforçam uma das funções da ciência: discriminar entre viés e causa (a outra é discriminar entre acaso e causa).
O problema é que a gente já chega acreditando na causalidade e utilizamos estas associações para validar nossas crenças (viés de confirmação).
Importante lembrar que estes estudos não estão testando higiene bucal versus não higiene bucal. Lembro que os dois grupos escovaram os dentes, provavelmente de forma bastante adequada. O que está se avaliando é se o fio dental tem benefício incrementalà boa escovação.
O problema é que a gente já chega acreditando na causalidade e utilizamos estas associações para validar nossas crenças (viés de confirmação).
Importante lembrar que estes estudos não estão testando higiene bucal versus não higiene bucal. Lembro que os dois grupos escovaram os dentes, provavelmente de forma bastante adequada. O que está se avaliando é se o fio dental tem benefício incrementalà boa escovação.
E como fazer agora? Deixar de lado o fio dental?
Minhas sugestões:
Em primeiro lugar, na próxima vez que seu dentista enfatizar a necessidade de fio dental, pergunte ele: qual o nível de evidência de sua recomendação? Caso ele vacile, seja mais específico: há ensaios clínicos randomizados comprovando a eficácia do fio dental?
Em segundo lugar, se fio dental faz parte de uma prazerosa rotina em sua vida, continue, pois acho que este hábito tem valor como parte de um cortejo de cuidado pessoal. Por outro lado, se este é um hábito difícil para você manter, relaxe e se concentre em uma boa escovação dentária.
Percebam que estudos negativos posuem grande aplicabilidade prática, nos norteando quanto à possibilidade de uma escolha individualizada.
Mas se você é um dentista que acredita firmemente na hipótese do fio dental, continue investigando, faça ensaios clínicos randomizados maiores e melhores. Mas nunca se esqueça que o ônus da prova está na demonstração do benefício. Não podemos inverter essa lógica. Para adotarmos uma conduta, o que precisa ser demonstrado é o benefício. E não demonstrar ausência de benefício para que a conduta não seja adotada.
Quanto a mim, manterei a qualidade de minha escovação e deixarei de perseguir a utópica utilização do fio dental. Usarei quando quiser, como quiser. E os minutos que me sobram, dedicarei a algo que seja relevante.
Quanto ao meu dentista, este é meu amigo pessoal, deve estar lendo esta postagem agora e em poucos minutos devo receber sua ligação ...
↧
Transparência Baseada em Evidência
↧
↧
Análise Multivariada: Predição versus Causa, Confusão versus Interação
Predizer ou inferir sobre causalidade são as duas grandes razões científicas de testarmos associação estatística entre variáveis. Devemos iniciar nosso pensamento definindo em qual desses dois se encaixa o nosso objetivo científico.
O funcionário da imigração americana procura identificar indivíduos que tentam entrar no país para realizar atos terroristas. Este funcionário se utiliza da regra de que todo muçulmano deve ser tratado como tal até que se prove o contrário. Este é um exemplo de predição.
Um dentista observa no cotidiano profissional que pessoas disciplinadas no uso de fio dental possuem menor carga de placa bacteriana. Isto faz com que a cada dia ele acredite mais na eficácia do fio dental em causar uma melhor condição dentária. Este é um exemplo de causa.
Estes são pensamentos univariados, que demonstram a tendência natural de funcionamento de nossa mente. No entanto, essa forma de pensamento não é bem adaptada à realidade do universo, o qual se apresenta de maneira mais complexa e interessante: o mundo é multivariado.
Na análise univariada, a força associação de uma variável com o desfecho representa seu efeito total. No entanto, esse efeito total resulta do efeito direto e do efeito indireto da variável. O efeito indireto decorre de outras variáveis que estão associadas simultaneamente à variável preditora de interesse e ao desfecho, causando um link entre esses dois.
Na análise multivariada, as variáveis preditoras são analisadas simultaneamente, de forma que o efeito de cada variável é ajustado para o efeito das demais. Assim, identificamos o efeito direto de cada variável na predição do desfecho, um efeito que independe de outras variáveis. A isso chamamos de associação independente.
Idealmente, o funcionário da imigração deveria utilizar um modelo multivariado, o qual considera várias características do indivíduo (sexo, país, nível educacional, aspecto físico, se é casado, se tem filhos, etc) para calcular a probabilidade de ser terrorista. Caso haja uma probabilidade acima de um ponto de corte, o indivíduo deve ser retido para investigação. Melhor do que prender todo muçulmano. Seria uma conduta baseada em uma estimativa de risco por um modelo multivariado.
Neste modelo preditor, entrariam apenas variáveis que possuam associação independente (direta) com o desfecho. Além disso, o peso da presença de cada característica na probabilidade do desfecho é dado com base neste efeito direto da variável. Daí a importância de se utilizar análise multivariada na construção de modelos preditores.
Idealmente, o dentista deveria entender que o mundo a nossa volta é repleto de fatores de confusão, que geram ilusão de causalidade, quando na verdade estamos diante de associações indiretas. Fatores de confusão são aquelas variáveis associadas simultaneamente ao preditor e ao desfecho. Assim, elas conectam o preditor e o desfecho, porém esta conecção não representa um link de causalidade.
Neste caso, um modelo científico adequado precisaria avaliar se menor carga de placa bacteriana em pessoas que usam fio dental decorre de uma melhor escovação (pessoas mais disciplinadas) ou diretamente do uso de fio dental. Um modelo que ajustasse para o efeito de confusão da escovação, que provavelmente é de melhor qualidade nas pessoas que usam fio dental. Percebam que escovação não é uma forma através da qual o fio dental funcionaria. Portanto, a ligação que escovação promove entre fio dental e desfecho não faz parte de um link de causalidade, é apenas um efeito de confusão.
Observem que tanto na criação de um modelo preditor quanto na avaliação da causalidade, é importante a identificação de associação independente entre variável preditora e desfecho. No caso do modelo preditor, essa associação direta deve ser independente de qualquer variável que possa estar intermediando a relação preditor-desfecho, pois queremos apenas colocar na fórmula preditora o efeito direto de cada variável. No caso da avaliação de causalidade, devemos ajustar apenas para variáveis de confusão, que são variáveis que intermediam a relação preditor-desfecho, porém sem um link de causalidade.
Predição versus Causa
Um modelo preditor deve ser criado pelo princípio da parcimônia, onde devemos alinhar acurácia e simplicidade. Ou seja, uma variável que pouco contribui, não deve ficar no modelo final. Ela torna o modelo mais complexo, sem trazer muito valor. Por outro lado, todas as variáveis que incrementam o valor preditor, devem fazer parte deste modelo final. No caso de predição, os preditores no modelo final podem, mas não precisam ser a causa do problema (fator de risco), precisam apenas identificar o problema (marcador de risco). Assim se constrói um modelo com intuito preditor.
O modelo construído para avaliar causalidade tem um princípio diferente. Como não é predição, este modelo deve ser construído com base na lógica da causalidade. Há fatores que são fortes preditores, mas não devem estar neste modelo. Por exemplo, calcificação coronária (escore de cálcio) é um preditor independente de infarto. Porém não é o cálcio que causa o infarto, este apenas marca uma doença mais grave. Desta forma, quando queremos saber se colesterol causa infarto, não devemos ajustar para o escore de cálcio, pois este modelo deve ter apenas aqueles fatores que possuem plausibilidade etiológica.
Percebem que o estatístico não conseguiria fazer isso sem o pensamento do pesquisador? Ou seja, a construção de um modelo estatístico deve ser guiada pela pergunta científica.
Devo salientar que não basta associação independente para garantir que a associação é causal. A associação independente é um critério necessário, mas não suficiente para causalidade. É apenas o início de um processo de inferência a respeito de causalidade.
Confusão versus Interação
Sem querer evitar o trocadilho, há muita confusão entre os conceitos de confusão e interação. Mas são coisas bem diferentes.
Revisando mais uma vez, confusãoé quanto uma variável (ou mais) intermedia uma falsa associação entre duas outras variáveis. Ajustando para esta variável de confusão, saberemos se a relação é direta entre variável preditora e desfecho. Este conceito de necessidade de ajuste para confusão por análise multivariada se aplica à construção de um modelo preditor (para evitar redundância) e também se aplica à identificação de uma variável causal (um dos critérios de causalidade é predição independente).
Interaçãoé diferente, bem diferente. Interação pode ser entendida como modificação de efeito.
Um jogador de futebol que parece até bonzinho no time do Bahia, mas quando vai para um time europeu, torna-se um jogador de seleção. Podemos interpretar que o ambiente europeu modifica para melhor efetividade do jogador em fazer seu time ganhar. Este é um exemplo de interação entre time e efetividade do jogador.
Interação é avaliada por análise multivariada, pois há pelo menos três variáveis preditoras: (1) efeito do jogador no resultado do jogo, (2) efeito do time (bahiano ou europeu) e a (3) interação entre eles.
No pensamento clínico, análise de interação é importante, pois que posso querer saber se uma variável prediz o desfecho de forma similar entre homens e mulheres. Ou se um fator de risco causa uma doença de forma similar entre jovens e idosos. Ou se uma droga funciona com a mesma eficácia entre pacientes de diferentes tipos.
Resumindo
Sendo assim, análise multivariada serve para (1) criar modelos preditores; (2) avaliar a possibilidade de uma variável ser causadora do desfecho; e (3) analisar de interação.
Há diferentes testes para análise multivariada, que variam de acordo com o tipo de variável preditora ou tipo de variável desfecho.
- Regressão logística: desfecho categórico e preditores categóricos/numéricos.
- ANOVA multivariada: desfecho numérico e preditores categóricos.
- Regressão linear múltipla: desfecho e preditores numéricos.
- ANCOVA: desfecho numérico e preditores categóricos/numéricos.
Espero que esta postagem tenha dado um ideia geral de análise multivariada. Resumo abaixo, os principais conceitos que devem ficar em nossas mentes ….
- Análise multivariada serve para construir um modelo preditor ou participar da avaliação de causalidade de um determinado fator. E a forma de construção do modelo depende dessa definição.
- Análise multivariada faz ajuste para co-variáveis, determinando associação independente, condição necessária para que a variável faça parte de um modelo preditor ou que seja considerada uma das causas do desfecho.
- No modelo preditor, a associação deve ser independente de qualquer variável que esteja intermediando, enquanto no modelo causal, a associação deve ser independente de variáveis de confusão (link não causal).
- Interação não é a mesma coisa que confusão. Enquanto confusão significa uma variável X mediando a relação indireta entre duas variáveis Y e Z, interação significa uma variável X modificando uma relação entre duas variáveis Y e Z.
Caso a mente esteja confusa, fiquem pensando no assunto e depois de dois dias releiam essa postagem. O entendimento deve vir de dentro pra fora.
↧
Dupla anti-agregação pós-stent (Estudo DAPT): manter após 1 ano ?
Em novembro, o ensaio clínico DAPT foi apresentado no congresso do American Heart Association e simultaneamente publicado no New England Journal of Medicine, concluindo: o qual concluiu que a manutenção da dupla anti-agregação plaquetária além de 1 ano após o implante de stent farmacológico reduz risco de eventos cardiovasculares.
Este é um estudo interessante para discutir, pois tem peculiaridades metodológicas e de aplicabilidade.
Esta conclusão parece ir na contra-mão de ensaios clínicos que demonstram a não inferioridade do uso da dupla anti-agregação por apenas 6 meses (versus 1 ano), a exemplo dos SECURITY ou ISAR-SAFE, recentemente apresentados em congressos. Ou na contra-mão do princípio do less is more.
Este estudo incluiu 10.000 pacientes que utilizaram a dupla anti-agregação durante 1 ano após o uso do stent farmacológico, e não apresentaram complicações neste período. Passada esta fase, os pacientes foram randomizados para manter durante mais 18 meses ou suspender o clopidogrel (em alguns casos Prasugrel).
Quanto à confiabilidade, o estudo possui baixo risco de viés (randomizado, placebo-controlado, intenção de tratar, pouca perda de follow-up, desfechos objetivos) e baixo risco de erros aleatório (estudo grande - preciso - e ausência das situações de baixa confiabilidade do valor de P, como valorização de desfechos secundários, subgrupos ou truncamento). Portanto, vamos confiar no resultado.
O Conceitos Demonstrados
O estudo tem dois desfechos primários: trombose de stent e eventos cardiovasculares (morte, IAM, AVC). Isto não é comum e desperta curiosidade: por que trombose de stent foi colocado em separado dos desfechos combinados? Porque não combinar tudo em um único desfecho composto? Há uma razão inteligente para isso: o fenômeno que media a trombose (problema no stent) é diferente do fenômeno que media os outros desfechos (instabilização do leito nativo). Como o primeiro desfecho é mais raro, caso apenas este fosse beneficiado pelo clopidogrel, seus números iriam se diluir no desfecho primário do combinado de desfechos. Por isso, trombose foi um desfecho separado, ficando dois desfechos primários.
Como isso predispõe ao problema das múltiplas comparações (dois desfechos sendo analisados simultaneamente), o valor de P que define significância estatística foi reduzido para 0.025 caso apenas um dos desfechos fosse significativo (maior rigorosidade - ajuste de Bonferroni).
O DAPT demonstrou um nítido surgimento de trombose de stent (1 em 100 pacientes) exatamente no ato da suspensão do clopidogrel (vide gráfico abaixo). Coisa que não ocorreu no grupo que manteve a droga. Portanto, fica demonstrado o conceito de que a proteção do clopidogrel não se limita a apenas um ano. Vai além ...
Um segundo conceito comprovado pelo estudo é da redução de eventos não relacionados a trombose do stent. Ou seja, nestes pacientes mais complexos (que necessitaram de intervenção percutânea), a manutenção do clopidogrel confere uma certa proteção (- 2%, NNT = 63) contra infarto do miocárdio não dependente de trombose do stent.
Relevância (tamanho e qualidade do efeito)
Na análise qualitativa, percebemos que todos os desfechos avaliados são importantes (duros), o que dá relevância ao resultado do estudo. Houve benefício no desfecho trombose de stent (duro) e a redução do desfecho combinado ocorreu à custa do componente infarto (duro). Não chegou a haver redução do componente mais importante, morte, o que daria maior relevância ao achado.
E do ponto de vista quantitativo?
A redução absoluta do hazard da trombose de stent foi 1% e dos desfechos cardiovasculares 1.6%. No teste de hipótese estatística, estes desfechos foram analisados separados, mas agora que a hipótese nula foi rejeitada em ambos, a gente pode combinar em um único NNT do benefício. Sendo assim, a redução absoluta ficaria 2.6% (1% + 1.6%) e o NNT para benefício = 38 (100 / 2.6). Por outro lado, houve aumento de sangramento moderado a grande, com NNH = 100.
Sendo assim, precisamos tratar 38 pacientes para prevenir um infarto e tratar 100 para causar um sangramento. A análise numérica mostra um benefício moderado versus um risco existente, porém mais baixo. Como decidir?
Como a maioria dos tratamentos, NNT = 38 não é nenhuma panacéia. Mas é assim que vários tratamentos adotados funcionam. Curioso perceber que o estudo CURE que consagrou o uso da dupla anti-agregação em síndromes coronarianas agudas teve um resultado risco/benefício muito parecido com o DAPT!! O CURE demonstrou NNT = 48 e NNH = 100.
Portanto esse é um benefício relevante o suficiente para influenciar nossa conduta clínica.
Tendo o trabalho passado pelo crivo da confiabilidade (nível de evidência) e relevância (tamanho e qualidade do efeito), analisaremos aplicabilidade.
Aplicando a Evidência
Devemos sempre lembrar que medicina baseada em evidências não é copiar a conduta testada como via de regra em todos os pacientes. Medicina baseada em evidências é tomar decisão individualizada, norteada pelo conceito científico apresentado no trabalho. Em outras palavras, este estudo não significa que a partir de agora existe uma regra universal que nos obriga a manter o Clopidogrel por mais de um ano em todos os pacientes. Temos que individualizar.
Primeiro, a pergunta e o desenho do estudo se referem a indivíduos que se mostraram tolerantes à medicação durante o primeiro ano. É nesta situação que ficamos na dúvida se devemos suspender o clopidogrel, pois há um certo desconforto quando decidimos por mudar o que está dando certo. E se o paciente não tiver tido trombose por um ano justamente porque estava usando a medicação?
Imaginemos agora um paciente que colocou um stent farmacológico, usou AAS e Clopidogrel por um ano, evoluiu sem evento hemorrágico e não tem maiores riscos de sangramento. Por que suspender a droga? Por que mudar um time que está dando certo? Neste momento, a evidência do DAPT nos norteia. Pois agora sabemos que de fato há uma perda em suspender o Clopidogrel.
Filosoficamente, devemos perceber que um ato médico se constitui em uma nova conduta aplicada. E o ônus da prova está no ato médico. Em pacientes que vêm dando certo com clopidogrel, o ato médico é a suspensão da droga. Agora sabemos que a suspensão traz uma certa perda de benefício (ou malefício) ao paciente. Embora não seja panacéia, quase nada em medicina o é. Dentro desta perspectiva, este é não é um benefício irrelevante. Inclusive se assemelha ao benefício do clopidogrel no clássico estudo CURE.
Erradamente, depois do CURE, Clopidogrel virou receita de bolo em pacientes com síndromes coronarianas agudas sem supradesnível, independente de risco coronário (baixo, moderado ou alto) e independente do risco de sangramento. Diferente disso, por estarmos em um momento mais amadurecido, acho que a evidência do DAPT será melhor aplicada na prática.
A tendência de manter a droga deve ser contextualizada com a preferência de nosso paciente. Há pacientes que preferem correr um pequeno risco (1/38) para tomar menos medicação e reduzir o risco de complicações. Há pacientes que desejam que todos os procedimentos sejam realizados para reduzir seu risco coronário.
Isto demonstra que evidência e julgamento clínico se complementam, porém cada parte desta tem uma função distinta. Um parte não deve antagonizar a outra.
E onde ficam aquelas evidências que mostram a suspensão de Clopidogrel 6 meses após o stent farmacológico como algo não inferior em relação ao uso de um ano? Estas devem ser aplicadas para os pacientes com maior risco de sangramento ou aqueles que precisam fazer um procedimento cirúrgico ou aqueles que estão apresentando sangramento, mesmo que menores (incomodativos).
DAPT parece ser contraditório em relação aos estudos de não inferioridade, mas não é, pois cada evidência deve ser aplicada da sua forma. Um estudo de superioridade (DAPT) existe para justificar uma conduta com base em seu benefício (usar clopidogrel mais prolongado reduz risco). Um estudo de não inferioridade existe para justificar uma conduta com base em uma vantagem adicional, que não está relacionada a sua eficácia. Neste caso a vantagem seria reduzir o risco de sangramento.
Portanto, após um ano de clopidogrel, caso nosso paciente não tenha tido problema de sangramento e seja de baixo risco para o uso da droga, devemos avaliar a possibilidade de oferecer um benefício adicional mantendo a medicação. Mantenho um esquema que vem dando certo.
O caso do uso prolongado de clopidogrel é um bom exemplo de interação da arte médica (julgamento clínico) com evidência científica. No paradigma da medicina baseada em evidências, excelentes médicos são aqueles capazes de acoplar o conhecimento científico com o julgamento clínico (princípio da complementaridade); bons médicos olham apenas evidências, sem exercer o raciocínio de individualização; maus médicos fazem o que querem, baseados em suas crenças ou interesses, em detrimento de evidências.
------------------------------------------------------------------------------------------------------------------------
Complementos
Complementos
Questão complementar I: afinal, se não suspendermos após 1 ano, por quanto tempo devemos utilizar o Clopidogrel. Uma resposta frequente seria por mais 18 meses, para completar 30 meses do protocolo do DAPT. Mas não é exatamente isso, pois aí entra um conceito importante: fazer medicina baseada em evidências não significa exatamente copiar o protocolo do trabalho. Protocolo de estudo não é o mesmo que protocolo assistencial. Essa é uma confusão comum. O protocolo do estudo é algo usado para demonstrar um conceito científico. Por que 30 meses? Por que não 36 meses? Simplesmente porque este foi o tempo escolhido pelo estudo para causar um contraste entre o grupo prolongado versus o grupo controle. Causando um contraste, o conceito foi testado. Depois disso, usaremos o conceito na prática, individualizando para o paciente. O conceito aqui provado é que o uso além de 1 ano é benéfico, mas quanto tempo faremos, depende de particularidades de nossos paciente. Alguns usarão o resto da vida, outros menos de 30 meses.
Questão complementar II: Como interpretar o aparente aumento de mortalidade no grupo de tratamento prolongado? Em primeiro lugar, isto é um desfecho secundário, que sofre de maior risco do erro aleatório tipo I (acaso), relacionado a sua maior imprecisão, devido ao menor número de mortes. Portanto, a primeira hipótese é que isto se trata de acaso, ou seja, não podemos rejeitar a hipótese nula. Conforme explicamos no vídeo acima referido, o valor de P a ser considerado significativo quando temos múltiplas comparações deve ser o P original dividido pelo N de comparações. Considerando três os componentes do desfecho primário, o valor de P significativo deveria ser 0.025 / 3 = 0.008. Portanto a diferença de morte com P = 0.05 está longe de ser estatisticamente significante. Além disso, como o clopidogrel aumentaria a mortalidade? Pela maior ocorrência de sangramento, claro. Como a mortalidade por sangramento foi igual nos dois grupos, não foi culpa do clopidogrel. Este resultado decorrem portanto de mortes casuais (câncer, etc), que ocorreram mais no grupo clopidogrel prolongado. FDA, nem precisa “investigar” o ocorrido como estão pretendendo. Gastem seu tempo em coisas mais úteis, por exemplo, não liberando drogas com nível de evidência inadequado.
↧
O Apelo Natureba
* Artigo publicado no Jornal A Tarde de hoje, por Luis Correia.
Com frequência me pego questionando porque étão comum a frase “não gosto de tomar remédio, prefiro coisas naturais a artificiais.”Fico pensando se existe a mesma relutância em aceitar o artificialismo tecnológico quando precisamos de um avião para viagens longas, ou de um celular para manter contato constante com nossos filhos, ou do Google para obter qualquer informação.
Em parte, consigo entender o preconceito de alguns em usar as tais “medicações alopáticas”, pois muitas destas têm sido indicadas de forma inadequada, o que jáchamamos neste espaço de overtreatment. E isso muitas vezes decorre de erros cognitivos do pensamento médico, ou pior, de conflito de interesses.
Por outro lado, percebo que o apelo natureba vai além dessa percepção. Talvez seja uma espécie de instinto de sobrevivência que nos faz evitar o artificial. Porém este instinto éincoerente, pois nossa própria duração jádeixou de ser natural. Natural mesmo seria viver em torno de 30 anos, como era no passado. No início do século 20, apenas 10% das pessoas do mundo chegavam àminha idade, 45 anos. Viver até80 anos não énatural, éartificial. Por isso éincoerência querer viver tanto assim e evitar tecnologias que trarão qualidade a essa vida tão prolongada.
Antigamente não precisávamos nos preocupar com infarto do miocárdio ou derrame. Não dava tempo da gordura se acumular nas artérias, pois antes disso éramos comidos por um leão ou interrompidos por uma pneumonia. Surgiram proteções contra animais maiores, saneamento básico, passamos a lavar mais as mãos, surgiram os antibióticos, e assim fomos nos tornando mais prolongados artificialmente. Agora que alcançamos isso temos duas opções: (1) utilizar tecnologias testadas em ensaios clínicos randomizados, de eficácia comprovada, segurança e tolerabilidade conhecidas; (2) ou preferir um cháde qualquer coisa, sem comprovação cientifica, apenas por ser mais natural. Ou um “fitoterápico”carente de estudos científicos de qualidade.
Nada contra fitoterápicos ou chás, se soubermos que eles funcionam. A questão éque ser natural não égarantia de ser eficaz (nem seguro). Meus pacientes perguntam se eu acredito nessas coisas. Respondo que não tenho o direito de acreditar por acreditar, não seria profissional. Os efeitos dessas propostas precisam ser observados pelas mesmas lentes utilizadas na avaliação dos efeitos das drogas tradicionais. Ou seja, as lentes do método científico, que servem para avaliar o mundo de forma imparcial, isenta de vieses ou erros aleatórios.
Não devemos ter preconceito com o natural, mas também não com o artificial. Ambos devem ser testados e comprovados por estudos científicos, antes de fazerem parte do nosso arsenal. O que chamo (ironicamente) de naturebaéo natural que éaceito sem comprovação científica, apenas por ser natural.
Preferir digitar mensagens de texto ao celular a conversar com o amigo do seu lado émau uso da tecnologia. Indicar tratamentos modernos, porém sem comprovação científica, émau uso da tecnologia. Por outro lado, negar tecnologias de benefício comprovado, em prol do apelo natureba, éuma forma primária de pensamento.
↧
Prof. Marcílio
Prof. Marcílio foi único. Sempre discreto, era um criador que doava ideias transformadoras para que outros protagonizassem a execução. Pescava talentos e cedia o palco principal. Não se distanciava dos mais jovens por barreiras hierárquicas, se aproximava, demonstrava interesse, tornava-se amigo. Um amigo inspirador. Sincero, dizia o que precisávamos ouvir quando o rumo precisava ser acertado.
Prof. Marcílio nos deixa o legado da arte de inspirar e transformar. Um exemplo de líder.
Com o tempo, a saudade será substituída pela satisfação em ter ele como nosso professor. Sua história continuará nos inspirando.
↧
↧
Memórias Acadêmicas do Professor Fuchs
É com prazer que anunciamos o lançamento do aguardado livro "Memórias Acadêmicas: Médico, Professor, Pesquisador - 40 anos", que conta a história de um personagem ativo deste Blog, Flávio Fuchs.
Sua trajetória é contada em tom coloquial, como se o autor estivesse conversando com amigos. Uma trajetória que serve de espelho para aqueles que almejam fazer diferença acadêmica e científica.
Sua trajetória é contada em tom coloquial, como se o autor estivesse conversando com amigos. Uma trajetória que serve de espelho para aqueles que almejam fazer diferença acadêmica e científica.
↧
Evasão de Cardiologistas: Problema ou Solução (less is more?)
Existem evidências científicas que servem mais para provocar reflexão do que para provar um conceito. Esse é o caso do intrigante artigo “Mortality and Treatment Patterns Among Patients Hospitalized With Acute Cardiovascular Conditions During Dates of National Cardiology Meetings”, recentemente publicado no JAMA Internal Medicine. Esta me soa como uma reflexão pertinente, que vai ao encontro do paradigma científico less is more.
Sabe-se que em dias de congresso de especialidade, os hospitais se esvaziam de tais especialistas. Isso é normalmente visto como um problema. Mas será que pode ser uma solução?
Que pergunta maluca, não? Foi esta questão que este provocativo trabalho procurou explorar. O modelo de estudo são os dois grandes congressos americanos de cardiologia, os famosos eventos do American College of Cardiology (ACC) e American Heart Association (AHA). Os autores compararam a mortalidade de 30 dias em pacientes do Medicare, internados por três diferentes condições: insuficiência cardíaca (N = 19.282), parada cardíaca (N = 1.564) e infarto do miocárdio (N = 8.570) durante várias versões dos congressos americanos (2002 a 2011), tendo como controle a mortalidade destas condições fora do período dos congressos.
O resultado deste estudo observacional apontou para menor mortalidade durante o período dos congressos, nos casos de insuficiência cardíaca (18% vs. 25%; P < 0.001) e morte súbita ressuscitada (59% vs. 69%; P < 0.001), comparado aos períodos sem congresso. Vejam a relevância, se isso fosse um tratamento, diminuir o número de cardiologistas pela realização de congressos reduziria a mortalidade com NNT = 17 para ICC, NNT = 10 para morte súbita.
Menos intrigante, mas também provocativo, a mortalidade por infarto foi semelhante quando comparado períodos de congresso (menos cardiologistas) versus períodos fora de congresso (ambos 39%; P < 0.86); ou seja, pouco importou o reduzido número de cardiologistas no caso de infarto.
Mas qual a implicação destes achados?
Primeiro, o mais óbvio: podemos continuar indo aos congressos (uma conclusão confortável em se considerando a proximidade do ACC, em março).
Segundo, o mais inconveniente: será que é bom os hospitais se verem livres de cardiologistas de tempos em tempos?
Mas antes de discutir as implicações, precisamos avaliar o quanto podemos acreditar na veracidade deste estudo. A pergunta científica é reduzir o número de cardiologistas é uma conduta eficaz na prevenção de morte em pacientes com ICC, PCR ou IAM? E os congressos foram utilizados como modelo experimental para explorar esta questão. Engenhoso.
Como sabemos, a evidência definitiva para eficácia de uma intervenção reside no modelo de ensaio clínico randomizado. Então, o modelo ideal para testar a hipótese de que menos cardiologistas reduziria mortalidade seria randomizar pacientes para receber atenção de um ambiente farto de cardiologistas versus ambiente carente de cardiologistas. Isto permitiria que pacientes desses dois grupos fossem semelhantes, não havendo risco de efeito de confusão.
Portanto, não estamos com o modelo ideal de estudo. Porém há uma novidade na análise do caráter observacional deste estudo: ele é quase um estudo randomizado. Por quê? Exatamente porque a escolha do paciente “alocado” no grupo carente de cardiologistas ou no grupo de muitos cardiologistasé aleatória! Sim, pois o paciente na verdade deu azar (ou sorte) de adoecer no momento do congresso. Sorte ou azar = acaso = aleatório = randomizado. Por esse motivo, como observado na tabela de características clínicas do artigo, os pacientes dos dois grupos têm características muito semelhantes. Isso indica que este é um estudo funcionalmente randomizado.
Isso é muito diferente de outros estudos observacionais, no qual o uso da intervenção (usar vitamina, tomar vinho, fazer exercício, fazer cirurgia) é uma escolha do indivíduo ou de seu médico. Escolha esta que acaba por diferenciar os indivíduos (quem escolhe fazer exercício é diferente de quem escolhe ficar na preguiça), gerando efeito de confusão. Porém aqui não, pois ninguém escolhe ficar doente de acordo com o dia de congresso cardiológico.
Ou escolhe? Será que em dias de congresso se internam pacientes menos graves, por dificuldade de contato com seu médico, que está fora da cidade? Bem, a semelhança dos pacientes nos dois grupos não sugere isso. Mesmo assim, autores fizeram uma análise para responder a nossa preocupação e demonstraram que não há variação na frequência de internamento a depender da época de congresso.
Aumentado ainda mais a confiabilidade dos resultados, os autores fizeram o que se chama de análise de sensibilidade, onde se testa a sensibilidade (pleonasmo proposital) do resultado a mudanças do preditor ou da população-alvo. Esta é mais uma forma de verificar se há fatores de confusão escondidos (unmeasured). Vejam que engenhoso: os autores avaliaram se o resultado se repetia quando o congresso era de gastroenterologia, oncologia ou ortopedia. Em nenhum dos casos foi vista a diferença de mortalidade por ICC ou PCR. Em outra análise de sensibilidade, os autores trocaram o desfecho. Compararam durante e fora dos congressos de cardiologia a mortalidade de pacientes que se internaram por fratura de fêmur ou hemorragia gastro-intestinal e não houve diferença de mortalidade desses doenças.
Nesta análise de veracidade, devemos nos preocupar também com a possibilidade de viés de aferição, pois este é um estudo retrospectivo, de revisão de prontuário. Mas será que uma revisão de prontuário erra se o paciente morreu? Na verdade, esse é um desfecho duro, robusto em relação a sua aferição, sendo pouco provável este viés. Além disso, o preditor também não tem erro, pois é basicamente o dia de admissão.
Considerando a “randomização funcional”, a objetividade das variáveis preditoras e de desfecho, as análises de sensibilidade, ficamos mais confiantes de que a mortalidade é maior em ICC e PCR durante os congresso. Porém há uma limitação. Estamos usando um modelo de congresso para testar a oferta de cardiologistas, mas falta no estudo a informação de que de fato o número de cardiologistas nos hospitais foi menor em época de congresso. Esse número reduzido é apenas uma premissa lógica. Por este motivo não podemos considerar que o estudo provou definitivamente o conceito.
Ainda bem, nos salvamos como especialidade ...
Por outro lado, fico a pensar, qual seria uma outra diferença hospitalar que pudesse ocorrer entre períodos de congresso versus períodos sem congresso? Eu não encontro, alguém encontra? (por favor, comentem). Mas mesmo que encontrem, os autores fizeram outra análise engenhosa. Em época de congresso, dados de estudos prévios mostram que a evasão de médicos é maior nos hospitais universitários do que nos hospitais não universitários, pois os médicos professores vão mais a congressos do que os não professores. Daí os autores fizeram a análise separada de hospitais universitários ou não universitários. Bingo!! O efeito protetor da época de congresso quanto a mortalidade de ICC e PCR só ocorre nos hospitais universitários!! Nos demais (em que a evasão de cardiologistas é menor) não houve diferença de mortalidade.
De fato, é um estudo provocativo, com análises engenhosas, que aos poucos vão nos convencendo que pode haver alguma verdade nisso. E já que o propósito maior deste tipo de evidência é provocar reflexão, vamos agora às reflexões.
O Paradigma da Agressividade
O paradigma da agressividade representa uma das heurísticas do pensamento médicos, podendo ser definido da seguinte forma: quanto mais grave o paciente, mais intensa (agressiva) deve ser a conduta. Este tipo de pensamento é considerado racional, pois indica condutas complexas para quem realmente precisa.
Como já comentamos neste Blog, heurísticaé uma atalho de pensamento, baseado em nossa intuição, o que nos leva a vieses cognitivos, pois nos distancia do pensamento baseado em probabilidades. A heurística da agressividadepode estar correta em algumas situações, porém pode agravar o paciente em outras situações. Desta forma, precisamos procurar evidências para cada situação, evitando utilizar este atalho mental como um mantra.
Observem o caso de David e Golias. Golias é um gigante, David um homem pequeno. Cada um representava seu exército em uma batalha em Israel e quem ganhasse a luta conquistaria o território. Como se sabe, David ganhou de Golias, mas não foi pela força. Pela força, ele perderia. Encontrou uma solução inteligente, menos agressiva, porém suficiente para matar Golias.
Nesta metáfora, Golias representaria um paciente crítico e David, o médico. Seria pela agressividade do tratamento que o problema se resolveria?
O paciente muito grave funciona como um sistema altamente vulnerável, onde a consequência de nossas condutas é mais imprevisível do que o normal. O sistema do paciente grave é dos mais complexos dentre os sistemas biológicos. Em sistemas complexos e vulneráveis pode ocorrer o efeito borboleta. Como já comentei neste Blog, o termo "efeito borboleta" decorre da metáfora de que o deslocamento de ar decorrente do simples bater das asas de uma borboleta pode provocar grandes fenômenos meteorológicos, se o ambiente estiver muito vulnerável. O pacientes crítico é muito vulnerável, não podemos perder isso de vista.
Vejam o exemplo da morte súbita ressuscitada em um jovem de 59 anos, sem doença cardíaca prévia. Chega rapidamente no Hospital e é reanimado em 20 minutos. Nesta circunstância, mesmo com eletrocardiograma normal (não há infarto em curso) é muito comum que nós cardiologistas indiquemos a coronariografia imediata, visto que a maior causa de morte súbita nesta idade é doença coronariana. Acionamos o cardiologista intervencionista para fazer o cateterismo de emergência, motivados pelo mais alto grau de gravidade (morreu e foi ressuscitado). Porém não percebemos que após uma morta súbita ressuscitada, o paciente usualmente não morre de outra parada, mas sim das consequências de ter ficado parado por muitos minutos. Injetar contraste na circulação de um paciente que ficou 20 minutos com rim isquêmico devido à parada pode ser desastroso. Ou o anticoagulante usado durante o procedimento tem mais potencial de causar sangramento. E assim por diante. Imprevisível.
Percebo uma frequente confusão entre dois conceitos: plausibilidade extrema e gravidade extrema. O primeiro justifica uma conduta mesmo na ausência de evidências (usar para-quedas ao pular de um avião), mas o segundo não. Na gravidade extrema, o sistema está mais vulnerável às complicações de nossos atos e a conduta agressiva pode ou não gerar um benefício. Na gravidade extrema, o princípio da hipótese nula deve prevalecer (exceto no curso inexorável, quando às vezes condutas podem ser aplicadas, por não se ter nada a perder).
Mas o que isso tem relação com o artigo que estamos discutindo? Exatamente por um achado muito interessante deste trabalho. Os autores analisaram em separado pacientes de alto risco e pacientes de baixo risco, de acordo com o escore de internamento AHRQ e surge outro dado muito interessante: a maior mortalidade em períodos fora de congresso foi observada apenas em pacientes de alto risco. Nos de baixo risco, a mortalidade era igual com ou sem congresso. Isso vai ao encontro da vulnerabilidade do paciente grave, que pode responder mal às nossas condutas heróicas e intempestivas.
Às vezes a melhor atitude é esperar, dar uma chance para que o paciente se equilibre sem que a gente atrapalhe e depois atuar em um sistema mais equilibrado. É ilusório achar que sempre haverá benefício de uma conduta agressiva em um sistema vulnerável. Isso varia.
No infarto grave (Killip III ou IV), acredito que a intervenção coronária percutânea imediata seja benéfica. Porém muitas vezes o CAT é realizado, mostrando um paciente triarterial ou com lesão de tronco, mudando o pensamento para indicação cirúrgica de urgência, como se esta fosse uma ótima saída para o paciente, pois ele é muito grave e precisa de uma revascularização completa. E quanto mais grave, mais urgente indicamos a cirurgia. Isto a despeito de não haver ensaio clínico para esta situação, que compare o tratamento cirúrgico (muito agressivo) com o tratamento conservador, que tentaria equilibrar o paciente ou pelo menos daria uma chance dele se equilibrar sozinho. Mesmo que esta chance seja baixa, às vezes a eliminamos ao submeter o paciente ao grande insulto de uma cirurgia cardíaca. Não posso dizer que sei qual é o certo, mas precisamos reconhecer a incerteza desta situação. Muitas vezes, heurística da agressividade torna os médicos certos de que esta seria a conduta correta, confundindo gravidade extrema com plausibilidade extrema.
O que sabemos é que muitos desses pacientes morrem na cirugia. Daí pensamos, "era muito grave, iria morrer de qualquer forma.” Será?
Precisamos dar um passo atrás e refletir sobre a mentalidade do médico ativo, que faz demais sobre a premissa more is more. O bom médico é aquele que faz muito quando deve fazer muito e sabe recuar quando há dúvida. O treinamento psicológico de pilotos em cockpit de aviões deveria ser aplicado na medicina. Lá, o piloto é orientado a se houver dúvida cancelar a decolagem ou arremeter o pouso (princípio da hipótese nula).
O artigo do JAMA Internal Medicine não prova conceitos, mas provoca nossa reflexão analítica, baseada em uma observação do mundo real. O artigo nos permite discutir mais uma vez o paradigma do less is more. Nos lembra da possibilidade de heurísticas do pensamento médico, enfatizando a o paradigma da medicina baseada em probabilidade (evidências) como uma forma de nos prevenir contra estas armadilhas de pensamento.
E de quebra, esta evidência nos permite ir ao congresso do ACC em março sem peso na consciência, e pensando que talvez nossas pequenas férias poderão ser benéficas para os pacientes.
↧
Os Princípios da Medicina Baseada em Evidências
Colegas, vejam nossa série de 6 vídeos a respeito do pensamento médico baseado nos Princípios da Medicina Baseada em Evidências, no link medicinabaseadaemevidencias.com
↧
A Construção do Projeto de Pesquisa
Ao ler de um artigo científico, assistir a uma palestra, conversar com um colega, vivenciar a prática clínica ou até mesmo durante o ócio, é comum que surjam ideias de trabalhos científicos. Neste momento, é muito bom que nossa mente esteja livre, trabalhando no intuitivo, na inspiração, sem preconceitos ou rigidez, para que a criatividade de faça presente. É o momento das ideias.
Bons clínicos e cirurgiões são excelente criadores de ideias para pesquisa. Porém na maioria dos casos, o projeto em potencial fica apenas na ideia, não avança. Para levar a ideia a frente, não basta a mente criativa (cérebro direito), precisamos desenvolver a mente técnica (cérebro esquerdo). É esta mente que transformará a ideia genial em uma realidade prática.
Uma mente técnica capaz de concretizar um projeto de pesquisa necessita de duas competências: a gerencial e a científica.É comum pessoas que entendem de metodologia, porém cuja organização não os permite executar as ideias. Existem também aqueles organizados, bons gerentes do tempo, porém sem vocação para metodologia científica. O ideal é trabalharmos os dois perfis.
O Desafio Gerencial
Há muitas coisas para fazer durante um dia que são importantes. Vejam o exemplo da escovação dos dentes, algo muito importante, que não podemos deixar de fazer. No entanto, nosso objetivo do dia não pode ser apenas escovar os dentes. Por mais absurdo que este exemplo possa parecer, muitas vezes é isso que acontece conosco. Somos tão absorvidos por atividades cotidianas, que não temos tempo para nos dedicar a coisas que fogem de nossa rotina, mas que seriam transformadoras. Cuidar de pacientes com qualidade é a essência de nossa profissão, porém transformador é algo além do essencial, como por exemplo a atividade científica.
No entanto, é difícil conseguir acrescentar atividades de pesquisa em nossa rotina, pois o assistencial domina nosso tempo. Para resolver essa questão, precisamos separar nitidamente uma coisa da outra. Uma coisa é assistência, outra coisa é pesquisa. São como duas profissões diferentes e cada uma deve ter seu tempo específico (mesmo que um tempinho só para pesquisa). Na ausência desta disciplina, seremos sempre envolvidos pelo manancial do urgente(assistência), deixando sempre para amanhã as ações transformadoras (ciência). Planejamento é essencial para que não sejamos tomados pela urgência do assistencial.
Isso é fácil falar, mas difícil de executar. Daí o motivo porque a maioria não executa. Esse papo cabeça está no início desta postagem, pois um projeto de pesquisa nada mais é do que um plano de ação e este plano só vai dar certo se soubermos distinguir quais as nossas atividades essenciais (assistência) e quais as transformadoras (ciência). As duas são importantes, mas precisam ser planejadas com enfoque diferente.
Less is More
Ideias temos muitas, a arte está em escolher as ideias que receberão um NÃO desta vez, em prol daquela ideia que receberá um grande SIM. Há muito mais chance de sucesso quando planejamos executar 1 objetivo com excelência, do que 12 objetivos ao mesmo tempo. Aqueles que começam com 12 objetivos aparentam fazer muito, porém não conseguem nada (em geral). Isso é o mais comum. Fazendo um de cada vez, chegaremos aos 12 depois de algum tempo. Na verdade, pode ser um pouco mais de 1 projeto, talvez 2 ou 3. No entanto, recomendo sempre 1 projeto a quem está querendo sair da inércia, pois em um momento inicial, o insucesso pode ser altamente frustrante. E quanto maior o número de projetos, maior o risco de insucesso.
Escolhida a ideia, temos que montar um plano de execução. É intuitivo que devemos começar sabendo onde queremos chegar. Mas não é apenas no ponto de chegada que devemos focar durante a execução. Para garantir o sucesso na chegada, devemos focar muito mais no processo do que no desfecho. E o processo é simplesmente dedicar alguma (mesmo que pequena) parte de nossa rotina à pesquisa.
Para ter sucesso na perda de peso devemos focar mais na balança ou na ingesta calórica? Claro que na ingesta calórica, focar na balança ao longo do processo pode ser frustrante. Ficar pensando que tenho que terminar de escrever aquele projeto hoje, pode ser frustrante. Portanto, os gerentes do tempo recomendam que foquemos no processo. Por exemplo, ao longo do tempo meu foco será sentar na frente do computador toda quarta-feira a noite, durante 2-3 horas. Se isto for executado de fato, o projeto ficará pronto em algum momento e este momento poderá ser até antes do planejado.
Assim, devemos saber focar de duas formas: em uma ideia (ao invés de várias) e no processo da rotina. Esse é o segredo do bom planejamento.
O Desafio Científico (o bom projeto)
Muitos acham que o projeto de pesquisa deve ser escrito para que o estudo possa ser submetido ao CEP, concorrer a uma vaga no mestrado ou submeter a um edital de fomento. Tudo isso é útil, porém a maior utilidade do projeto de pesquisa está em organizar nossa mente sob uma ótica científica. O processo de escrever o projeto nos leva a importantes questionamentos, que clareiam nosso pensamento em relação à ideia.
O projeto de pesquisa é a racionalização da ideia, ou seja, sua tradução para um formato metodológico, construindo-se um plano para responder à pergunta da pesquisa. Esse plano é voltado para garantir a qualidade (confiabilidade) da informação a ser gerada pela pesquisa, prevenindo viéses e erros aleatórios.
Ao escrever um projeto, devemos responder a três perguntas: O que faremos? Por que faremos? Como faremos? Respectivamente, objetivo, justificativa e método.
Tudo Começa pela Definição do Objetivo
Quando surge uma ideia, devemos nos perguntar: como eu descreveria o objetivo deste estudo? Este é o pilar principal, pois o projeto todo deve girar em torno desse objetivo. E o objetivo nada mais é do que responder a uma pergunta. Portanto, se identificarmos corretamente a pergunta, fica fácil descrever o objetivo. Em minha experiência, em torno de 70% das pessoas que estão fazendo uma pesquisa não conseguem responder com clareza à pergunta “qual o objetivo de seu estudo?”. E não conseguem, pois de fato o objetivo não está claro na mente daquele pesquisador. Daí ele (ou ela) se atrapalha todo, explica o porquê (justificativa), fala como vai fazer (método), mas não consegue falar a pergunta da pesquisa. Quando não diz “deixe eu abrir meu powerpoint pra lhe explicar.” Se a pergunta estiver clara, a resposta virá de forma imediata, em uma frase.
Observem, eu posso dizer que o objetivo de meu projeto é “correlacionar índice de massa corpórea e glicemia em adultos”. E daí, qual a pergunta do projeto? Qual o sentido de saber se essas coisas são correlacionadas? Na verdade, a pergunta da pesquisa não está corretamente explícita na sentença. Vejam a forma correta de colocar o objetivo, a forma que deixa a pergunta explícita, clareando a mente do pesquisador sobre aonde ele quer chegar: "Testar a hipótese de que excesso de peso predispõe a elevação da glicemia."“Correlacionar” é na verdade o método do trabalho, ou seja, como a pergunta será respondida. Sendo assim, devemos ficar atentos para não confundir objetivo com método.
Na descrição do objetivo, devemos descrever a população-alvo (P), a intervenção (I) testada (exame, tratamento, etc) e o desfecho (O = outcome) que está sendo avaliado. Para nos condicionarmos, utilizamos o acrônimo PICO. O C é de controle (grupo controle), mas nem sempre é necessário.
Em adultos aparentemente saudáveis (População), testar a hipótese de que excesso de peso (Intervenção) predispõe a diabetes (Outcome). Excesso de peso estaria funcionando como uma intervenção que levaria ao desfecho.
Essa simples descrição de nossa pergunta da pesquisa é a chave para a construção de um projeto lúcido.
Usamos o termo objetivo primário para descrever a pergunta que motivou a realização da pesquisa, a razão de sua existência. Podemos descrever também objetivos secundários, que seriam outras perguntas que iremos para explorar, mas que o estudo não foi desenhado exatamente para estas.
Mas cuidado para não se perder descrevendo um manancial de objetivos secundários. Isso pode tirar o foco do que é importante. Muitas vezes quando vejo um projeto cheio de objetivos secundários, é porque o objetivo primário não está convincente para o pesquisador e ele tenta preencher o vazio com outros objetivos. Muitos objetivos secundários podem sugerir que o primário está fraco. Na verdade, gosto de ver quando um pesquisador cita apenas um objetivo, o primário. É como se ele soubesse o que realmente quer.
O Desenho do Estudo
Uma vez definida a pergunta, partiremos para o desenho do estudo. Neste processo de definição, vem a reflexão de se o objetivo é descritivo ou analítico. Isso nos ajuda a planejar os métodos do trabalho, do desenho à análise de dados. A diferença primordial é que no estudo analítico, temos uma hipótese que está sendo testada, enquanto no descritivo, apenas relatamos como algo se comporta.
Descrever a incidência de câncer de mama em mulheres com marcador genético X positivo. Observem que não há teste de associação, não há hipótese testada, apenas uma descrição. A pergunta é “qual a incidência?”
"Testar a hipótese de que o marcador genético X predispõe a câncer de mama." Agora estou comparando a incidência de câncer em pessoas com marcador positivo versus pessoas com marcador negativo. Há uma pergunta sendo testada, que a resposta será SIM caso haja diferença entre os grupos e NÃO caso não haja diferença. Este é um estudo analítico.
Desta forma, se faz útil definir se o estudo é descritivo ou analítico, pois essa percepção levará ao modelo de estudo ideal.
No descritivo, tente começar a frase com a palavra “Descrever …”
No analítico, comece a frase mental por “Testar a hipótese de que …” Assim, você acertará.
Usualmente, em uma discussão bem direcionada, consigo definir em 30 minutos o objetivo da pesquisa. Esses são os 30 minutos mais bem aplicados em todo o processo da pesquisa. São os 30 minutos de ouro. Gosto de chamar de Golden Minutes.
Em segundo lugar, pensaremos no estudo quanto à sua temporalidade. Um estudo descritivo pode ser transversal ou longitudinal. No transversal, quero descrever o momento presente: dentre as pessoas que se apresentam com dor torácica na emergência, quantas estão infartando? Esta pergunta descritiva diz respeito à prevalência de infarto em pacientes com dor torácica, é uma pergunta que se refere ao presente, sendo este um estudo transversal.
No longitudinal (coorte), quero descrever a evolução do paciente: quantas pessoas admitidas com infarto morrerão durante o internamento? (incidência, futuro).
Um estudo analítico, também pode ser transversal ou longitudinal. No transversal: dentre pessoas com dor torácica em aperto, há maior proporção de gente infartando (presente), comparado a pessoas com dor torácica em pontada? Observem que estou comparando dois grupos, no intuito de testar a hipótese de que dor em aperto aumenta a probabilidade do quadro clínico se tratar de infarto. No longitudinal: dentre infartados, mais pessoas morrerão (futuro) se a dor for em aperto, comparado a dor em pontada?Estou portanto, testando a hipótese de que dor em aperto prediz morte em infartados.
Portanto, podemos ter um estudo descritivo-transversal, descritivo-longitudinal, analítico-transversal, analítico-longitudinal.
Em uma terceira forma de pensamento, reflitam se seu estudo tem o caráter diagnóstico, prognóstico ou tratamento.
O estudo diagnóstico tem o objetivo de testar a hipótese de que um método é acurado. Para isso, teremos que (por exemplo) comparar a frequência (momento presente) de inversão da onda T no eletrocardiograma entre pessoas com infarto versus pessoas sem infarto. Isso é analítico-transversal. No estudo prognóstico, podemos apenas querer descrever a mortalidade do infarto (descritivo-longitudinal) ou testar a hipótese de que idosos com infarto têm maior mortalidade do que jovens com infarto (analítico-longitudinal). Já o estudo que testa eficácia de um tratamento deve ser analítico-longitudinal, pois haverá a comparação entre os grupos tratamento versus controle (analítico) e esta comparação será prospectiva, pois se aplica o tratamento e depois veremos o resultado no futuro. O futuro pode ser minutos (morfina reduziu a dor), horas, dias, meses, anos. Mas sempre haverá um seguimento para o futuro.
Recapitulando, primeiro definimos o Objetivo (pergunta), depois o desenho, sob 3 aspectos: forma de análise (descritivo ou analítico), temporalidade (transversal ou longitudinal) e aplicação prática (diagnóstica, prognóstico e tratamento).
A partir de agora, sempre que lerem um artigo ou discutirem um projeto, procurem classificar o estudo destas 3 formas. Vocês perceberão que depois disto feito, o projeto estará sob seu controle, em suas mãos. Terão uma sensação plena de clareza do que querem testar e de como será feito.
Mas o principal é nunca se esquecer de definir a pergunta da pesquisa. Muitos se esquecem …
Justificativa
Antes de dizer como faremos (métodos), precisamos convencer o leitor de que aquela pergunta de pesquisa é importante, que se justifica. A justificativa de um projeto deve passar por 4 ítens, algo que pode ser dividido em 4 parágrafos. O primeiro, a importância do problema, onde diremos que aquela doença é grave ou frequente, ou qualquer outro argumento que mostre que a questão é relevante. Em seguida, quando se trata de uma hipótese a ser testada, devemos explicar o mecanismo da ideia. Por exemplo, como o excesso de peso elevaria a glicemia? Em terceiro lugar, partimos para a originalidade, onde demonstramos que aquela pergunta ainda não está plenamente respondida, dando uma noção do que existe na literatura àquele respeito. De forma opcional, podemos terminar falando do impacto clínico ou científico da informação que será gerada pela pesquisa. Sendo assim, usando esse checklist de 4 pontos, escreveremos sem dificuldade a justificativa, que geralmente é chamada de Introdução. Não devemos nos esquecer de sempre colocar as referências que dão suporte ao mecanismos da ideia e aos nossos argumentos de originalidade.
Métodos
Agora com a ideia de O QUE e POR QUE, precisamos traçar a nossa estratégia (COMO). O método de projeto clínico consta de 3 passos: recrutamento dos pacientes (seleção da amostra), o que faremos com estes pacientes (protocolo) e como analisaremos estes dados.
Na seleção da amostra, precisamos definir a população-alvo. Aliás, essa já foi definida no objetivo, onde descrevemos o P. Depois descreveremos os critérios de inclusão, que detalham exatamente o que define pacientes com aquela característica. Minha população-alvo pode ser pacientes internados por infarto do miocárdio. Em seguida, direi o que é infarto do miocárdio para este protocolo: paciente com dor precordial, eletrocardiograma isquêmico e troponina positiva. É o que garante o ingresso do paciente no estudo, os critérios de inclusão. Depois vem os critérios de exclusão, que representam pacientes da população-alvo que por algum motivo não poderão estar no estudo. Por exemplo, quero avaliar o efeito de uma droga na fração de ejeção do ventrículo esquerdo em pacientes com insuficiência cardíaca. Gostaria de avaliar todos os pacientes com IC, mas terei que excluir aqueles cuja imagem ecocardiográfica não permite a medida da fração de ejeção. Isso é um critério de exclusão, pois este paciente deveria estar no estudo, mas uma limitação o impede. Não confundam critério de exclusão com ausência de critérios de inclusão. Ser normotenso não é critério de exclusão, em um estudo de hipertensos. Pensem que o conjunto de pacientes com critérios de exclusão devem ser um subconjunto de pacientes que tem critérios de inclusão.
Em seguida, falaremos do protocolo do estudo, ou seja, o que faremos com os pacientes recrutados. Se for um estudo diagnóstico, como o exame será feito e quem será o padrão-ouro que usaremos como referência; em um estudo prognóstico, como os dados dos preditores serão colhidos; e no estudo tratamento, descreveremos a intervenção terapêutica testada, como os pacientes serão alocados para tratamento ou controle. Nesta sessão entra como a randomização será feita e se o estudo é cego. E nos estudos prognósticos ou de tratamento, precisamos definir claramente o desfecho primário: se eu falar que o desfecho será morte, como definirei isso: é qualquer morte ou morte por causa cardiovascular? E o que seria morte por causa cardiovascular?
Percebam que estou sendo bastante sucinto, pois essa parte varia muito de estudo para estudo, caberia uma postagem diferente para cada caso. Mas não é tão complicado, vocês vão apenas descrever o que será feito.
Por fim, vem a análise de dados ou análise estatística. No estudo analítico, é importante que a gente defina qual a variável preditora (peso) e a variável desfecho (glicemia). Depois falaremos como será feita a comparação estatística: "usarei correlação de Pearson para avaliar a associação linear entre peso e glicemia". Na descrição estatística, é importante que as variáveis analisadas no estudo sejam citadas. Não usem uma frase sem alma, do tipo que tem em livro de estatística: teste t de student para comparar variáveis numéricas entre grupos. Isso não é o método de SEU trabalho. O método de seu trabalho deve dizer o que você vai comparar: teste t de student para comparar a fração de ejeção entre os grupos droga e placebo.
Esta postagem foi escrita no intuito de servir de um guia geral para o início do pensamento. Quanto usamos um guia para nos orientar, temos mais facilidade para começar, evoluir e concluir o pensamento. Esse guia não deve ser visto de forma rígida, é apenas como um corrimão que os ajudará a subir a escada, mas os degraus desta escada são vocês que devem fazer, se permitindo ter criatividade, sem medo de ser criticados por pseudo-acadêmicos que se incomodam algum formato que foge ao habitual. Ciência é criatividade, e a academia deve estimular a criatividade.
O importante é focar na procura de uma pergunta clara para o projeto e na construção de um método que previne viéses ou erros sistemáticos. E sempre se lembrando que não basta a mente científica, a capacidade gerencial é muito importante para fazer com que não fiquemos apenas no campo das ideias.
A para assistir às nossas vídeos aulas sobre medicina baseada em evidências, usem o link medicinabaseadaemevidencias.com
↧
↧
II Curso de Extensão em Bioestatística
Colegas, na primeira semana de maio faremos o II Curso de Extensão em Bioestatística, parte do Programa de Extensão da Pós-graduação da Escola Bahiana de Medicina. Este curso é aberto ao público externo, mais específico para profissionais e estudantes da área de saúde. Discutiremos como sintonizar nossa mente com o paradigma estatístico, coisa importante para a solução de problemas científicos, clínicos e porque não cotidianos. Apresentaremos os conceitos de inferência estatística, abordaremos de forma completa as análises univariadas e cálculo do tamanho amostral. Isto tudo com treinamento específico no software SPSS.
O curso ocorrerá de forma intensiva, em uma semana, iniciando na segunda e terminando no sábado de manhã. Horário de 18h às 21h. O contato para inscrição é com Ana Paula, cujo telefone é 71-3257-8214. Vejam detalhes no cartaz abaixo.
Espero vocês lá.
↧
Choosing Wisely
Em 2012, o American Board of Internal Medicine iniciou nos Estados Unidos a campanha Choosing Wisely, que hoje se expandiu oficialmente para outros países, como Canadá, Inglaterra, Alemanha, Itália, Holanda, Suíça, Austrália, Nova Zelândia e Japão. Este países estão agrupados no denominado Choosing Wisely International. Esta iniciativa serve de inspiração para qualquer país que insiste em imitar o padrão americano de consumo de recursos pseudo-científicos. O Brasil é um deles.
Choosing Wisely poderia ser traduzido como "usando de sabedoria nas escolhas” ou “escolhendo sabiamente”. Esta iniciativa surge da percepção de que há falta de sabedoria na utilização exagerada ou inapropriada de recursos em saúde. Choosing Wiselyé uma campanha que vai ao encontro do paradigma Less is More, já comentado tantas vezes neste Blog.
Seria impositivo e mal recebido se o American Board of Internal Medicine iniciasse uma campanha contra condutas normalmente adotadas por especialidades médicas. Desta forma, ao invés de criticar os especialistas, a responsabilidade da auto-crítica foi dada a eles. Assim, foi solicitado às especialidades que apontassem condutas médicas correntes que não deveriam estar sendo adotadas. Isto obrigou os próprios especialistas a refletirem e contra-indicarem suas próprias condutas fúteis.
Outro aspecto enfatizado pelos organizadores é que as recomendações do Choosing Wisely não têm o intuito primário de economizar recursos, mais sim de melhorar a qualidade da assistência , que deve ser embasada em evidências, aumentando a probabilidade de benefício e reduzindo o risco de malefício à saúde dos indivíduos.
Além disso, considerando nosso momento atual, vale também salientar que esta não é uma iniciativa governamental nestes países, pelo contrário, é iniciativa da própria sociedade médica.
O Choosing Wisely recomenda o que não devemos fazer. Traz um paradigma interessante, pois normalmente somos treinados a discutir o que devemos fazer. Os guidelines falam muito mais no que devemos fazer, do que não devemos fazer. E as recomendação do não fazer (recomendação grau III) normalmente se limitam a condutas comprovadamente deletérias. No entanto, além da prova do dano, háoutras razões para não adotarmos condutas. Ou colocado de outra forma, não significa que temos que fazer algo sóporque não édeletério.
O ônus da prova estáno desempenho (eficácia) e utilidade (relevância) de uma conduta. Assim, os seguintes motivos podem justifica que não se adote certas condutas:
1)Terapia prejudicial - isso é óbvio, portanto não é o foco principal do Choosing Wisely.
2)Terapia desconhecida quanto à sua eficácia (não há demonstração) - há tantos exemplos de condutas que fogem à plausibilidade extrema, porém são adotadas sistematicamente, baseadas em crenças.
3)Terapia comprovadamente ineficaz, embora segura - isso também se faz, pois muitas vezes ensaios clínicos negativos não são valorizados por irem de encontro a nossas crenças.
4)Testes diagnósticos ou prognósticos aplicados em situações inúteis (fúteis), trazendo resultados potencialmente prejudiciais (overdiagnosis).
O site do Choosing Wisely Norte-Americano traz interessantes recomendações de cada especialidade e deve ser visitados por todos com uma postura reflexiva. Esse é um pensamento de vanguarda, combatendo aquele paradigma que chamamos neste Blog de mentalidade do médico ativo. Algo muito prevalente, porém provavelmente obsoleto em 10-20 anos. Resta cada um saber que caminho escolher: um caminho reflexivo, de vanguarda ou o caminho tradicional e ultrapassado.
Em cardiologia, a companha foi muito feliz ao dizer para “não realizarmos de rotina pesquisa de isquemia miocárdica em indivíduos assintomáticos.” Percebam como (em média) o que os médicos fazem é exatamente ao contrário. Na prática, uma pessoa não pode passar nem perto do consultório cardiológico, que sairá com um pedido de exame não invasivo para pesquisa de doença coronária (teste ergométrico mais comumente, porém cintilografia miocárdica muito frequentemente e a tomografia de coronária surgindo como um método acurado e potencialmente útil, porém com risco de ser usado para promover o overdiagnosis). Por fim, o Choosing Wisely diz, "por favor, não pesquisem doença coronária no pré-operatório de cirurgia de baixo risco." Coisa de gente inteligente.
Gostamos também da recomendação de ortopedistas de não prescrever condroitina ou glucosamina (Condroflex) para tratamento de artrite de joelho. Exatamente, aquele remédio que tantos pacientes afirmam ter reduzido sua dor de joelho, porém sabemos que tudo se deve ao efeito placebo, muito bem demonstrado por um grande ensaio clínico randomizado publicado no NEJM. E ainda tem aqueles que dizem que se a dor melhora, não importa ser placebo. Mas será que devemos, de rotina, propor uma medicina baseada em fantasia? Onde podemos parar?
Certa feita, um dos líderes do Choosing Wisely nos Estados Unidos comparou essa iniciativa ao filme de Indiana Jones, onde o herói procura o Santo Graal. Na cena final, há vários cálices e apenas uma chance de escolher o cálice correto, aquele que seria o Santo Graal. O guardião dos cálices avisa aos personagens: Choose Wisely. O primeiro a escolher, de forma óbvia, escolhe o cálice mais bonito e precioso. Mas como sabemos, em ciência, nem sempre o plausível é o verdadeiro. Aquele não era o Santo Graal e o vilão se dá mal, sendo transformado em caveira. Por outro lado, Indiana Jones é um cientista, e usa sua mente científica para fazer a escolha mais sábia. Ele escolhe o cálice mais simples, mais condizente com os valores de Jesus Cristo. E acerta, conseguindo a conquista do Santo Graal.
Como médicos, precisamos pensar sabiamente. Usar recursos sem comprovação científica ou de forma exagerada nos aproxima do vilão do filme e distancia de Indiana Jones, o nosso herói. Ser herói não é usar da mentalidade ativa, indicar procedimentos, exames, tratamentos fúteis ou incertos. Ser herói é saber quando não fazer as coisas, assumir nossas incertezas, alternando com momentos de postura mais ativa.
* Texto escrito em colaboração de Luis Correia e Guilherme Barcellos
* Texto escrito em colaboração de Luis Correia e Guilherme Barcellos
↧
O jogo das hipóteses e a confusão do Estudo PROMISE
O ensaio clínico PROMISE foi apresentado em março no congresso do American College of Cardiology e simultaneamente publicado no New England Journal of Medicine. Passadas algumas semanas, começo a perceber interpretações equivocadas destes estudo, que nos serve de gancho para uma interessante discussão a respeito do que chamo de jogo das hipóteses científicas.
O PROMISE estudou 10.000 pacientes com indicação de pesquisa de doença coronária, randomizados para duas estratégias de investigação não invasiva: teste anatômico (tomografia de coronárias) ou funcional (teste ergométrico, cintilografia miocárdica ou eco-estresse). O objetivo foi avaliar a influência da estratégia de investigação nos desfechos cardiovasculares.
Não houve diferença alguma entre os dois grupos na incidência do desfecho primário (3.3% versus 3.0%). A despeito disso, estranhamente, muitos estão interpretando o resultado do PROMISE como indicativo de que a melhor estratégia é a avaliação funcional. Vejam nos exemplos abaixo, como há uma conotação negativa para a tomografia de coronária. Ou uma conotação positiva para testes funcionais.
UpToDate: A randomized trial compared coronary computed tomographic angiography (CCTA) and functional testing and clinical outcomes over a median follow-up of two years were similar for both groups. We continue to recommend functional testing as the initial test for most patients with suspected coronary artery disease.
The Heart: CT angiography does not reduce coronary events compared with functional tests.
A razão destes estranhas interpretações está no jogo das hipóteses. Mas antes de explicar o que ocorreu neste trabalho, vamos revisar os diferentes testes de hipóteses que se adequam a ensaios clínicos randomizados: superioridade unidirecional, superioridade bidirecional e não inferioridade. O uso de hipóteses inadequadas gera vieses cognitivos de interpretação do resultado, como veremos a seguir.
Os 3 Tipos de Hipóteses
A superioridade unidirecional é o tipo que estamos mais acostumados e se aplica quando precisamos demonstrar a eficácia de uma estratégia para que se justifique sua utilização. Esta eficácia diz respeito a duas situações: (1) uma conduta deve ser superior à ausência de conduta; (2) uma conduta nova deve ser superior a uma conduta antiga quando esta conduta antiga já teve sua eficácia anteriormente comprovada. Estas duas situações se diferenciam pelo grupo controle. No primeiro caso, o grupo controle é não fazer a conduta (placebo, sham ou controle aberto). No segundo caso, o grupo controle é a estratégia tradicional.
Embora o teste estatístico de comparação seja sempre bicaudal nesta situação, o ônus da prova é unidirecional, pois o único resultado que influencia nossa conduta médica é a superioridade da nova proposta.
Antes de indicar reposição para pessoas que tem vitamina D baixa, precisamos demonstrar que esta estratégia é eficaz clinicamente, comparada a placebo. Este é exemplo da ausência de estratégia como grupo controle. Por que eu faria vitamina D se esta não fosse superior a não fazer vitamina D? Percebam que o ônus da prova está na superioridade.
Já o estudo PARADIGM-HFpretendeu demonstrar que LCZ696 é melhor que enalapril na insuficiência cardíaca. É um exemplo de que no novo precisa se provar melhor do que o antigo que já foi comprovado no passado. É o que se chama de eficácia comparativa. Por que eu trocaria enalapril por esse tal de LCZ696 se este não fosse superior? Não há vantagens práticas desta nova droga, e provavelmente ela viria com um maior custo. Mesmo se tivesse um custo igual, o tradicional é comprovado há muitos anos, está dando certo e já somos experientes com enalapril. Então porque mudar? Não haveria porque mudar se o LCZ696 fosse apenas igual ao enalapril.
A segunda situação que discutiremos é da hipótese de não inferioridade. Esta se aplica quando já existe uma conduta tradicional comprovada e a nova proposta traz alguma vantagem prática (mais simples de usar, mais segura, menos traumática). Neste caso, a nova proposta não precisa ser mais eficaz do que a tradicional, só precisa não ser muito pior. Daí testamos sua não inferioridade. Vejam postagem antiga sobre este tipo de desenho.
É o caso de demonstrar que um novo anticoagulante (que não necessita de controle do TP) é não inferior ao cumarínico; demonstrar que o fondaparinux (que sangra menos) é não inferiorà enoxaparina; ou a tentativa mal sucedida do recente trial BEST em demonstrar que intervenção coronária percutânea com stent everolimus (tratamento menos traumático) é não inferior à cirurgia de revascularização.
Por fim, temos uma situação menos frequente, que é a superioridade bidirecional, o caso do estudo PROMISE. Nesta situação, temos duas estratégias e não há uma grande preferência por uma delas. Ambas são não invasivas; se considerarmos o funcional mais utilizado, a cintilografia, ambas as estratégias oferecem ao paciente uma certa dose de radiação. Se por um lado a tomografia usa contraste, a cintilografia às vezes usa dipiridamol (que causa grande desconforto). E por aí vai, vantagens e desvantagens para os dois lados.
Do ponto de vista prático, há pacientes que se adequam melhor a uma estratégia, outros à outra estratégia. Mas se houver uma estratégia superior em eficácia, esta será a primeira opção independente de questões de ordem prática. E isso valerá para qualquer dos lados. O ônus da prova é bidirecional.
Aí vem o desvio de hipótese promovido pelo estudo PROMISE. Inadequadamente, os autores descreveram um objetivo unidirecional, "testar a hipótese de que o prognóstico de pacientes submetidos ao teste anatômico seria superior aos pacientes submetidos ao teste funcional". Não há razão para que o ônus da prova esteja na tomografia. Mas o desvio na descrição da hipótese gerou o fenômeno de ancoragem cognitiva na maioria dos leitores.
Ancoragem Cognitiva
Este fenômeno cognitivo foi primeiro demonstrado por Daniel Kanheman e Amos Tvesky, dois psicólogos israelenses que ganharam o prêmio Nobel por descreverem nosso principais vieses cognitivos. Em um de seus experimentos, Kanheman pergunta a um grupo de competentes corretores se eles acham que o valor de um certo imóvel avaliado é maior ou menor que 10 milhões de dólares. Após responderem, os voluntários recebem uma segunda pergunta: e quanto você acha que vale o imóvel? A média da resposta foi algo como 7 milhões. Em seguida, ele mostra o mesmo imóvel a um segundo grupo de competentes corretores, só que troca a primeira pergunta. Desta vez, pergunta se o apartamento vale mais ou menos que 1 milhão de dólares. Isto fez com que a média da resposta à segunda pergunta fosse 3 milhões. Percebam que a primeira pergunta induziu a resposta da segunda pergunta. A segunda pergunta foi “ancorada” pelo efeito da primeira pergunta.
Observem que especialistas em apartamento estavam na ilusão de que decidiam o preço baseado em sua experiência. Na verdade, morro de medo de pessoas que se acham muito experientes (especialistas), pois estas esquecem do benefício da dúvida e abrem a guardam para vieses cognitivos.
E foi isso que aconteceu com o estudo PROMISE. A hipótese colocou o ônus da prova na tomografia de coronária e no momento em que esta não conseguiu se provar melhor, a negatividade do resultado ancorou a tomografia para um status abaixo dos exames funcionais. Parece um erro primário cometido por especialistas que escrevem o UpToDate. Mas assim são os vieses cognitivos, nos influenciam de forma inconsciente. É por isso que o pensamento científico precisa ser organizado de uma maneira cuidadosa.
Se reconhecemos esta hipótese do PROMISE como bidirecional, podemos reformular a interpretação. Se nenhuma estratégia foi superior, temos a liberdade de escolher a que melhor se adeque ao paciente.
O PROMISE nos mostra que vieses não provém apenas da metodologia dos trabalhos. Às vezes, o viés está em nossa mente, de maneira involuntária. Tenho dito que o raciocínio científico deve ser permeado pela humildade em reconhecer a incerteza de nossas crenças. A segunda razão para humildade é reconhecer as armadilhas de nosso pensamento.
↧