Tag: estatística

  • Meu teste deu positivo. E agora? Entendendo a sensibilidade e a especificidade dos testes diagnósticos

    Os testes para diagnóstico de doenças são bons? São ruins? Funcionam? Vamos destrinchar um pouco sobre a teoria dos testes diagnósticos de uma forma mais intuitiva sem precisar de fórmulas. Vamos ver que os testes não são livres de erros. Vamos entender o que significa dizer que um teste tem 95% de sensibilidade… E, principalmente, por que isso não te conta a história toda!

    Esse post foi elaborado a partir da série de tweets escrita pelo Felipe Campelo*, com algumas pequenas alterações para se adequar melhor aqui no formato do blog!

    Antes de mais nada: o que explicamos aqui não tem nada a ver com a marca ou o tipo do teste (ao longo do texto você vai entender o porquê), mas sim com a matemática que está por trás do diagnóstico. Isso, porque os testes diagnósticos compreendem uma importante aplicação da teoria da probabilidade. Mas não precisa fugir – como falei antes, prometo que não vamos te pedir para decorar nenhuma fórmula! Vamos lá?

    Para começar a entender o que acontece quando você faz um teste para qualquer doença, vamos pensar que você só tem duas possibilidades: ou está doente, ou está saudável. O teste também só tem 2 possibilidades: ou é positivo, ou é negativo.

    Vamos desenhar para ficar mais fácil!

    Essas duas variáveis resultam em 4 possibilidades:

    – Você está doente e o teste é positivo: verdadeiro positivo (VP).

    – Você está saudável e o teste é negativo: verdadeiro negativo (VN).

    – Você está saudável e o teste é positivo: falso positivo (FP).

    – Você está doente e o teste é negativo: falso negativo (FN).

    Se olharmos para os totais de cada linha e cada coluna, vemos que:

    – as colunas nos dizem quanta gente está doente (ND) ou saudável (NS).

    – as linhas dizem quanta gente testa positivo (N+) ou testa negativo (N-).

    – o último quadro da diagonal nos indica o número total de pessoas na população (N).

    A sensibilidade e a especificidade de um teste dizem respeito às colunas:

    A Sensibilidade do teste é a proporção entre o número de doentes que o teste consegue detectar (VP) e o número total de doentes (ND). Em outras palavras, é a probabilidade de o teste ser positivo para uma pessoa doente: P(Teste+|doente).

    A Especificidade informa qual a proporção entre o número de pessoas saudáveis que o teste detecta como “negativas” (VN) e o número total de pessoas saudável (NS). Em outras palavras, é a probabilidade de o teste ser negativo para uma pessoa saudável: P(Teste-|saudável).

    Até aqui tudo bem, mas tem um probleminha: o que eu quero saber não é a chance do teste dar positivo caso eu esteja doente – o que eu quero saber de verdade é: Se o meu teste deu positivo (N+), qual a chance de eu estar realmente doente (VP)? [é inclusive o nome desse post!] E essas duas coisas normalmente são diferentes. Essa outra coisa que eu normalmente quero saber também tem um nome bonitinho: precisão, que a gente descobre olhando para as linhas do nosso quadro.

    A Precisão (ou valor preditivo positivo) é a relação entre a quantidade de pessoas doentes que testaram positivo (VP) e o número total de testes positivos (N+). Em outras palavras, é a probabilidade de você estar doente, dado que o teste deu positivo: P(Doente|Teste+)

    E é aqui que entra o probleminha que eu mencionei acima. O quadro faz parecer que é muito simples calcular a precisão. E até que é, desde que você tenha uma ideia do quão prevalente a doença é na população. A Prevalência nos indica qual é o porcentual de pessoas que realmente estão doentes (ND) na população (N).

    Vamos imaginar, por exemplo, que a tenhamos um teste de 95% de sensibilidade (95% de chance de dar positivo se você estiver doente) e 95% de especificidade (95% de chance de dar negativo se você estiver saudável). Como podemos fazer para calcular qual a precisão do teste?

    Como falamos ali em cima, precisamos saber da prevalência da doença. Aqui, neste exemplo, vamos estipular que a taxa-base doença seja de 1%, ou seja, a doença afeta 1% da população (100 em cada 10.000). Agora fica bem fácil usar a sensibilidade e especificidade do teste para calcular os testes positivos e negativos em cada coluna. Vamos lá!?

    Repara direitinho nos valores da tabela… É aí que vem a coisa curiosa!

    Embora esse teste de faz-de-conta tenha 95% de sensibilidade e de especificidade, a maioria das pessoas que testa positivo seria de falsos positivos (495), simplesmente porque teria muito mais gente saudável do que doente.

    Além disso, a precisão, nesse caso hipotético, seria de só 16,1% – em outras palavras: você teria chance de 16,1% de estar doente caso seu teste dê positivo!

    Assim, se o teste dá positivo, a sua chance de estar realmente doente ainda seria relativamente baixa, embora seja 16 vezes maior do que a taxa-base da população (que é de 1%).

    É um pouco, confuso… mas é assim mesmo quando vemos isso pela primeira vez. Se precisar, dê mais uma olhadinha antes de prosseguir para olhar a próxima tabelinha!

    Aqui, vamos usar dados mais realistas (ainda que antigos)! Vamos considerar um teste para COVID com especificidade de 99% (mais comum) e para a prevalência da doença, vamos utilizar 10,6% (a estimativa de COVID em Manaus no relatório do Imperial College do dia 08/05). Considerando esses dados, a fazendo as contas igual fizemos ali em cima, temos a precisão do teste seria de 91,8%.

    Agora, para efeitos de comparação, se considerássemos esse mesmo teste, mas com a prevalência estimativa para São Paulo na mesma data teríamos: Prevalência de 3,3%, Sensibilidade de 95% e Especificidade de 99%. Fazendo os cálculos, a Precisão seria de 76,6%.

    Bom… Isso quer dizer que se a prevalência for baixa e você testar positivo pode sair por aí felizão? NÃO!

    Quando fizemos esses cálculos, dessa forma, estamos considerando que uma pessoa aleatória fazendo o teste. Porém, geralmente quando você é testado, você provavelmente tem ou teve sintomas (ou morreu de causa suspeita), ou entrou em contato com alguém que teve COVID. Isso tudo impacta no cálculo e deve ser levado em consideração. Por exemplo, a prevalência entre pessoas com sintomas é MUITO maior do que na população em geral.

    OUTROS PONTOS RELEVANTES !
    – A interpretação do resultado de um teste diagnóstico depende de qual parcela da população está sendo avaliada (é um indivíduo qualquer ou de um grupo de risco?).
    – Situações prévias (sejam subjetivas ou objetivas) influenciam o cálculo. Esse tipo de estatística que fizemos aqui, recebe o nome de cálculos bayesianos ou lógica bayesiana.
    – Os cálculos apresentados aqui servem para qualquer tipo de teste. Usamos exemplo da COVID por ser o que estamos passando no momento. Mas pode ser um teste de gravidez, um teste para detecção de HIV, etc.
    – Em Estatística chamamos os falsos positivos de erro tipo I, e os falsos negativo de erro tipo II.

    *Felipe Campelo é professor da Escola de Engenharia da UFMG (Departamento de Engenharia Elétrica) e trabalha com a integração entre modelagem estatística e otimização, e com aplicações de aprendizado de máquina para (entre outras coisas) priorização de alvos na investigação de exames e vacinas. Além disso, faz divulgação científica no Twitter.

    Aproveite e nos siga no Twitter, no Instagram e no Facebook!

    BIBLIOGRAFIA

    Aproveite e nos siga no Twitter, no Instagram e no Facebook!

    logo_

    Os argumentos expressos nos posts deste especial são dos pesquisadores, produzidos a partir de seus campos de pesquisa científica e atuação profissional e foi revisado por pares da mesma área técnica-científica da Unicamp. Não, necessariamente, representam a visão da Unicamp. Essas opiniões não substituem conselhos médicos.


    editorial

  • O que é essa curva que a gente tem que achatar? – parte 2

    No último post falamos sobre como analisar e obter muitas informações de um gráfico. Agora vamos dar mais um passo para entender de vez o que é essa curva que a gente tem que achatar e o que resulta disso.

    Para começar, vamos observar o que podemos entender de um gráfico que mostra o curso de uma doença levando em conta o número de casos e o tempo.

    Observe que o gráfico abaixo começa em uma curva que sobe até um nível máximo (que é o pico) e depois começa a diminuir. O pico está representado pelo ponto amarelo no topo do gráfico, achou!? Mas, se observamos mais atentamente, observamos que a inclinação dessa curva varia ao longo do tempo. Vemos isso analisando as retas que traçamos ao longo da curva! Quanto mais inclinada (mais vertical) mais rápido o curso da doença. Quando menos inclinada (mais horizontal), mais lento o curso da doença.

    Sabendo disso, fica mais fácil entender a variável R. Ela indica quantas pessoas são contaminadas a partir de cada indivíduo contaminado.

    Temos estimado para o Brasil (em 01/05/20) um R entre 2 e 3. Isso significa que, para cada caso confirmado, espera-se que ocorram mais 2-3 novos casos. Podemos falar que quanto menor o R, mais suave (menos inclinada) é a curva de crescimento de casos. Quando o R=1, a curva fica plana, uma linha horizontal, porque não há aumento ou diminuição de casos (é a linha amarela). E, para que a curva comece a diminuir, o valor de R deve ser negativo.

    É a partir dessa ideia do valor que R que vem a expressão “VAMOS ACHATAR A CURVA!”. Vamos falar disso aqui embaixo, usando como base o gráfico que ilustra a nossa série– e que parece o morro do Pão de Açúcar no Rio de Janeiro!

    Em ROSA temos uma curva qualitativa de número de casos por tempo. Como você deve ter visto, a COVID tem muitos sintomas graves que podem levar os infectados a dependerem de hospitalização. Em alguns casos, inclusive, os pacientes precisam ser internados em UTIs. A quantidade de leitos é limitada e mal distribuída pelo país. Mesmo dentro dos estados, esses leitos podem estar concentrados em uma determinada cidade ou região. Esse limite imposto pelo número de leitos é o que estou chamando aqui de “capacidade máxima do sistema de saúde”. A partir do momento em que essa capacidade é atingida, pessoas deixam de ser atendidas e a chance de morte aumenta muito (lembra o que aconteceu na Itália?). Olhe no gráfico acima como uma parte dos casos fica acima dessa capacidade limite… esses casos representam as pessoas que não terão nem mesmo a chance de tentarem um leito, já que não haverá nenhum disponível.

    Agora podemos falar da curva AZUL. Nela vemos uma situação em que medidas de contenção da contaminação foram tomadas, reduzindo o valor de R. Observe como o aumento de casos foi menor e espalhado por um período de tempo maior. Com isso, observamos que o número de novos casos foi suportado pelo sistema de saúde até iniciar seu declínio. Veja que o ponto máximo do gráfico (o pico) ficou bem mais embaixo.

    Você provavelmente deve ter ouvido que o pico seria em março, depois no início de abril, aí falaram que seria no final de abril, em maio, em junho… Por que isso acontece? Vamos entender, agora, por que o pico da COVID está sendo estimado cada vez mais para frente

    Como falamos ali em cima, R é uma variável e ela é impactada diretamente pelas medidas de prevenção que estão sendo tomadas (quarentena, lock down, uso de máscaras….). Quanto mais efetivas as medidas de proteção e maior a adesão pela população, menor o R. Quanto menor o R, mais a curva é achatada. Quanto mais achatada a curva, mais o pico é postergado (deslocado para frente no tempo). Ficou complicado? Olha essa figura aqui embaixo que vai ficar mais claro! 

    Isso mostra que, quanto mais afastada a nova data do pico, mais as medidas de distanciamento social estão funcionando e menos sobrecarregado fica o sistema de saúde.

    Então, só para falar mais uma vez: O objetivo dessa estratégia (achatar a curva) é permitir que as pessoas sintomáticas de COVID que necessitem ser internadas tenham leitos hospitalares disponíveis. 

    No site especial sobre a COVID no Our World in Data temos acesso a vários gráficos interativos, nos quais podemos selecionar os países que queremos comparar.

    Separei dois gráficos que relacionam mortalidade por COVID e tempo, ambos atualizados até o dia 01/05/2020. A seleção dos países foi feita com o objetivo de obter diferentes padrões de curva para que possamos aplicar os conceitos que trabalhamos nesses dois posts. Vamos trabalhar agora com uma análise quantitativa – e com dados reais!

    O primeiro gráfico nos mostra dados que permitem avaliar se estamos atingindo o pico da curva com base no número de mortes por dia em cada país. Selecionei o Brasil e o Equador porque eles apresentam comportamentos bem interessantes. Comentários de interpretação estão nas bordas dos gráficos.

    Este segundo gráfico nos mostra o número total de mortes por país. Ou seja, diariamente são acrescentadas, ao montante anterior, as novas mortes ocorridas naquele dia. Para esse gráfico selecionei os Estados Unidos, a Espanha, o Brasil e a China – todos com comportamentos bem distintos. Como no outro gráfico, os comentários estão nas laterais. Mas quero chamar atenção para as letrinhas de A a E que coloquei nos gráficos. Se observarem com atenção, bem clarinho no fundo, conseguimos observar o desenho das curvas de acordo com a velocidade de aumento no número de mortes (as letrinhas indicam essas curvas) – é bem interessante!

    Espero que você tenha gostado dessa postagem e que eu tenha conseguido mostrar como analisar esses gráficos pode não ser tão difícil como pode parecer, além de ser bem interessante e nos fornecer muita informação!

    Se você ainda ficou com alguma dúvida ou tem algum gráfico que quer que a gente dê uma olhadinha, entre em contato em alguma rede social!

    Até a próxima! =)

    Aproveite e nos siga no Twitter, no Instagram e no Facebook!

    Para mais informações, além das dicas passadas, dê uma olhadinha nesses sites também!

    *Doença Causada Pelo Novo Coronavírus (COVID-19): mais perguntas do que respostas, no site da Sociedade Brasileira de Medicina Tropical.

    *Site especial sobre a COVID-19, no Our World in Data


    logo_

    Os argumentos expressos nos posts deste especial são dos pesquisadores, produzidos a partir de seus campos de pesquisa científica e atuação profissional e foi revisado por pares da mesma área técnica-científica da Unicamp. Não, necessariamente, representam a visão da Unicamp. Essas opiniões não substituem conselhos médicos.


    editorial

  • O que é essa curva que a gente tem que achatar? – parte 1

    Oi! Nas últimas semanas o que mais estamos vendo nas notícias, reportagens e posts são gráficos… E quase sempre acompanhados da frase: “Vamos achatar a curva!

    Mas… Como a gente analisa um gráfico? Quanta informação a gente consegue tirar dele? O que é essa tal curva que temos que achatar? E mais… O que significa achatar a curva? E esse pico da infecção que vive mudando de dia?

    Então… vamos falar um pouquinho isso?

    Mas como o assunto é grande, vamos dividir em dois posts… Neste aqui, o primeiro, vamos falar sobre como analisar um gráfico e das informações que conseguimos retirar dele. No próximo (em breve coloco o link aqui) vamos tentar entender os gráficos da COVID; a tal da curva exponencial; como e porque a gente achata a curva; o que é e porque o pico da infecção muda de data. Vamos lá!?

    Para isso vou usar como exemplo esse gráfico que tem circulado e feito muito sucesso nas redes sociais!

    O gráfico dessa figura é um GRÁFICO DE LINHA, que é usado para demonstrar como, ao longo do tempo, um fenômeno que está sendo observado evoluiu. Pode ser a variação da velocidade de um carro, o preço do dólar, ou o número de casos de ativos de COVID.

    1. OS EIXOS X e Y: Vamos primeiro observar as linhas em preto. Temos o eixo HORIZONTAL (ou X) que aqui mostra a passagem do TEMPO (a setinha indica que quanto mais à direita, maior o tempo decorrido). O eixo VERTICAL (ou Y), neste gráfico indica o número de casos ativos de COVID-19 (da mesma forma, a setinha indica que quanto mais acima, maior o número de casos).

    2. CADÊ OS NÚMEROS?: Reparou que ele não dá os valores dos eixos X e Y? Ou seja, não sabemos exatamente de quantos dias ou casos estamos falando. Isso acontece porque tratamos aqui apenas de uma análise QUALITATIVA da informação. Quando estamos colocamos valores reais ou estimados (obtidos por análise estatística, por exemplo), falamos que estamos fazendo uma análise QUANTITATIVA dos dados!

    3. LINHAS DE CORES DIFERENTES: Nós temos duas linhas coloridas, mas o que elas significam? Para isso a gente consulta a LEGENDA. Ali a gente tem as informações que nos indicam que: em VERMELHO vamos observar a evolução de casos ativos numa situação “sem medida alguma” de prevenção; já em VERDE, vamos observar a evolução de casos em uma situação “com medidas de prevenção”.

    4. VAMOS OLHAR AS LINHAS: Vamos agora analisar o gráfico com as informações que temos disponíveis (os eixos X e Y e as cores das linhas). Escolheremos uma linha e vamos seguindo-a horizontalmente para ver a evolução ao longo do tempo e verticalmente para acompanharmos a variação do número de casos. Tudo isso ao mesmo tempo! Vamos começar pela linha vermelha.

    5. A CURVA VERMELHA: A gente começa no cantinho esquerdo, onde a linha vermelha está no tempo zero e com o número de casos igual zero, também! Isso representa uma situação em que não temos pessoas contaminadas. Até que isso muda… observe que a medida em que o tempo vai passando (para a direita), a curva vai subindo! Isso mostra que o número de casos ativos está aumentando com o passar do tempo.

    6. A FORMA DA CURVA VERMELHA: Você reparou que a linha vermelha não é uma linha reta? Ela é curva. Isso também traz uma informação para a gente. E tem a ver com a quantidade de novos casos por dia… Se o aumento fosse linear (por exemplo, 1 caso novo por dia), teríamos no dia 0 = 0 caso; dia 1 = 1 caso; dia 2 = 2 casos; dia 3 = 3 casos, […] dia 20 = 20 casos – e a linha seria uma reta. Na COVID sabemos que cada pessoa pode contaminar várias outras, e assim, o aumento de casos NÃO É linear. Vamos considerar que aqui, apenas para exemplo, que o número de casos dobre a cada dia. Assim, teríamos no dia 0 = 0 caso; dia 1 = 1 caso; dia 2 = 2 casos; dia 3 = 4 casos, no dia 4 = 16 casos, no dia 5 = 32 casos, […] dia 20 = 1.048.576 casos. Viu como o aumento é muito maior nesse segundo caso? Quando colocamos esses dados num gráfico, o resultado é essa linha curva, que vai aumentando muito em pouco tempo. A desenho final dessa curva depende de como o número de casos aumenta, mas ela terá um formato semelhante à curva vermelha!

    7. A CURVA VERDE: Vamos olhar a curva verde da mesma forma como olhamos a vermelha: número de casos e passagem do tempo ao mesmo tempo. Vamos lá?

    8. A CURVA VERDE SOBREPOSTA À CURVA VERMELHA: observe que o início da curva verde é igual ao da curva vermelha (eles se sobrepõem). Isso significa que a doença está se comportando igual nas duas curvas. Mas porque isso acontece? O início dos resultados da implementação das medidas de proteção só é visível algum tempo depois do início de casos, então, o início das duas curvas mostra uma situação semelhante nos dois casos!

    9. SOBRE O MORRINHO QUE A CURVA VERDE FAZ: Veja agora que após o início das medidas de proteção a curva verde muda de comportamento… Acompanhe! Primeiro era diminui o ritmo de crescimento do número de casos ativos até atingir um ápice. Em seguida, começa a diminuir aos poucos, indicando que menos pessoas estão desenvolvendo casos ativos de COVID.

    Vamos voltar no gráfico original?

    10. A CURVA VERDE QUE VIRA VERMELHA: O grande problema de as ações de prevenção funcionarem é por passarem a impressão de que “as coisas não são tão ruins quanto falaram que seria E isso pode levar ao afrouxamento dessas mesmas medidas que estavam funcionando. Esse relaxamento, por sua vez, leva às condições iniciais (sem medidas de proteção) fazendo a curva crescer novamente!

    Por isso, vamos cuidar de nós mesmos e vamos cuidar dos outros (os que estão perto ou longe – em todos os sentidos).  Saúde pública tem que ser discutida com seriedade e acontece com fatos e estudos científicos opiniões.

    Se você pode, fica em casa… 

    Mas se, como eu, você também tem que sair para trabalhar: toma cuidado

    Para ler a continuação, clique AQUI!

    E tem muita gente bacana divulgando informações acuradas sobre a COVID. Olha só:

    Aproveite e nos siga no Twitter, no Instagram e no Facebook!


    logo_

    Os argumentos expressos nos posts deste especial são dos pesquisadores, produzidos a partir de seus campos de pesquisa científica e atuação profissional e foi revisado por pares da mesma área técnica-científica da Unicamp. Não, necessariamente, representam a visão da Unicamp. Essas opiniões não substituem conselhos médicos.

plugins premium WordPress