Correlação não é causalidade !

Um dos conceitos mais interessantes e enganosamente simples da Estatística é também um dos mais traiçoeiros para a maioria das pessoas. É o conceito de correlação.

Em termos simples, a correlação mede o relacionamento entre duas variáveis X e Y. Correlação pode ser positiva, negativa ou nula.

Exemplos:

(1) Quanto maior a renda das famílias, maior o consumo de carne (correlação positiva)

(2) Quanto menor a renda das famílias, menor o consumo de água (correlação negativa)

(3) Altura de uma pessoa e a quantidade de garrafas de cerveja que ela tem em casa (correlação nula).

A correlação entre duas variáveis é representada por um número r que varia de -1 até +1 e o gráfico de dispersão entre X e Y mostra a correlação.

https://edtisensei.zendesk.com/hc/pt-br/articles/360033866451-Diagrama-de-Dispers%C3%A3o-Defini%C3%A7%C3%A3o

Confusão entre correlação e causalidade

A grande confusão está no fato de que pode existir correlação mas não causalidade e nem mesmo dependência entre as variáveis. Correlação não representa causalidade mesmo que a correlação seja muito forte.

Quando isolamos variáveis, vem associações curiosas, mas isso não quer dizer que haja correlação entre elas (ver [1]). Aí a correlação também pode virar piada, tipo:

_Quanto menor o número de aparelhos de tv em casa, mais filhos tem o casal…

Ou ainda (ver [2]):

Os filmes de maior bilheteria do ator Tom Cruise são os que ele aparece correndo, quanto mais tempo corre, maior a bilheteria.

Um estudante de Direito em Harvard, Tyler Vigen, criou um site http://tylervigen.com para mostrar com exemplos engraçados que ilustram como correlação não significa causalidade.

Não foi fornecido texto alternativo para esta imagem

Vigen, de alguma forma, está apenas mostrando que coincidências existem e que podem ser engraçadas (ver[3]).

Por que entender que correlação é, afinal, tão importante?

Segundo o jornalista Ricardo Mioto, muitos argumentos estatísticos resultantes de falsas correlações são utilizados por políticos ou analistas (ver [2]). Algo como: Após determinada lei, o número de homicídios caiu…. tal governo fez o desemprego ser mais baixo

Fake news são difíceis de combater também porque dependem de conhecimentos em Estatística ou em Ciência, de forma geral.

Estamos atravessando a maior crise sanitária dos últimos cem anos. Existe relação de causa e efeito entre afastamento social e a disseminação de vírus? Qual a correlação?

Modos mais sofisticados de análise estão à disposição. Um conceito importantíssimo é o de significância estatística – com ele é possível calcular a chance de um resultado ser fruto de mero acaso.

Agora uma coisa é certa: ficar em casa evita o contágio assim como um avião que não sai do solo, não pode cair!

—-

[1] < http://www.inf.ufsc.br/~marcelo.menezes.reis/contest.html >

[2] < http://www.observatoriodaimprensa.com.br/feitos-desfeitas/como-mentir-com-estatistica/>

[3] < https://mashable.com/article/tom-cruise-running-math-better-movies-mission-impossible/ >

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto:
search previous next tag category expand menu location phone mail time cart zoom edit close