Correlação não é causalidade !

Um dos conceitos mais interessantes e enganosamente simples da Estatística é também um dos mais traiçoeiros para a maioria das pessoas. É o conceito de correlação.

Em termos simples, a correlação mede o relacionamento entre duas variáveis X e Y. Correlação pode ser positiva, negativa ou nula.

Exemplos:

(1) Quanto maior a renda das famílias, maior o consumo de carne (correlação positiva)

(2) Quanto maior a idade de uma pessoa, menor a expectativa de vida (correlação negativa)

(3) Quantidade de cabelos na cabeça e a quantidade de latas de cerveja na geladeira (correlação nula).

A correlação entre duas variáveis é representada por um número r que varia de -1 até +1 e o gráfico de dispersão entre X e Y mostra a correlação.

Confusão entre correlação e causalidade

A grande confusão está no fato de que pode existir correlação mas não causalidade e nem mesmo dependência entre as variáveis. Correlação não representa causalidade mesmo que a correlação seja muito forte.

Quando isolamos variáveis, vem associações curiosas, mas isso não quer dizer que haja correlação entre elas (ver [1]). Aí a correlação também pode virar piada, tipo:

_Quanto menor o número de aparelhos de tv em casa, mais filhos tem o casal…

Ou ainda (ver [2]):

Os filmes de maior bilheteria do ator Tom Cruise são os que ele aparece correndo, quanto mais tempo corre, maior a bilheteria.

Um estudante de Direito em Harvard, Tyler Vigen, criou um site http://tylervigen.com para mostrar exemplos curiosos que ilustram como correlação não significa causalidade.

Vigen, de alguma forma, está apenas mostrando que coincidências existem e que podem ser engraçadas (ver[3]).

Por que entender melhor correlação é, afinal, tão importante?

Segundo o jornalista Ricardo Mioto, muitos argumentos estatísticos resultantes de falsas correlações são utilizados por políticos ou analistas (ver [2]). Algo como: Após determinada lei, o número de homicídios caiu…. tal governo fez o desemprego ser mais baixo

Fake news são difíceis de combater também porque dependem de conhecimentos em Estatística ou em Ciência, de forma geral.

Estamos atravessando a maior crise sanitária dos últimos cem anos. Existe relação de causa e efeito entre afastamento social e a disseminação de vírus? Qual a correlação?

Modos mais sofisticados de análise estão à disposição. Um conceito importantíssimo é o de significância estatística – com ele é possível calcular a chance de um resultado ser fruto de mero acaso.

Agora uma coisa é certa: ficar em casa evita o contágio assim como um avião que não sai do solo, não pode cair!

—-

[1] < http://www.inf.ufsc.br/~marcelo.menezes.reis/contest.html >

[2] < http://www.observatoriodaimprensa.com.br/feitos-desfeitas/como-mentir-com-estatistica/>

[3] < https://mashable.com/article/tom-cruise-running-math-better-movies-mission-impossible/ >

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto:
search previous next tag category expand menu location phone mail time cart zoom edit close