Regressões Lineares e outliers

Multiplicadores e ouliers por A.Sousa

Multiplicadores e outliers por A.Sousa

A semana passada evidenciámos como os gráficos podem ser “entendidos” para fazerem passar determinadas conclusões, ou popularmente “torturar os números até que digam o que queremos”. Nesse gráfico foi utilizado o método de regressão linear, que permite aproximar a uma reta um conjunto de pontos. Este método é, todavia, muitas vezes pouco utilizado, porque, supomos nós, a maior parte das pessoas os considere de difícil cálculo.

Já várias vezes podíamos ter utilizado regressões lineares aqui no Poupar Melhor, mas nunca se propiciou. Quando falamos da evolução de temperaturas, da evolução dos juros, ou doutras variações de valores, podemos facilmente utilizar este método. Todavia, esta semana, em função da troca de ideias que mantemos entre os autores do Poupar Melhor, resolvemos demonstrar a utilização do método da regressão linear no âmbito da polémica do multiplicador do FMI.

O problema é descrito originalmente neste documento do FMI, páginas 61 a 63 do PDF (agradecimentos ao @JotaNR que nos facilitou a vida, apontando-nos diretamente aos factos). Os dados originais da Figura 1.1.1 estão neste link. Depois de meter os dados na nossa folha de cálculo (Ver Google Drive), é fácil criar um gráfico animado que demonstra a variação da reta com base na remoção dos valores anormalmente diferentes da maioria.

Cada um dos gráficos é um gráfico XY (Scatter) gerado pelo OpenOffice Calc. Depois, é só carregar com o botão direito do rato nos pontos do gráfico, e seleccionar “Insert Trend Line“. Selecciona-se o tipo “Linear”  com “Show equation“… Et voilá. Já têm um gráfico com a regressão linear, e correspondente multiplicador do FMI, que é o valor que se observa no coeficiente de x.

Para fazerem a animação que facilita o entendimento de toda esta discussão, os gráficos gerados são depois exportados em formato de imagem para ficheiros separados. Fazem o upload para um site de geração de imagens animadas como o makeagif.com e geram a animação em menos de 2 minutos.

A interpretação dos factos registados deve levar em linha de conta se dos factos recolhidos existem alguns que se distanciem especialmente da maioria dos registos. Estes podem ocorrer por acaso, mas também por um erro/falha do processo de recolha ou mesmo por um erro/falha na teoria. A interpretação dos dados sem a remoção destes outliers pode levar a erros de análise que se pagaram pelas decisões mal tomadas que forem suportadas nos mesmos. Assim, como exercício, gerei as variações na animação com base nas seguintes notas:

  1. Ninguém se quer comparar com a Grécia;
  2. A Alemanha aqui também parece ser um caso à parte… e
  3. A Roménia o que faz no gráfico?

A utilização destes outliers já foi questionada em artigos especializados, nomeadamente do Financial Times. No artigo “Has the IMF proved multipliers are really large?” questiona-se a robustez da análise do FMI, enquanto no artigo “Robustness of IMF data scrutinised” essa robustez é claramente escrutinada, equacionando-se por exemplo porque foram retirados países como a Nova Zelândia, Estónia, Letónia e Lituânia. Ambos os artigos são apenas visíveis mediante registo, mas é possível fazê-lo gratuitamente. Como bónus, eles dão uma folha de cálculo com mais dados que os nossos, e uma imagem elucidativa. Com os dados do FT, ou com os que deixamos acima, ficam preparados para que possam dar uma vista de olhos, e “torturar” o método, que afinal está ao alcance de todos para facilitar o entendendimento destas questões complexas.

Tags: , ,

{ 1 comment to read ... please submit second! }

{ 1 Pingbacks/Trackbacks }

  1. A crise Grega explicada em gráficos » Poupar Melhor