Diagrama de Dispersão ou Correlação
É usado para se verificar uma possível relação de causa e efeito entre duas variáveis objetos de estudo. Revela a maior, menor ou nenhuma dependência de uma variável em relação à outra (Figura 1)
Uso na etapa de Análise do problema do PDCA
Figura 1 – Exemplo de gráfico de dispersão
Tipos de correlações
Podemos ter os seguintes tipos de correlações:
- Correlação linear positiva: ocorre quando a variável “X” aumenta a variável “Y” também aumenta.
Figura 2 – Exemplo de correlação linear positiva
- Correlação linear negativa: ocorre quando a variável “X” aumenta a variável “Y” diminui.
Figura 3 – Exemplo de correlação linear negativa
- Correlação não linear: ocorre quando há um ponto de inflexão.
Figura 4 – Exemplo de correlação não linear
- Correlação nula: ocorre quando a variável “X” aumenta ou diminui, não há variação na variável “Y”.
Figura 5 – Exemplo de correlação nula
Cálculo do coeficiente de correlação (r)
Coeficiente de correlação: É uma medida do grau de correlação entre duas variáveis (representado pela letra r). Varia de –1 a + 1. Quanto mais próximo da unidade (acima de 0,75) mais correlacionadas são as variáveis.
As equações abaixo demonstram como calcular o valor de “r”
Interpretando o valor do coeficiente de correlação (r)
Valores dos Coeficientes | Descrição |
+1,00 | Correlação positiva perfeita |
+ 0,70 a 0,99 | Correlação positiva muito forte |
+ 0,50 a 0,69 | Correlação positiva substancial |
+ 0,30 a 0,49 | Correlação positiva moderada |
+ 0,10 a 0,29 | Correlação positiva baixa |
+ 0,01 a 0,09 | Correlação positiva ínfima |
0,00 | Nenhuma correlação |
- 0,01 a 0,09 | Correlação negativa ínfima |
- 0,01 a 0,29 | Correlação negativa baixa |
- 0,30 a 0,49 | Correlação negativa moderada |
- 0,50 a 0,69 | Correlação negativa substancial |
- 0,70 a 0,99 | Correlação negativa muito forte |
- 1,00 | Correlação negativa perfeita |
Estimativa da reta de regressão y = a + bx (Método dos Mínimos Quadrados)
Onde,
y = Variável dependente
x = Variável independente
Exemplificando:
De acordo com os dados abaixo, verifique se existe alguma correlação entre o tempo prisional de um condenado (variável X em meses) com o número de tentativas de fuga no período (variável Y em quantidade).
Meses (X) | Tentativas de fugas (Y) |
3 | 0 |
6 | 1 |
9 | 2 |
12 | 4 |
15 | 3 |
18 | 5 |
21 | 6 |
24 | 4 |
Calculando:
X | Y | X.Y | X2 | Y2 | |
3 | 0 | 0 | 9 | 0 | |
6 | 1 | 6 | 36 | 1 | |
9 | 2 | 18 | 81 | 4 | |
12 | 4 | 48 | 144 | 16 | |
15 | 3 | 45 | 225 | 9 | |
18 | 5 | 90 | 324 | 25 | |
21 | 6 | 126 | 441 | 36 | |
24 | 4 | 96 | 576 | 16 | |
Soma | 108 | 25 | 429 | 1836 | 107 |
Média | 13,5 | 3,125 |
Aplicando os valores acima nas fórmulas,
Reta da regressão:
b = 732 / 3024 = 0,242
a = Média (y ) – b. Média (x )
a = 3,125 - 0,242*13,5
a = 3,125 – 3,268 = - 0,143
Substituindo os valores de “a” e “b” na equação da reta temos a seguinte equação da regressão:
y = a + bx
y = - 0,143 + 0,242x
Esta equação permite prever o número de tentativas de fugas que teremos em função do tempo prisional. Por exemplo: Se um preso ficar 17 anos na cadeia, de acordo com a equação acima ele tentará fugir 4 vezes.
y = - 0,143 + 0,242*1= = 4
Coeficiente de determinação (r2)
Este coeficiente define quanto à variação da variável dependente (Y) pode ser explicada pela variação da variável independente (X).
No caso do exemplo acima, (r2) = 0,77, ou seja, ao utilizar a equação da regressão, podemos afirmar que 77% das tentativas de fugas (Y) podem ser explicadas pelo tempo prisional (X). Os outros 23% das tentativas são devidas a outras variáveis independentes, para identificá-las é necessário fazer uma análise de regressão multivariada.
REFERÊNCIAS
PESSOA, Gerisval A. Notas de aula da disciplina PDCA e Seis sigma: metodologia e ferramentas da qualidade. São Luís: FAMA, 2010.
amei ! Parabéns !
ResponderExcluirMuito bem explicado parabéns!!
ResponderExcluir