Ejemplos de diagramas de dispersión

Compartir en las redes sociales

¿Qué es el diagrama de dispersión y por qué se utiliza?

Un diagrama de dispersión es un presentación pictórica de la relación entre dos variables.
Un diagrama de dispersión puede utilizarse para averiguar la correlación entre las variables.
Por ejemplo, a partir del diagrama de dispersión podemos averiguar que la altura y el peso de una persona tienen cierta relación entre sí.

La relación de dispersión se define como:

donde, ( X) representa la variable independiente (altura o peso), y ( Y) representa la variable dependiente (altura o peso). El coeficiente de correlación entre dos variables también se llama a veces valor r. Puede definirse como la proporción de pares en los que ambas variables están en la misma dirección (números positivos) o ambas están en direcciones opuestas (números negativos).

Aunque los diagramas de dispersión no se dibujan con todos los conjuntos de datos, hay algunos conjuntos de datos en los que se deben utilizar diagramas de dispersión.

Ejemplo:

– Relación entre variables en la misma dirección.
por ejemplo, cuando la altura y el peso aumentan juntos, o cuando la deuda y los ingresos aumentan juntos. [See below diagram]

– Relación entre variables en direcciones opuestas, por ejemplo, cuando la altura aumenta y el peso disminuye.
[See below diagram]

¿Por qué funciona para estos datos?

La altura es independiente del peso, por lo que obtenemos un coeficiente de correlación positivo (r = +0,177). Del mismo modo, obtenemos un coeficiente de correlación negativo (r = -0. 069) para la variable ingresos, que es significativamente diferente de cero.

Ejemplo: Si hay intereses en una determinada acción y el precio de esa acción sube, el número de personas que compran esa acción también aumentará. Esto significa que podemos utilizar esta influencia para predecir el precio futuro de la acción. La correlación entre las dos variables es de +0,596, por lo que indica una correlación positiva o alta entre las variables en cuestión.

Para conocer el precio de una acción en la actualidad, es necesario saber cuánto ha subido en el pasado. Para medir esta subida, utilizamos un dato llamado valor actual. Pero para predecir la subida futura (utilizaremos este conjunto de datos para probar nuestro modelo), tenemos que resolver los valores pasados de esta variable.

Ejemplo: La empresa XYZ vende muchos productos diferentes. Vende más productos por aumentos de precio que por aumentos de calidad (las ventas aumentan en más de 5 millones de dólares después de cada aumento de calidad). Además, las ventas disminuyen cuando el precio del producto se reduce en más de 5 millones de dólares.

Esta situación se utiliza para ilustrar una tendencia. Al predecir el precio de las acciones en el futuro, hay que tener en cuenta estas tendencias, como la cantidad de acciones que se venderán por un aumento o una disminución del precio. Estas tendencias no son fáciles de analizar y cambian con el tiempo (por ejemplo, cuando los precios de las acciones caen durante largos periodos de tiempo, algunos inversores pueden perder el interés por las acciones).

¿Qué herramienta utilizar para hacer un diagrama de dispersión?

No se necesita nada especial para la creación del diagrama de dispersión, todo lo que se necesita es una lista de pares de valores para cada variable.
Para averiguar la relación entre dos variables, hay que crear un diagrama de dispersión, en el que ambas variables están representadas por sus valores naturales. La relación entre dos variables se puede expresar de la siguiente manera:

Donde ( X) y ( Y) son las variables (o los valores ??de esas variables) y (a) y (b) son constantes o coeficientes. El coeficiente puede ser 0 si ambas variables son independientes entre sí.

Para obtener la relación de dispersión entre las dos variables, hay que recoger todos los pares de valores de (X) y (Y) que forman un diagrama de dispersión completo (donde se colocan dos puntos en cada variable). A continuación, para cada par de valores, calcula el coeficiente de correlación:

Donde (r) se define como una relación de (a/b). El valor (r = 0,0 ll rll 1,0), o cuando ninguna de las dos variables está conectada con la otra y su relación es «neutra» (lo que no significa que no tengan ninguna relación).

Conclusión:

El método del diagrama de dispersión es una herramienta útil para el análisis de las relaciones entre dos variables. Se utiliza para visualizar la correlación entre dos variables y saber cómo están relacionadas. Para crear un diagrama de dispersión, es necesario obtener pares de valores de las dos variables y calcular el coeficiente de correlación entre ellas. El valor de (r) da el grado de correlación entre dos variables y nos dice qué tipo de relación existe.

* CONSIDERACIONES SOBRE EL DIAGRAMA DE DISPERSIÓN

  • El coeficiente de correlación de cero no significa que no haya conexión entre las dos variables, sino sólo que la fuerza de la relación entre ellas es muy débil. en general, la dirección en la que hay una mayor correlación entre dos variables es superior a 0,5 (hay algunos casos en los que habrá una correlación cero con una tendencia direccional).
  • Cuanto más correlacionadas estén estas dos variables, más confianza podremos obtener al utilizarlas para predecir valores futuros… de ambas variables. En conclusión, hay que ver si ambas tendencias suben y bajan juntas en cantidades significativas.
  • El término «significativo«en el contexto del análisis estadístico significa que la correlación es superior a 0,5 e inferior a 1,0.
  • En situaciones en las que la correlación entre dos variables es alta, el coeficiente de correlación (r) puede ser cercano a 1, pero no significa que esta situación se dé indefinidamente en el futuro.
  • Cuando se predicen las variables X e Y (= precio), tanto los cambios positivos como los negativos (es decir, suponemos que habrá cambios en (X) y (Y)), pero estos valores N variarán con el tiempo.
  • En el caso de los cálculos de correlación múltiple, se puede mirar el diagrama de dispersión (el gráfico de los datos) para ver a través de todas las variables.
  • Si el diagrama de dispersión no muestra ninguna relación entre las variables, considere si los datos pueden estar estratificados.
  • Cuando la correlación es alta (más cercana a 1), se puede decir que ambas variables están fuertemente relacionadas y que su relación es casi lineal en el diagrama de dispersión.
  • No todos los conjuntos de datos se prestan a la visualización de diagramas de dos variables.
    Las tendencias que no están relacionadas o los datos que no muestran tendencias fuertes (como con la distribución normal) no se prestan a la visualización mediante un diagrama de dispersión.

Haznos saber si te ha gustado el post. Sólo así podremos mejorar.


Compartir en las redes sociales