Repaso de las categorías de estadística utilizadas en Finanzas



DISTRIBUCIÓN DE PROBABILIDAD NORMAL.
Características
1) Es simétrica con respecto a la media: La media = mediana = moda.
2) Es asintótica. Decrece uniformemente en ambas direcciones a partir del valor central
3) La mitad del área bajo la curva se allá a un lado de ese punto y la otra mitad al otro lado.
4) Distribución. Aproximadamente el 68.27 % del área bajo la curva está dentro de más una y menos una desviación estándar (m = 1s).
El 95.45 % del área bajo la curva está dentro de más dos y menos dos desviación estándar (m = 2s).
El 99.73 % del área bajo la curva está dentro de más tres y menos tres desviación estándar (m = 3s).

external image Image267.jpg

Ejemplo: Una prueba de productividad en una empresa reveló que el número promedio de artículos producidos por un obrero en su jornada laboral de ocho horas es de 19 con una desviación estándar de 1.2 artículos. La distribución de producción se aproxima a una función de distribución normal.
1) Cuál es la producción del 68.27 % de los obreros?
Aproximadamente el 68.27 de los obreros produce entre 17.8 y 20.2 artículos.
2) Cuál es la producción del 95.45 % de los obreros?
Aproximadamente el 95.45 de los obreros produce entre 16.6 y 21.4 artículos.
3) Cuál es la producción del 99.73 % de los obreros?
Aproximadamente el 99.73 de los obreros produce entre 15.4 y 22.6 artículos.(J.Rojas)
Modelos de proyección financiera; material didáctico de apoyo para la asignatura; Prof. Javier Gutiérrez Rojas.


Publicado por: Leidy Pinzon



CALCULO DEL RIESGO:

DESVIACION ESTANDAR: Es una medición estadística de la dispersión de los posibles resultados, con respecto al valor esperado. Se define como la raíz cuadrada del promedio ponderado del cuadrado de las desviaciones de los posibles resultados del valor esperado.
Se puede usar para medir la variabilidad de los rendimientos de una inversión y proporciona una indicación del riesgo activo o título financiero. Mientras mayor sea la desviación estándar, son más variables los rendimientos de una inversión y más arriesgada es esta. Una desviación estándar de cero indica que no hay variabilidad, y por lo tanto no hay riesgo.
A su vez también encontramos dos tipos de distribuciones. Cuando se identifica un número limitado de posibles resultados hablamos de una distribución discreta. Sin embargo en la realidad, en análisis de proyectos de inversión pueden existir muchos resultados diferentes, y es necesario establecer una distribución de probabilidad continua.
DISTRIBUCION DE PROBABILIDAD NORMAL:
Los posibles rendimientos de muchas inversiones tienden a seguir una distribución de probabilidad normal, caracterizada por una curva simétrica en forma de campana. Si la distribución de probabilidad de los rendimientos se aproxima a una normal, se puede utilizar una tabla de distribución de probabilidad normal estándar (con media igual a 0.0, y desviación estándar igual a 1.0, a fin de calcular la probabilidad de ocurrencia de un resultado especifico.
COEFICIENTE DE VARIACION:
Es una medición relativa al riesgo y es apropiada para comparar inversiones con rendimientos esperados diferentes, y es la relación de la desviación estándar von un rendimiento esperado. Es una medición relativa de la variabilidad, ya que mide el riesgo por unidad de rendimiento esperado, a medida que se eleva el coeficiente de variación, también lo hace el riesgo de un activo.
Por último la mayoría de las decisiones de inversión requieren pronosticar los rendimientos varios años a futuro. Es posible considerar el riesgo de estos elementos pronosticados como una función creciente del tiempo, por lo general, los rendimientos a corto plazo pueden predecir.
La covarianza mide la relación entre dos variables. Una covarianza 0 indica que no hay relación alguna, mientras que valores altos implican que el valor de una está muy ligado al valor de la otra variable.
Si >0, al aumentar los valores de X aumentan los de Y, se dice que hay una relación directa entre las variables.
Si <0, al aumentar los valores de X disminuyen los de Y, se dice que hay una relación inversa entre las variables.
Si =0 las variables no tienen ningún tipo de relación no hay relación lineal entre las variables, eso no quiere decir que no haya relación estadística.

El efecto colegio sobre la **variabilidad** del **rendimiento** en matemáticas. //aprendeenlinea.udea.edu.co/revistas/index.php/.../article/.../4301. Actualización 19 de Octubre 2010//

Este archivo fue subido por: (Juan Reséndiz)



Desviación estándar poblacional y muestral,

Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto observa.
Una muestra es un subconjunto de observaciones seleccionadas de una población.
Expresión de la desviación estándar maestral:





Expresión de la desviación estándar poblacional:




Fuente: INSTITUTO TECNOLOGICO DE CHIHUAHUA
(http://www.itch.edu.mx/academic/industrial/estadistica1/cap01.html )

Covarianza y Correlacion
La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.
La covarianza se representa por sxy o σxy.



Fuente: Juan Carlos Fernández Gordillo, para más información sobre vitutor.com (http://www.vitutor.com/estadistica/bi/covarianza.html

Correlación
Correlación es una medida sobre el grado de relación entre dos variables, sin importar cual es la causa y cual es el efecto. La dependencia de la que se habla en este sentido es la dependencia entre la varianza de las variables.
Como hemos visto el manejo de unidades adimensionales nos permiten tener un coeficiente sobre el que de forma cómoda se pueda trabajar, por lo que podemos dividir entre el producto de las desviaciones de las variables, es decir:



Los valores para este coeficiente están comprendidos entre -1 y 1.

Fuente: UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO (Copyright © 2001-2010 COORDINACIÓN DE INNOVACIÓN EDUCATIVA /QFB-UMSNH)

Subido por: Jesús Alejandro



La media y media ponderada:

La media ponderada:
Permite calcular un promedio que toma en cuenta la importancia de cada valor con respecto al total.
Cuando calculamos un promedio, podemos estar considerando un grave error si contemplamos el hecho de que no todas las cantidades tienen la misma importancia en relación con el fenómeno que se describe. Considera do por ejemplo, la siguiente información sobre el porcentaje de unidades de residencias habitadas por propietarios en tres ciudades de California:
Porcentaje de las residencias habitadas.
Los Ángeles 40.3
Sacramento 56.4
San José 62.1

La media de estos tres porcentajes es 40.3+56.4+62.1/3= 52.9, pero no podemos indicar con certeza que esta sea la tasa promedio de residencias habitadas por sus propietarios para las tres ciudades. Las tres cifras no tienen la misma importancia porque existen considerables diferencias en el tamaño de las tres ciudades.
Para dar continuidad de las que se promedia su grado de importancia pertinente, es necesario asignarles pesos o valores relativos y luego calcular una media ponderado. En general, le media pondera xw de un conjunto de números, x1, x2, x3,………. Xn cuya importancia relativa se expresa numéricamente por medio de un conjunto de números correspondientes, w1, w2, w3,………. wn se obtiene mediante la formula:
Media ponderada: xw = w1 x1, + w2 x2, + ………..wn xn / w1, + w2, + ,………. wn = ∑ (w)(x) / ∑ w
La ∑ w *x es la suma de los productos obtenidos de la multiplicaciones de cada x por el valor relativo correspondiente y ∑ w es simplemente la suma de los valores relativos. Cuando todos los valores relativos son iguales, la formula de la media ponderada se reduce a la formula de la media ordinaria.
Ejemplo:
Considerando que habría 1,135,000 residentes en Los Ángeles, 113,000 en Sacramento y 210,000 en Sn José, utilice estas cifras y los porcentajes anteriores para determinar la tasa promedio de residencias habitadas en las tres ciudades.
Sustituyendo x1 = 40.3 x2, = 56.4 x3, = 62.1 w1 = 1,135 w2, = 113 w3, y = 210 para xw, queda
Xw = (1,135)(40.3) +(113)(56.4) +(210)(62.1) / 1,135 +113 +210 = 44.7
Nótese que el valor que se obtiene en Xw es mucho menos que el de x, 44.7 en comparación con 52.9 y esto es consecuencia por completo del gran tamaño de Los Ángeles y su baja tasa de ocupación por los propietarios. Levin I. Richard (2004)

Fuente: Levin I. Richard (2004), Estadistica para administracion y economia, Pag. 875.

Subido por : Mary Camcho.



La desviación Estándar en las finanzas

Puede ayudar a:
Los donantes prevén aumentar considerablemente la ayuda e intensificarla coordinación así como la selectividad de los beneficiarios para que los países pobres puedan alcanzar los Objetivos de Desarrollo del Milenio para 2015. Además, se inclinan ahora a dar ayuda a programas en lugar de proyectos (como apoyo directo al presupuesto los sectores), y los países procurarán apuntalarle gasto ordinario a largo plazo (como contratación de docentes y aumentos para enfermeros médicos) con estos fondos.
Amortiguar las crisis
Puesto que la volatilidad de la ayuda persistirá, ¿qué pueden hacer los países para amortiguar el efecto de las fluctuaciones corto plazo en los desembolsos? Las reservas son la primera línea de defensa y, como las normas fiscales, pueden adaptar separa que lo hagan.
Con el sistema del resultado puro, las asignaciones tienen una desviación estándar media de 17% con respecto a 1999, mucho menos que las estimaciones de la volatilidad histórica. El pre compromiso flexible logra reducir más la volatilidad, salvo en los países con calificaciones bajas: las simulaciones muestran que reduce la variabilidad a la mitad en los países de los cuatro quintiles superiores
Mejorar la ayuda basada en resultados
En los últimos años, las entidades de desarrollo han ido dejando de poner el énfasis en las recetas y medidas de política como base para el apoyo para centrarse en los resultados, dando así más espacio para que los beneficiarios elaboren sus propias políticas. Los programas de apoyo presupuestario de la Unión Europea son el avance más ambicioso en esta dirección. Combinan un tramo fijo con otro variable que se desembolsa en un nivel basado en el éxito alcanzado por el país en el cumplimiento de metas convenidas mutuamente para la prestación de servicios (como de inmunización o matrícula primaria) y gestión de las finanzas públicas.
Información obtenida en :http://www.imf.org/external/pubs/ft/fandd/spa/2005/09/pdf/eifert.pdf

Alfonso Ulises Velázquez Mondragón



Efecto de la diversificación en el riesgo con acciones nacionales.

De acuerdo con Sanchez Cantú y Torres Villegas(2005) en primer lugar analizamos el efecto que tendría la diversificación en un portafolio de inversiones. Para ello construimos portafolios compuestos por un número progresivamente mayor de acciones del IPC agregando de la más a la menos volátil. Cada vez que se agregó un activo se midió la volatilidad del nuevo portafolio, con la condicionante de invertir el 100% de la cartera y de asignar a cada acción el mismo peso, es decir, cuando se cuenta con un activo, se invierte el 100% del valor de la cartera en él, si son dos activos, se asignará 50% a cada uno y así sucesivamente.
El nivel máximo de volatilidad del portafolio tiene una desviación estándar de 2.501%. Este valor corresponde a la volatilidad del primer activo que se incluyó. En este caso fue Hylsamex. A partir de ese nivel, conforme se aumentó el número de activos hasta 35 disminuyó la volatilidad del portafolio hasta alcanzar el nivel mínimo de 0.816%, lo cuál es inferior a la volatilidad de 0.927% del Naftrac-02
El nivel mínimo de riesgo que logra alcanzarse al construir un portafolio diversificado recibe el nombre de riesgo sistemático o riesgo no diversificable. No obstante, este nivel tiene un valor relativo ya que si ampliamos el espectro de activos más allá de las acciones de nuestro mercado, como sería el caso con inversiones en mercados internacionales o en activos distintos a las acciones, como los bienes tangibles o commodities, podemos disminuir aún más el riesgo. Lo que demostraremos a continuación.
Efecto de la diversificación en el riesgo en activos internacionales.
Ahora veremos el efecto que produce la inclusión de distintos TRAC´s que operan en México al combinarlos con el Naftrac-02. Se tomaron en cuenta los siguientes: S&P 600 (SmallCap), S&P 500, S&P 400 (MidCap), S&P 100, Naftrac-02, Nasdaq 100 (QQQQ), S&P Global 100, S&P Europe 350, S&P Latin America 40 y el Oro (iShares COMEX Gold Trust).
Con los TRAC’s se siguió el mismo procedimiento: Se calculó la volatilidad del portafolio de inversión con un número progresivamente mayor de activos, bajo de premisa de mantener el 100% de la cartera invertida y se atribuyó a cada TRAC el mismo peso en el portafolio.
Como se muestra en la Gráfica #2, al aumentar el número de TRAC’s al portafolio de inversión se logró disminuir la volatilidad. Así, de tener una volatilidad de 1.34% con un solo activo (S&P Latin America) esta se redujo hasta 0.70% cuando se incluyeron diez TRAC’s.
Impacto de la diversificación selectiva en el riesgo.
Por último Sanchez y Torres et. al (2005) concluyen que lo que buscamos es disminuir aún más la volatilidad del portafolio probando modificar las ponderaciones de cada uno de los componentes de tal forma que la posición más grande siguiera siendo la inversión en Naftrac-02. En este ejercicio se descartó el fondo Latino América (Latam) por tener alta correlación con nuestro mercado además de ser el más volátil de todos los TRAC´s.

Leopoldo Sánchez Cantú y Claudia Torres Villegas.(2005)
Riesgo y Diversificación en la Inversión Bursátil en México. Parte II.
EL ECONOMISTA, 30 de mayo de 2005, página 18.
Actualización: 20 octubre 2010

Información adicionada por:Mario Hernández



DESVIACIÓN ESTÁNDAR

La estadística que se usa con mayor frecuencia en finanzas para cuantificar y medir la volatilidad de la distribución de probabilidades del rendimiento de acciones es la desviación estándar:
Desviación estándar (σ) = Raíz cuadrada de la suma de (Probabilidad)(Rendimiento posible – Rendimiento esperado)2
E = Raíz cuadrada de [p1(r1 – E(r))2 + P2(r2 – E(r))2 + …. + Pn (rn – E(r))2]

Ejemplos:
Cuanto mayor sea la desviación estándar, mayor será la volatilidad de las acciones. La desviación estándar de una inversión sin riesgo que paga 10% con certeza, será cero:
σ = Raíz cuadrada de 1.0 (10% - 10%)2 = 1.0(0) = 0
La desviación estándar de las acciones de Genco es:
σ = Raíz cuadrada de [(0.2)(30% - 10%)2 + (0.6)(10% - 10%)2 + (0.2)(-10% - 10%)]
σ = 12.65%
La desviación estándar de las acciones de Risco es:
σ = Raíz cuadrada de [(0.2)(50% - 10%)2 + (0.6)(10% - 10%)2 + (0.2)(-30% - 10%)]
σ = 25.30%
Fuente: Bodie-Merton (2003) Finanzas, México, Pearson Educación

Esta información fue subida pro Adriana Hernández



Distribución normal o de campana:

Los instrumentos financieros presentan por lo general una distribución de probabilidad normal, la cual está definida por una curva simétrica en forma de campana. No obstante que la curva fue propuesta por De Moivre, esta correlacionada también con los nombres de Pierre Laplace y Carl Gauss, quienes trabajaron en el desarrollo y la aplicación de esta distribución.
La distribución normal tiene un papel importante en cualquier campo de la estadística y, en particular, en le medición de riesgos en finanzas. Los parámetros más importantes que la definen son la media y la desviación estándar, siendo la notación más conocida como M(μ,σ). Otros indicadores importantes que define a la distribución normal son el sesgo y la kurtosis. El seso debe ser de cero (simetría de la curva perfecta) y la kurtosis de tres (en tres desviaciones estándar se cuenta con el 99.7% de las observaciones).
Como Ejemplo tomemos los rendimientos o variaciones porcentuales diarias del Índice de Precios y Cotizaciones de la Bolsa Mexicana de Valores (IPC) DURAMTE TRES AÑOS (1998 A 2000), es decir, un numero de 509 observaciones. A continuación se presenta una grafica del histograma de frecuencias
HISTOGRAMA.jpg


En este caso, la media de los rendimientos es de 0.91% y la desviación estándar diaria de rendimientos es de 2.29%. Si tomamos la media más tres desviaciones estándar, tenemos que el rendimiento es de 6.96% y la media menos tres desviaciones estándar es de -6.78%. Esto significa que son muy pocas las observaciones que esta fuera de este periodo, de hecho solo son siete observaciones (5 en la cola superior y 2 en la cola inferior), por lo que se puede ver que tres desviaciones estándar comprenden el 98.6% de las observaciones totales.
En estadística es posible demostrar que si consideramos una muestra de tamaño n pertenece a una población que se distribuye normalmente (con media μ y desviación estándar σ), dicha muestra tendrá una distribución normal de media x y desviación estándar σ/√n. El teorema del límite central establece que aun cuando la muestra de tamaño n es suficientemente grande, la distribución de la muestra es aproximadamente normal, sin importar la distribución de la población. En este sentido, la distribución normal juega un papel importante en el desarrollo de las finanzas y procedimientos para la administración de riesgos.
La distribución normal de probabilidad de una variable aleatoria continua se puede representar como histograma de frecuencia de una forma suavizada y basad en un número grande de observaciones. De Lara Haro Alfonso (2005).
Fuente: De Lara Haro Alfonso, 2005, Medicion y control de riesgos financieros, Pag. 30
http://books.google.com.mx/booksid=PrQvTEWLqoC&pg=PA29&dq=distribucion+de+normal+en+finanzas&hl=es&ei=kMi_TKLxEYa0sAOXw_GVDA&sa=X&oi=book_result&ct=result&resnum=4&ved=0CDYQ6AEwAw#v=onepage&q&f=false

Subido por: Alan Moreno



¿Qué es una Distribución?

DEFINICIÓN
Cuando se dispone de un gran número de datos y estos se distribuyen en clases o categorías y se determina el número de datos perteneciente a cada clase, se conoce como distribución de frecuencias. Dividiendo cada frecuencia de clase entre el número total de datos se obtiene la proporción del conjunto de datos en cada una de las clases, o bien, la probabilidad de ocurrencia de cada clase, lo que se conoce como distribución de frecuencias relativas.
Al ajuste de una distribución de frecuencias relativas simétrica, en forma de campana se le conoce como Distribución Normal, lo cual representa una distribución de probabilidad continua.

EXPRESIÓN MATEMÁTICA
Representación tabular de una distribución de frecuencias:


Distribucion1.jpg
Representación gráfica de una distribución de frecuencias relativas (histograma):


Distribucion2.jpg
Representación gráfica de la Distribución Normal:


Distribucion3.jpg

Propiedades:


Área bajo la curva = probabilidad (p)

Área total = 100% p

μ ± 1 σ ≈ 67% p

μ ± 2 σ ≈ 92% p

μ ± 3 σ ≈ 96% p

EJEMPLO
Determinar la distribución de frecuencias, frecuencias relativas e histograma de los rendimientos diarios de Índice de Precios y Cotizaciones (IPC) de 1999 (estos datos pueden ser consultados en la página de Internet del Banco de México, ww.banxico.org.mx).
Solución:
A partir de los rendimientos (R), se determinan las clases, las cuales se calculan a partir del valor máximo y mínimo de la seria y la diferencia entre ellos, los cuales son: máximo = 1.0778, mínimo = 0.9540 y diferencia = 0.1238. Dividimos la diferencia entre 9 para establecer 10 clases diferentes, resultando 0.0138, la primer clase será el valor mínimo, la siguiente será el valor mínimo + 0.0138, la siguiente será el valor anterior + 0.0138, y así sucesivamente hasta llegar al valor máximo.


Distribucion4.jpg



INTERPRETACIÓN FINANCIERA
Para el ejemplo, el histograma de frecuencias relativas tiene la forma de una campana, es decir los datos del IPC analizados representan una distribución normal, por lo que si se determina la media aritmética y la desviación estándar de los rendimientos, podemos determinar la probabilidad de ocurrencia de ciertos rangos de rendimientos.

VENTAJAS
Una distribución de frecuencias cuya gráfica sea ajustable a una distribución normal, permite analizar plenamente los datos y sus probabilidades empleando únicamente la media aritmética y la desviación estándar.
DESVENTAJAS
No todos los datos históricos empleados en la distribución de frecuencias representan funciones de distribución normal, por lo que su análisis, a través de esta distribución no es adecuado.
Fuente : http://www.fcaenlinea.unam.mx/apuntes/interiores/docs/98/2/finanzas1.pdf pagina 56

Informacion subida por Enrique García Martínez



Ejemplos

Valor Esperado del Portafolio
Suponga que tiene las siguientes proyecciones para tres acciones
Escenario de la Economía
Probabilidad de
Escenario
Rendimientos
Acción A
Acción B
Acción C
Expansión
.40
10%
15%
20%
Contracción
.60
8
4
0

Queremos calcular los rendimientos esperados del portafolio para dos casos.
1.- ¿Cuáles serán los rendimientos esperados del portafolio si se invierte en las mismas proporciones para las tres acciones?

2.- ¿Cuáles serán los rendimientos esperados del portafolio si se invierte la mitad del portafolio en Acciones de A y el restante de manera equitativa entre B y C?

Los valores esperados individuales son:
E(RA)=8.8%
E(RB)=8.4%
E(RC)=8.0%

Sí el portafolio tiene inversiones iguales en cada activo, el peso del portafolio es igual para todos. Este portafolio esta balanceado (equally weighted). Como en este caso se trata de tres acciones, el peso de los portafolios es 1/3. El rendimiento esperado del portafolio es:

Para el primer caso:
E(RP)= 1/3 x 8.8% + 1/3 x 8.4% + 1/3 x 8.0% = 8.4%

Para el segundo caso:
E(RP)= 1/2 x 8.8% + 1/4 x 8.4% + 1/4 x 8.0% = 8.5%

Varianza y Desviación del Portafolio
Para este caso trabajaremos con el ejemplo donde el 50% está en la acción A y el 25% está en acciones B y C. Los cálculos se desarrollan de la siguiente forma:
Escenario de la Economía
Probabilidad de
Escenario
Rendimientos
Acción A
Acción B
Acción C
Portafolio
Expansión
.40
10%
15%
20%
13.75%
Contracción
.60
8
4
0
5

El rendimiento del portafolio cuando la economía se expande es:
.50 x 10% + .25 x 15 % +.25 x 20 % =13.75%

El rendimiento del portafolio cuando la economía se contrae. El rendimiento esperado del portafolio es .085 %. La varianza es:
σ2= .40 x (.1375 - .085)2 + .60 x (.05 - .085)2 =. 0018375
La desviación estándar es cerca del 4.3%.

Fuente: Ross, Westerfield, Jordan. . Fifth Edition,2007.Corporate Finance Essentials. Pag. 329-333

Información agregada por Nelly Cabello Vazquez


http://nutriserver.com/Cursos/Bioestadistica/Asimetria_Curtosis.html
en este link podemos encontrar varios temas y ejemplos de herramientas estadistics que se pueden utilizar en finanzas

(oscar morales)



1. Concepto de correlación y covarianza

1.1. Relación y variación conjunta
El concepto de relación en estadística coincide con lo que se entiende por relación en el
lenguaje habitual: dos variables están relacionadas si varían conjuntamente. Si los sujetos tienen valores, altos o bajos, simultáneamente en dos variables, tenemos una relación positiva. Por ejemplo peso y altura en una muestra de niños de 5 a 12 años: los mayores en edad son también los más altos y pesan más, y los más jóvenes son los que pesan menos y son más bajos de estatura; decimos que peso
y altura son dos variables que están relacionadas porque los más altos pesan más y los más bajos pesan menos.
Si los valores altos en una variable coinciden con valores bajos en otra variable, tenemos una
relación negativa; por ejemplo edad y fuerza física en una muestra de adultos de 30 a 80 años de edad: los mayores en edad son los menores en fuerza física; hay una relación, que puede ser muy grande, pero negativa: según los sujetos aumentan en una variable (edad) disminuyen en la otra (fuerza física).
La correlación se define por lo tanto por la co-variación (co = con, juntamente: variar a la vez).
Correlación y covarianza son términos conceptualmente equivalentes, expresan lo mismo. La
covarianza es también una medida de relación, lo mismo que el coeficiente de correlación.
Habitualmente se utiliza el coeficiente de correlación (r de Pearson), pero es útil entender
simultáneamente qué es la covarianza, y entenderlo precisamente en este contexto, el de las medidas de relación.
El concepto de relación y qué se mide exactamente con estos coeficientes, lo veremos mejor con
un ejemplo (tabla 1) donde tenemos los datos de tres situaciones o casos distintos:
1) En cada caso tenemos cuatro sujetos (ejemplo reducido para poder ver todos los datos con
facilidad) con puntuaciones en dos variables, X (un test de inteligencia) e Y (una prueba
objetiva de rendimiento).
2) Junto a la puntuación de cada sujeto en las dos variables, X e Y, ponemos su número de orden: 1º al que tenga la puntuación más alta, 2º al que tenga la siguiente más alta, etc.:
Decimos por lo tanto que existe relación en la medida en que los sujetos ocupan la misma
posición relativa en las dos variables. En el caso 1º la relación es positiva; si el orden es inverso, como en el caso 2º, tenemos también una relación, pero negativa. Esta variación conjunta o covariación, puede ser clara y alta (como en los casos 1º y 2º de la tabla 1), puede ser moderada o baja o puede no haber relación

1.2. Los diagramas de dispersión
La representación gráfica de estos pares de puntuaciones se denomina diagrama de dispersión,
y también nos ayuda a entender el mismo concepto de relación (ejemplos en la figura 1).
Cada punto representa la posición de un sujeto (donde confluyen sus dos puntuaciones). En la medida en que hay relación, los puntos tienden a situarse en una recta diagonal; cuando no hay relación o es muy pequeña la nube de puntos aparece sin una dirección clara.

1.3. Otras maneras de visualizar la correlación
Los diagramas de dispersión (como los de la tabla 2) nos permiten ver con facilidad qué entendemos por correlación (o simplemente relación), pero otras maneras de presentar los datos también son útiles para visualizar y comunicar la relación entre dos variables.
En la tabla 2 tenemos un ejemplo. Los mismos alumnos han respondido a dos series de cinco preguntas:
a) cinco preguntas sobre datos dicotómicos (p y q)
b) cinco preguntas sobre la interpretación de los percentiles.
En la tabla 2 podemos ver con facilidad que a mayor número de respuestas correctas sobre datos dicotómicos corresponde una media más alta en las preguntas sobre percentiles. Los alumnos que saben más y menos de ambos temas, tienden a ser los mismos.
También podemos reducir la información a un cuadro de doble entrada,
. Tenemos a los mismos alumnos clasificados con estos criterios:
a) Número de fórmulas que recuerdan de memoria sin haberlas estudiado, puestas al final de un examen y sin contar para nota. Los alumnos están divididos en dos grupos, los que recuerdan
5 ó 6 fórmulas y los que recuerdan 4 o menos.
b) Número de respuestas correctas en el examen de 45 preguntas: 37 o más y 36 o menos.
1.4. Correlación, covarianza y dispersión: importancia de las diferencias
Es importante caer en la cuenta desde el principio de la importancia de las diferencias interindividuales para poder comprobar relaciones: sin diferencias en los sujetos (u objetos) no podemos ver relaciones.
Sin diferencias en las dos variables no podemos encontrar variación conjunta: si todos los sujetos tienen idéntica puntuación en X no podemos ver si los altos en X son también altos en Y, porque en X son todos iguales.
Si, por ejemplo, queremos comprobar si la altura está relacionada con la capacidad de encestar
(jugando al baloncesto) necesitaremos jugadores de distintas alturas, para ver si los más altos encestan más y los más bajos encestan menos. Si todos los jugadores tienen la misma altura, no podemos comprobar esa relación; no podemos comprobar si las diferencias en altura se corresponden con diferencias en la habilidad de encestar porque todos tienen idéntica altura. Y también necesitaremos que unos encesten más y otros menos. Los sujetos deben ser distintos en las dos características cuya relación queremos comprobar.
La correlación y la covarianza dicen de dos variables lo mismo que la varianza (o la desviación típica) dice de una variable: hasta qué punto los sujetos son distintos simultáneamente en las dos variables. De la misma manera que la varianza es una medida de dispersión en una variable, la correlación (y la covarianza) son también medidas de dispersión, pero de dos variables tomadas a la vez.
1.5. Tipos de relaciones que cuantificamos mediante el coeficiente r de Pearson
El coeficiente de correlación comprueba y cuantifica solamente relaciones lineares, como las expresadas en los ejemplos y diagramas de dispersión anteriores. No comprueba por lo tanto relaciones curvilíneas, las que expresadas gráficamente mostrarían una curva. Por ejemplo la relación entre edad (tomando un espectro amplio de edades) y fuerza física sería curvilínea: primero sería positiva (a más edad mayor fuerza física), y luego negativa (a mayor edad, menos fuerza).
1. 6. Tipos de variables con las que se puede utilizar el coeficiente r de Pearson
Para poder utilizar el coeficiente de correlación r de Pearson: las dos variables deben ser:
a) Las dos continuas,
b) Una continua y otra dicotómica (1 ó 0).
c) Las dos dicotómicas (1 ó 0).
(Pearson).
Cuando las dos variables son dicotómicas no se trata propiamente del coeficiente de Pearson
(en principio referido a dos variables continuas) sino del coeficiente f (fi); se puede incluir aquí porque realmente equivale al coeficiente de Pearson calculado con datos dicotómicos aunque también tiene fórmulas específicas1. También tiene sus peculiaridades (el valor máximo no es siempre 1). En un apartado final (ver índice) explicamos brevemente éste y otros tipos de coeficientes de relación.
2. La medida de la relación
2.1. Cómo cuantificamos o medimos el grado de relación
Es sencillo entender cómo podemos cuantificar (medir) esta variación conjunta y además ayuda
a la comprensión e interpretación de estas medidas de relación.
Si las dos variables están relacionadas y esta relación es positiva ® los sujetos tenderán a estar por encima o por debajo de la media en las dos variables a la vez
Si las dos variables están relacionadas y esta relación es
Negativa ® los sujetos tenderán a estar por encima de la media en una variable y por debajo de la media en la otra
Si las dos variables no están relacionadas ® el estar por encima o por debajo de la media en una variable es independiente del estar por encima o por debajo de la media en la otra variable
Este estar por encima o por debajo de la media en dos variables simultáneamente nos va a
permitir cuantificar el grado de relación, tal como se explica en la tabla 5. Lo explicamos por pasos:
1º La distancia, o diferencia, de un sujeto con respecto a la media podemos expresarla de dos
maneras: En puntuaciones directas (restando cada puntuación de la media)
d = (X- X )
En puntuaciones típicas (la misma diferencia pero dividida por la desviación típica): z =
(X - X )
s
Estas diferencias con respecto a la media (puntuaciones diferenciales) (en la figura 3 sólo están
puestos): serán positivas si la puntuación directa (X) es superior a la media ( X ), serán negativas si la puntuación directa (X) es inferior a la media ( X )
2º Si a cada sujeto le multiplicamos sus dos puntuaciones diferenciales (dxdy o zxzy) tendremos que unas veces los productos tendrán signo más y otras signo menos
a) Cuando hay relación positiva: todos los productos (o la mayoría, dependerá del grado de
relación) serán de idéntico signo positivo (más por más y menos por menos = más);
b) Cuando hay relación negativa: los productos serán de idéntico signo negativo (más por menos
o menos por más = menos);
c) Cuando no hay relación: unos productos serán de idéntico signo y otros de distinto signo.
3º. La suma de los productos cruzados de las puntuaciones diferenciales (directas Sdxdy ó típicas
Szxzy), ya nos está indicando el grado de relación; la suma será mayor (con signo más o signo menos) cuando haya una mayor relación. La mera suma de estos productos no nos es muy útil porque no podemos compararla con otras sumas, pero si la dividimos por el número de sujetos lo que tenemos es una media comparable con cualquier otra media obtenida con un número distinto de sujetos
Pedro Morales Vallejo
Universidad Pontificia Comillas, Madrid
Facultad de Ciencias Humanas y Sociales
(última revisión, 30 de Octubre de 2007)

SUBIDO POR DAVID LOPEZ VALADEZ



Repaso de las categorías de estadísticas utilizadas en finanzas

La media
La media más popular de la tendencia central es lo qu el lego llama un promedio y lo que los estadistas llaman media aritmética o solamente una media: Esta se define como sigue:
La media de n números de la suma de los mismos dividida entre n.
La mediana
La mediana es el valor del artículo medio cuando n es non y la media de los artículos medios cuando n es par.
La moda
Otra medida que en ocasiones se usa para describir el punto medio o centro de un conjunto de datos es la moda, que se define simplemente como el valor que ocurre la mayor frecuencia y más de una vez.
Distribución de Probabilidad: Conjunto de valores posibles que una variable aleatoria puede asumir y sus probabilidades asociadas de ocurrencia.
Desviación Estándar: Parámetro estadístico de variabilidad de una distribución en torno a su media. Es la raíz cuadrada de la varianza.
Coeficiente de Variación: Relación de la desviación estándar de una distribución con respecto a la media de dicha distribución. Es un parámetro del riesgo relativo.
Covarianza: Parámetro estadístico del grado en que dos variables se mueven a la par. Valor positivo significa que, en promedio, se mueven en la misma dirección.
Coeficiente Beta: Coeficiente del riesgo sistemático. Sirve para medir la sensibilidad de los rendimientos de las acciones a los cambios en los rendimientos del portafolio de mercado.

http://books.google.com.mx/booksid=iBJstvkwFrYC&pg=PA38&dq=medidas+estadisticas&hl=es&ei=ddDATIjlOoX2tgOl8NyPDA&sa=X&oi=book_result&ct=result&resnum=8&ved=0CE4Q6AEwBw#v=onepage&q&f=false

Esta información fue subida por: Daniel Bautista



Medidas de Dispersión - Varianza y Desviación

Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las Medidas de dispersión nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir, nos indican cuanto se desvían las observaciones alrededor de su promedio aritmético (Media). Este tipo de medidas son parámetros informativos que nos permiten conocer como los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de dispersión más importantes y las más utilizadas son la Varianza y la Desviación estándar (o Típica).
1. VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media external image 5-C2-1.gif). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería:

Ecuación de la varianza para Poblaciones - Medidas de Dispersion
Ecuación de la varianza para Poblaciones - Medidas de Dispersion

Ecuación 5-6

Donde (external image 5-C2-2.gif) representa la varianza, (Xi) representa cada uno de los valores, (external image 5-C2-3.gif) representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:

Ecuacion de la Varianza para una muestra - Medidas de dispersion
Ecuacion de la Varianza para una muestra - Medidas de dispersion

Ecuación 5-7

Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, (external image 5-C2-1.gif) representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentando hacerla más representativa para la población. Es necesario resaltar que la varianza nos da como resultado el promedio de la desviación, pero este valor se encuentra elevado al cuadrado.

2. Desviación estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:

Ecuacion de la Desviación Estándar o Típica - Medidas de Dispersion
Ecuacion de la Desviación Estándar o Típica - Medidas de Dispersion

Ecuación 5-8

Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.

Por lo que su media es:

external image 5-14.gif

La varianza sería:

external image 5-15.gif

Por lo tanto la desviación estándar sería:

external image 5-16.gif

Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado

http://www.spssfree.com/spss/analisis2.html

Oscar Manuel Portillo Noguez