lunes, 26 de octubre de 2009

♥ Representación tabular y gráfica; Medidas de tendencia central y variabilidad

UNIDAD II
Representación tabular y grafica
Para poder organizar nuestros datos necesitamos la ayuda de las representaciones para poder distribuir nuestros datos, cuando realizamos una distribución de frecuencias o tabla de frecuencias no es otra cosa que una ordenación en forma de tabla de los datos estadísticos que hayamos obtenido de nuestras muestras, asignándole a cada uno su frecuencia correspondiente.
Se reconoces 3 tipos de frecuencias principales que son:
• Frecuencia absoluta: la cual es el número de veces que aparece en la muestra dicho valor de la variable, comúnmente es representada por ni
• Frecuencia relativa: es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
De frecuencias acumuladas se encuentran dos tipos:
• La relativa acumulada: no es otra cosa que la frecuencia absoluta acumulada dividido por el tamaño de la muestra
• La absoluta acumulada: Para poder calcularla hay que tener en cuenta que la variable ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable.
Tipos de graficas:
Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información.
Histograma: un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos.
Grafica de columnas: Un gráfico de columnas muestra una serie como un conjunto de barras verticales agrupadas por categorías. Los gráficos de columnas resultan de gran utilidad para mostrar los cambios que se producen en los datos a lo largo del tiempo o para ilustrar comparaciones entre elementos.
Grafica de barras horizontales: los cuales se parecen mucho a las gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambian y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases.
Graficas de líneas: consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas
Polígonos de frecuencias: La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra después de la última. El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono.
Representación por ojiva: en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo.
Circulares: se usa cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total
Conclusión: podemos deducir que las representaciones graficas de datos en lo que es la estadística, son una herramienta de gran ayuda para nuestra organización. Y en ellas también nos podemos dar cuenta de las cosas que van modificandose con el tiempo, nos lo hacen ver de una manera rápida y sencilla a la vez. Se entiende que existan gran variedad de representaciones, ya de dependiendo de nuestros datos o variables, podemos escoger la que más se acondicione a nuestra necesidad.
UNIDAD III
Medidas de tendencia central y variabilidad
3.1 Medidas de tendencia central:
Reciben este nombre debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente en su parte central.

* Media: También se le conoce como promedio ya que es el promedio de las lecturas o mediciones individuales que se tienen en la muestra. Ejemplo:

Se ha tomado como muestra las medidas de seis cables usados en un arnés para lavadora, las cuales son; 15.2cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine su media aritmética:

15.2+15.0+15.1+15.2+15.1+15.0
X= ____________________________ = 15.1
6

*Mediana: La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una vez que estos han sido ordenados según su valor o magnitud. Pracalcular la mediana se pueden presentar dos casos:

a) Que el numero de datos sea impar. Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toma como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.47, 11.5. Ordenandolos quedarían:

11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5 Se observa que el dato 11.3 queda en medio por lo que este es el valor de la mediana.

b) Que el número de datos sea par. Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toma como muestra ocho circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5, 11.4 Ordenándolos quedarían:

11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11.1 cm Como son dos datos los que quedan en medio , se obtiene el promedio:
11.3+11.2
X med: ---------------- = 11.25cm
2

*Moda: Aquel valor o valores que más se repiten o que tienen mayor frecuencia entre los datos de la muestra.

3.1.1Datos no agrupados:
Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.

3.1.2 Datos agrupados:
Cuando una muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

3.2 Medidas de variabilidad:

*Rango: También llamado recorrido: Es la diferencia entre el valor mayor y el valor menos encontrados en la muestra, también se le denomina recorrido ya que nos dice entre que valores hace su recorrido la variable de interés; y se determina de la siguiente manera:

R=VM-Vm

R= rango o recorrido
VM = valor mayor en la muestra
Vm = valor menos en la muestra Ejemplo:

Se ha tomado como muestras las mediciones de la resistencia a la tensión de la soldadura usada para unir dos cables, estas son: 78.5kg, 82.4,87.3, 78.0, 90.0, 86.5, 77.9, 92.4, 75.9.
VM = 92.4 kg
Vm =75.9 kg
R= 16.5 kg

* Varianza: Es el promedio de las diferencias elevadas al cuadrado entre cada valor que se tiene en la muestra y la media aritmética de los datos. Ejemplo:

Lo primero que hay que calcular es la media aritmética de la muestra como ya se ha hecho anteriormente.

X= 14.2+12.1+15.6+18.1+14.3 / 5 = 14.86
S2= (14.2-14.86)2 + (12.1-14.86)2+…+ (14.3-14.86)2 / 5-1 =
S2= 0.4356+7.6176+0.5476+10.4976+0.3136 / 4= 4.853mg2

*Desviación estándar: Es l desviación o diferencia promedio que existe entre cada dato de la muestra y la media aritmética de la muestra. Y se obtiene a partir de la varianza, sacándola raíz cuadrada
Ejemplo:

S= raíz 4.853mg2 = 2.2029mg

1 comentario: