Preview only show first 10 pages with watermark. For full document please download

Tabla De Distribución De Frecuencias Para Datos Agrupados

   EMBED


Share

Transcript

Tratamiento de Datos y azar

•Rango: Diferencia entre el máximo y el mínimo
valor de una variable.(r)

Numero de clase: es el numero de grupos en los
que se divide los valores de la variable

Existen varias técnicas para determinar el número de
intervalos a utilizar:
1- A criterio del investigador.
2- Usar una de las fórmulas:

Fórmula de Sturges K

Velleman k siempre que
n>50
 Tamaño de un intervalo: o amplitud de clases el
cociente entre el valor del rango y la cantidad de
intervalos que se desea obtener. Se recomienda tomar
como longitud de los intervalos un valor entero que sea
mayor o igual al cociente obtenido.

a= r
k
Limites reales o fronteras reales: en cada clase o intervalo
el valor menor se conoce como limite inferior (Li) y el
valor mayor como limite superior (Ls)
Se obtienen calculando el promedio entre Ls y el Ls del
siguiente intervalo.

Marcas de clase o punto medio: es el punto medio de cada
intervalo y se obtiene al promediar los limites de este.

m = Ls + Li
2
Construye una tabla de
frecuencias cuyos datos estén
agrupados en ocho intervalos.

1°Para poder construir la tabla de frecuencias lo primero que debemos
hacer es calcular el rango (r).
r=Dato mayor - dato menor = 73 -
1 = 72
Por lo tanto; r = 72
2° Calcular el Numero de clase: (k)

En el problema nos dicen que debemos
agruparlo en 8 intervalos o clases K=8
3° Calcular la Amplitud: La amplitud de un intervalo es la
diferencia entre el límite superior y el límite inferior. La
amplitud(a) de los intervalos puede calcularse mediante
la expresión:
a= r
k

4° Ahora podemos comenzar a construir la tabla de
frecuencias:
El primer intervalo comienza con el dato menor y el limite
superior será (dato menor + a ) - 1

5° Calcular los limites reales:

Lr = Limite inferior del primer intervalo + limite superior del segundo intervalo
2
6° Calcular los marca de clase:
m = Ls + Li
s
Edades fa Limites Marca faa fr Fra
reales de clase
1 – 10
11 – 20
21 - 30
31 – 40
41 – 50
51 – 60
52 – 60
61 – 70
a) Del total de personas encuestadas, ¿cuántas personas tienen entre
31 y 40 años?
b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o
menos años?
c) ¿Cuál es el porcentaje de las personas encuestadas estén entre 11 y
20 años?
d) ¿Cuál es el porcentaje de que las personas encuestadas tenga 50
años o menos?
a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40
años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:

El dato lo obtenemos de la columna de la frecuencia absoluta.
Recuerda que:
Frecuencia absoluta Corresponde a la cantidad de veces que se repite un dato.
Denotamos este valor por fi.
Por lo tanto la respuesta es 6 personas.
b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos
años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
El dato lo obtenemos de la columna de frecuencia absoluta acumulada.
Recuerda que:
 Frecuencia absoluta acumulada es la suma de las frecuencias absolutas
observadas hasta el intervalo i.
 En este caso es el intervalo 6. Por lo tanto la respuesta es 36 personas tienen
60 o menos años.
c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona
consultada, esta tenga entre 11 y 20 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos
que:

El dato lo obtenemos de la columna de frecuencia relativa.
Recuerda que:
Frecuencia relativa Corresponde a la probabilidad de
pertenecer a cierta categoría. Se puede expresar en tantos por
ciento.
En este caso es el intervalo 2, ya que es ahí donde se encuentran
las edades entre 11 y 20 años.
Entonces la respuesta es: La probabilidad es 14%.
Por último vamos a repasar el concepto de:

Frecuencia relativa acumulada (Hi), Es la probabilidad de
observar un valor menor o igual al valor que toma la
variable en estudio en ese intervalo.

Se calcula dividiendo Fi por el número total de datos.
También puedes calcularlo Sumando la frecuencia relativa
de cada grupo con la frecuencia relativa acumulada del
grupo anterior.

Si haces correctamente estos cálculos, el último grupo
tendrá una frecuencia acumulada de 1, o muy cerca de 1,
permitiendo redondear el error.
Recuerda que este valor se puede expresar como
porcentaje, para esto solo debes multiplicar el valor
obtenido por 100 y listo!!!

Este calculo te sirve en el caso de que te pregunten:
d) Si le preguntas a una persona cualquiera ¿Cuál es la
probabilidad de que tenga 50 años o menos?
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de
decidir el precio de sus habitaciones, el gerente investiga los
precios por habitación de 40 hoteles de la misma categoría de
esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:

3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2 4.2 4.3 4.3 4.3 4.3 4.4 4.4
4.5 4.5 4.5 4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1 5.1 5.3 5.3 5.4
5.6 5.8 5.8 6.0 6.1 6.1

Procedimiento: 1.- El menor valor es 3.3 y el mayor 6.1, la diferencia
es 2.8 y por tanto
r=2.8.

2.- K= 1+3,322 log(40) = 6.3 ≈ 6 números de intervalos

3.- a = 2.8 / 6 = 0.467 ≈ 0.5 tamaño de los intervalos
clases fa Limites Marca faa fr Fra
reales de clase

 ¿Cuantos hoteles tienen un precio entre 3.3 y 3.8?
 ¿Cuantos hoteles tienen un precio superior a 4.8?
 ¿Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 %
En una entrevista se han preguntado a 100 alumnos que tomaron
la asignatura de estadística cuales fueron sus calificaciones
finales. Los resultados son los siguientes

100 84 33 98 57 90 82 77 55 62 87 65 33 70

47 83 85 55 51 93 98 47 100 62 64 57 68 100

57 54 82 66 69 70 86 95 72 80 47 58 93 25

77 65 25 85 65 55 64 95 47 70 88 70 66 100

76 52 75 83 40 85 63 84 40 67 23 85 65 33

53 36 17 52 100 60 96 60 70 68 88 61 42 60

32 42 30 53 45 34 58 34 55 54 39 65 45 82

75 60
 La forma de la distribución de frecuencias se percibe más
rápidamente si la representamos gráficamente. Se resume la
información de la muestra de forma grafica con fines clarificadores o
para enfatizar y descubrir determinadas características que de otra
manera seria muy difícil de apreciar. Un grafico siempre es mas
inmediato de comprender que un conjunto de datos estadísticos.
Las representaciones graficas varían según el tipo de variable:
 DIAGRAMA DE BARRAS: Es la representación gráfica
usual para variables cuantitativas discretas o para
variables cualitativas. En el eje de ordenadas
representamos los diferentes valores de la variable
(xi). Sobre cada valor levantamos una barra de altura
igual a la frecuencia (absoluta o relativa).
 HISTOGRAMA: Es la representación gráfica de las frecuencias agrupadas
de una variable continua sobre intervalos. A diferencia de los diagramas de
barras, los histogramas dibujan rectángulos unidos entre si, lo que significa
que existe continuidad en la variable cuyos valores se representan en el eje
horizontal que se haya dividido en intervalos de igual amplitud. Las áreas de
los rectángulos son proporcionales a las frecuencias que representan.
 Es dentro de las técnicas de análisis
exploratorio de datos una de más usadas ya que
permite mostrar el orden de rangos así como la
forma de un conjunto de datos en forma
simultanea
 Se caracteriza por ser fácil de construir y dar
más información que un histograma, debido a
que muestra los valores reales
 No hay cantidad única de tallos ni hojas aún
cuando se recomienda seleccionar entre 5 a 20
tallos
Datos cuantitativos

Trace un diagrama de tallo y hoja para los siguientes datos.
70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72
1.Ordenar en forma ascendente
2.Seleccionar rangos (ancho de clases) define tallos
3.Incorporar hojas

Tallo Hoja

5 7 8
6 4 5 8
7 0 2 2 5 5 6 8
8 0 2 3 5