martes, 7 de octubre de 2014

GRACIAS

ESPERO

QUE LES HAYA GUSTADO

NUESTRO BLOG

SOLUCION COMPENDIO EJERCICIO 9

> datos=read.table("nhijos.txt")
> datos
V1
1 4hijos
2 5hijos
3 3hijos
4 4hijos
5 6hijos
6 6hijos
7 5hijos
8 5hijos
9 7hijos
10 3hijos
11 2hijos
12 5hijos
13 5hijos
14 7hijos
15 3hijos
16 6hijos
17 5hijos
18 3hijos
19 4hijos
20 5hijos
21 6hijos
22 2hijos
23 8hijos
24 3hijos
25 5hijos
26 7hijos
27 2hijos
28 2hijos
29 5hijos
30 8hijos
31 5hijos
32 3hijos
33 6hijos
34 5hijos
35 3hijos
36 6hijos
37 5hijos
38 5hijos
39 4hijos
40 5hijos
41 3hijos
42 4hijos
43 4hijos
44 3hijos
45 4hijos
46 2hijos
47 5hijos
48 4hijos
49 4hijos
50 6hijos
51 3hijos
52 3hijos
53 9hijos
54 6hijos
55 4hijos
56 2hijos
57 4hijos
58 6hijos
59 2hijos
60 6hijos
61 5hijos
62 2hijos
63 2hijos
64 3hijos
65 5hijos
66 10hijos
67 3hijos
68 5hijos
69 4hijos
70 5hijos
71 5hijos
72 4hijos
73 2hijos
74 4hijos
75 3hijos
76 4hijos
77 3hijos
78 4hijos
79 4hijos
80 4hijos
81 3hijos
82 4hijos
83 4hijos
84 4hijos
85 1hijos
86 4hijos
87 4hijos
88 5hijos
89 2hijos
90 2hijos
91 4hijos
92 4hijos
93 1hijos
94 4hijos
95 5hijos
96 5hijos
97 7hijos
98 3hijos
99 2hijos
100 4hijos
> f=table(nhijos)
Error in table(nhijos) : object 'nhijos' not found
> f=table(datos)
> f
datos
10hijos 1hijos 2hijos 3hijos 4hijos 5hijos 6hijos 7hijos 8hijos 9hijos
1 2 13 17 27 23 10 4 2 1
> n=sum(f)
> n
[1] 100
> h=(f/n)*100
> h
datos
10hijos 1hijos 2hijos 3hijos 4hijos 5hijos 6hijos 7hijos 8hijos 9hijos
1 2 13 17 27 23 10 4 2 1
> F=cumsum(f)
> F
10hijos 1hijos 2hijos 3hijos 4hijos 5hijos 6hijos 7hijos 8hijos 9hijos
1 3 16 33 60 83 93 97 99 100
> H=cumsum(h)
> H
10hijos 1hijos 2hijos 3hijos 4hijos 5hijos 6hijos 7hijos 8hijos 9hijos
1 3 16 33 60 83 93 97 99 100
> cbind(f,h,F,H)
f h F H
10hijos 1 1 1 1
1hijos 2 2 3 3
2hijos 13 13 16 16
3hijos 17 17 33 33
4hijos 27 27 60 60
5hijos 23 23 83 83
6hijos 10 10 93 93
7hijos 4 4 97 97
8hijos 2 2 99 99
9hijos 1 1 100 100
> mean(datos)
[1] NA
Warning message:
In mean.default(datos) : argument is not numeric or logical: returning NA
> datos
V1
1 4hijos
2 5hijos
3 3hijos
4 4hijos
5 6hijos
6 6hijos
7 5hijos
8 5hijos
9 7hijos
10 3hijos
11 2hijos
12 5hijos
13 5hijos
14 7hijos
15 3hijos
16 6hijos
17 5hijos
18 3hijos
19 4hijos
20 5hijos
21 6hijos
22 2hijos
23 8hijos
24 3hijos
25 5hijos
26 7hijos
27 2hijos
28 2hijos
29 5hijos
30 8hijos
31 5hijos
32 3hijos
33 6hijos
34 5hijos
35 3hijos
36 6hijos
37 5hijos
38 5hijos
39 4hijos
40 5hijos
41 3hijos
42 4hijos
43 4hijos
44 3hijos
45 4hijos
46 2hijos
47 5hijos
48 4hijos
49 4hijos
50 6hijos
51 3hijos
52 3hijos
53 9hijos
54 6hijos
55 4hijos
56 2hijos
57 4hijos
58 6hijos
59 2hijos
60 6hijos
61 5hijos
62 2hijos
63 2hijos
64 3hijos
65 5hijos
66 10hijos
67 3hijos
68 5hijos
69 4hijos
70 5hijos
71 5hijos
72 4hijos
73 2hijos
74 4hijos
75 3hijos
76 4hijos
77 3hijos
78 4hijos
79 4hijos
80 4hijos
81 3hijos
82 4hijos
83 4hijos
84 4hijos
85 1hijos
86 4hijos
87 4hijos
88 5hijos
89 2hijos
90 2hijos
91 4hijos
92 4hijos
93 1hijos
94 4hijos
95 5hijos
96 5hijos
97 7hijos
98 3hijos
99 2hijos
100 4hijos
> datos=read.table("hijos.txt")
> datos
V1
1 4
2 5
3 3
4 4
5 6
6 6
7 5
8 5
9 7
10 3
11 2
12 5
13 5
14 7
15 3
16 6
17 5
18 3
19 4
20 5
21 6
22 2
23 8
24 3
25 5
26 7
27 2
28 2
29 5
30 8
31 5
32 3
33 6
34 5
35 3
36 6
37 5
38 5
39 4
40 5
41 3
42 4
43 4
44 3
45 4
46 2
47 5
48 4
49 4
50 6
51 3
52 3
53 9
54 6
55 4
56 2
57 4
58 6
59 2
60 6
61 5
62 2
63 2
64 3
65 5
66 10
67 3
68 5
69 4
70 5
71 5
72 4
73 2
74 4
75 3
76 4
77 3
78 4
79 4
80 4
81 3
82 4
83 4
84 4
85 1
86 4
87 4
88 5
89 2
90 2
91 4
92 4
93 1
94 4
95 5
96 5
97 7
98 3
99 2
100 4
> f=table(datos)
> f
datos
1 2 3 4 5 6 7 8 9 10
2 13 17 27 23 10 4 2 1 1
> n=sum(f)
> h=(f/n)*100
> F=cumsum(f)
> H=cumsum(h)
> cbind(f,h,F,H)
f h F H
1 2 2 2 2
2 13 13 15 15
3 17 17 32 32
4 27 27 59 59
5 23 23 82 82
6 10 10 92 92
7 4 4 96 96
8 2 2 98 98
9 1 1 99 99
10 1 1 100 100
> boxplot(datos)
> summary(datos)
V1
Min. : 1.00
1st Qu.: 3.00
Median : 4.00
Mean : 4.25
3rd Qu.: 5.00

Max. :10.00

SOLUCIÓN COMPENDIO EJERCICIO 8

> datos=read.table("Escalafon.txt")
> attach(datos)
> datos
V1
1 1
2 1
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 1
12 1
13 1
14 2
15 2
16 2
17 2
18 2
19 2
20 2
21 2
22 2
23 2
24 2
25 2
26 2
27 3
28 3
29 3
30 3
31 3
32 3
33 3
34 3
35 3
36 3
37 3
38 3
39 3
40 4
41 4
42 4
43 4
44 4
45 4
46 4
47 4
48 4
49 4
50 4
51 4
52 2
53 5
54 5
55 5
56 5
57 5
58 5
59 5
60 5
61 5
62 5
63 5
64 3
65 3
66 6
67 6
68 6
69 6
70 6
71 6
72 6
73 6
74 6
75 6
76 6
77 6
78 6
79 7
80 7
81 7
82 7
83 7
84 7
85 7
86 7
87 7
88 7
89 7
90 7
91 2
92 8
93 8
94 8
95 8
96 8
97 8
98 8
99 8
100 8
101 8
102 8
103 9
104 9
105 9
106 9
107 9
108 9
109 9
110 9
111 9
112 9
113 9
114 9
115 9
116 9
117 9
118 10
119 10
120 10
121 10
122 10
123 10
124 10
125 10
126 10
127 10
128 9
129 9
130 3
131 11
132 11
133 11
134 11
135 11
136 11
137 11
138 11
139 11
140 1
141 1
142 1
143 12
144 12
145 12
146 12
147 12
148 12
149 12
150 12
151 12
152 12
153 12
154 12
155 12
156 12
157 13
158 13
159 13
160 13
161 13
162 13
163 13
164 13
165 2
166 2
167 2
168 3
169 3
170 14
171 14
172 14
173 14
174 14
175 14
176 14
177 1
178 1
179 1
180 1
181 1
182 1
183 2
184 2
185 2
186 3
187 3
188 3
189 2
190 2
191 2
192 2
193 2
194 2
195 9
196 9
197 9
198 9
199 9
200 9
> f=table(datos)
> f
datos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
22 27 21 12 11 13 12 11 23 10 9 14 8 7
> n=sum(f)
> n
[1] 200
> h=(f/n)*100
> h
datos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
11.0 13.5 10.5 6.0 5.5 6.5 6.0 5.5 11.5 5.0 4.5 7.0 4.0 3.5
> F=cumsum(f)
> F
1 2 3 4 5 6 7 8 9 10 11 12 13 14
22 49 70 82 93 106 118 129 152 162 171 185 193 200
> H=cumsum(h)
> H
1 2 3 4 5 6 7 8 9 10 11 12 13 14
11.0 24.5 35.0 41.0 46.5 53.0 59.0 64.5 76.0 81.0 85.5 92.5 96.5 100.0
> cbind(f,h,F,H)
f h F H
1 22 11.0 22 11.0
2 27 13.5 49 24.5
3 21 10.5 70 35.0
4 12 6.0 82 41.0
5 11 5.5 93 46.5
6 13 6.5 106 53.0
7 12 6.0 118 59.0
8 11 5.5 129 64.5
9 23 11.5 152 76.0
10 10 5.0 162 81.0
11 9 4.5 171 85.5
12 14 7.0 185 92.5
13 8 4.0 193 96.5
14 7 3.5 200 100.0
> summary(datos)
V1
Min. : 1.00
1st Qu.: 3.00
Median : 6.00
Mean : 6.34
3rd Qu.: 9.00
Max. : 14.00
> boxplot(datos, main="Grados de Escalafon", xlab="Escalafon", ylab="Numero de docentes")
> boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Grados de escalafon", xlab="Docentes")
datos1=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,3,9)
quantile(datos1, prob = seq(0, 1, length = 11), type = 5)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
1.0 2.0 3.0 4.0 6.0 7.5 9.0 10.0 11.0 13.0 14.0
quantile(datos1)
0% 25% 50% 75% 100%
1.00 3.75 7.50 10.25 14.00
quantile(datos1, prob = c(0.15, 0.25, 0.35))
15% 25% 35%
2.05 3.75 5.00
quantile(datos1, prob = c(0.2,0.4,0.6,0.8))
20% 40% 60% 80%
3 6 9 11
em=c(16,17,22,21,27,19,22,31,15,19,22,19,20,18,18,19,16,18,16,21)
eh=c(13,12,22,21,22,18,22,27,15,10,11,19,20,18,17,19,36,18,19,20)
boxplot(em,eh)
datos2=cbind(em,eh)
summary(datos2)
em eh
Min. :15.00 Min. :10.00
1st Qu. :17.75 1st Qu. :16.50
Median :19.00 Median :19.00
Mean :19.80 Mean :18.95
3rd Qu. :21.25 3rd Qu.:21.25
Max. :31.00 Max. :36.00
f=table(em)
f
em
15 16 17 18 19 20 21 22 27 31
1 3 1 3 4 1 2 3 1 1
f=table(eh)
f
eh
10 11 12 13 15 17 18 19 20 21 22 27 36
1 1 1 1 1 1 3 3 2 1 3 1 1

SOLCUION COMPENDIO EJERCICIO 7

>datos=c(48,39,35,29,30,38,42,37,40,38,22,37,34,55,48,35,50,36,48,42,53,35,38,38,35,40,50,23,3 2,45,35,42,59,28,38,34,38,44,46,23,40,48,34,30,35,43,32,36,32,46)
> datos
[1] 48 39 35 29 30 38 42 37 40 38 22 37 34 55 48 35 50 36 48 42 53 35 38 38 35
[26] 40 50 23 32 45 35 42 59 28 38 34 38 44 46 23 40 48 34 30 35 43 32 36 32 46
> Rang=max(datos)-min(datos)
> Rang
[1] 37
> m=round(1+3.3*log10(50))
> m
[1] 7
> C=Rang/m
> C
[1] 5.285714
> C=6
> min(datos)
[1] 22
> max(datos)
[1] 59
> intervalos=cut(datos,breaks=c(19,25,31,37,43,49,55,61))
> intervalos
[1] (43,49] (37,43] (31,37] (25,31] (25,31] (37,43] (37,43] (31,37] (37,43]
[10] (37,43] (19,25] (31,37] (31,37] (49,55] (43,49] (31,37] (49,55] (31,37]
[19] (43,49] (37,43] (49,55] (31,37] (37,43] (37,43] (31,37] (37,43] (49,55]
[28] (19,25] (31,37] (43,49] (31,37] (37,43] (55,61] (25,31] (37,43] (31,37]
[37] (37,43] (43,49] (43,49] (19,25] (37,43] (43,49] (31,37] (25,31] (31,37]
[46] (37,43] (31,37] (31,37] (31,37] (43,49]
Levels: (19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
> f=table(intervalos)
> f
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
3 4 16 14 8 4 1
> n=sum(f)
> n
[1] 50
> h=(f/n)*100
> h
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
6 8 32 28 16 8 2
> F=cumsum(f)
> F
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
3 7 23 37 45 49 50

> H=cumsum(h)
> H
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
6 14 46 74 90 98 100
> cbind(f,h,F,H)
f h F H
(19,25] 3 6 3 6
(25,31] 4 8 7 14
(31,37] 16 32 23 46
(37,43] 14 28 37 74
(43,49] 8 16 45 90
(49,55] 4 8 49 98
(55,61] 1 2 50 100
> LimSup=c(25,31,37,43,49,55,61)
> LimInf=c(19,25,31,37,43,49,55)
> Marca=(LimSup+LimInf)/2
> Marca
[1] 22 28 34 40 46 52 58
> cbind(f,Marca,h,F,H)
f Marca h F H
(19,25] 3 22 6 3 6
(25,31] 4 28 8 7 14
(31,37] 16 34 32 23 46
(37,43] 14 40 28 37 74
(43,49] 8 46 16 45 90
(49,55] 4 52 8 49 98
(55,61] 1 58 2 50 100
> X=Marca*f
> X
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
66 112 544 560 368 208 58
> Media=sum(X)/n
> Media
[1] 38.32
> cbind(f,h,F,H,Marca,X)
f h F H Marca X
(19,25] 3 6 3 6 22 66
(25,31] 4 8 7 14 28 112
(31,37] 16 32 23 46 34 544
(37,43] 14 28 37 74 40 560
(43,49] 8 16 45 90 46 368
(49,55] 4 8 49 98 52 208
(55,61] 1 2 50 100 58 58

> hist(datos, col = "green", border = 1, main = "Edad Microempresarios", xlab = "Edad" , ylab =
"frecuencia")
> plot(LimInf, F)
> lines(c(min(LimInf), LimInf,max(LimSup)),c(0,F,0),type="l")

SOLUCIÓN COMPENDIO EJERCICIO 6

>datos=c(200,190,150,148,152,158,100,174,187,188,160,178,153,151,128,137,174,199,103,168,188,127,150,130,175)

> datos

[1] 200 190 150 148 152 158 100 174 187 188 160 178 153 151 128 137 174 199 103

[20] 168 188 127 150 130 175

> Rango=max(datos)-min(datos)

> Rango

[1] 100

> min(datos)

[1] 100

> max(datos)

[1] 200

> m=round(1+3.3*log10(25))

> m

[1] 6

> C=Rango/m

> C

[1] 16.66667

> C=17

> intervalos=cut(datos, breaks=c(99,116,133,150,167,184,201))

> intervalos

[1] (184,201] (184,201] (133,150] (133,150] (150,167] (150,167] (99,116]

[8] (167,184] (184,201] (184,201] (150,167] (167,184] (150,167] (150,167]

[15] (116,133] (133,150] (167,184] (184,201] (99,116] (167,184] (184,201]

[22] (116,133] (133,150] (116,133] (167,184]

Levels: (99,116] (116,133] (133,150] (150,167] (167,184] (184,201]

> f=table(intervalos)

> f

intervalos

(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]

2 3 4 5 5 6

> n=sum(f)

> n

[1] 25

> h=(f/n)*100

> h

intervalos

(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]

8 12 16 20 20 24

> F=cumsum(f)

> F

(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]

2 5 9 14 19 25

> H=cumsum(h)

> H

(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]

8 20 36 56 76 100

> cbind(f,h,F,H)

f h F H

(99,116] 2 8 2 8

(116,133] 3 12 5 20

(133,150] 4 16 9 36

(150,167] 5 20 14 56

(167,184] 5 20 19 76

(184,201] 6 24 25 100

> LimSup=c(116,133,150,167,184,201)

> LimInf=c(99,116,133,150,167,184)

> Marca=(LimSup+LimInf)/2

> Marca

[1] 107.5 124.5 141.5 158.5 175.5 192.5

> cbind(f,Marca,h,F,H)

F Marca h F H

(99,116] 2 107.5 8 2 8

(116,133] 3 124.5 12 5 20

(133,150] 4 141.5 16 9 36

(150,167] 5 158.5 20 14 56

(167,184] 5 175.5 20 19 76

(184,201] 6 192.5 24 25 100

> x=Marca*f

> x

intervalos

(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]

215.0 373.5 566.0 792.5 877.5 1155.0

> Media=sum(x)/n

> Media

[1] 159.18

> hist(datos, col = "green", border = 1, main = "Ahorros Voluntarios", xlab = "Ahorro" , ylab = "frecuencia")

> plot(LimInf, F) lines(c(min(LimInf), LimInf,max(LimSup)),c(0,F,0),type="l

ALGUNOS TERMNINOS UTILIZADOS

MEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMÉTICA:

El principal resumen que se puede hacer de una colección de datos es el promedio al que llamaremos media aritmética. Su cálculo se basa en la magnitud de los datos

Aunque es una medida de cálculo sencillo la información brindada por el número por si sola no es del todo confiable, dice poco de la distribución de los datos. Por ejemplo si decimos que el rendimiento académico de un grupo es de 2 y lo clasificamos como insuficiente, individualmente existirán estudiantes que superaron el logro y la valoración de 2. Así como existen estudiantes por debajo de esta valoración. La media aritmética es un resumen muy bueno, pero no da los detalles. El cálculo de la media aritmética depende de la forma como este dada la distribución de los datos, por eso el cálculo se lo hace de dos formas diferentes:

1. MEDIA PARA DATOS NO AGRUPADOS:

Se calcula sumando todos los datos y dividiendo por el número total de ellos.

Sean X₁, X₂, X₃,…X_ndatos no agrupados de una distribución numérica.

Si los datos enteros son pocos y se pueden ordenar en una tabla de frecuencias absolutas .

MEDIA PARA DATOS AGRUPADOS:

Hace referencia a la media calculada para los datos organizados en una distribución de frecuencias, que por lo general corresponden a datos de tipo continuo, y en una cantidad que exceden a 20 datos. Para el cálculo de la media para datos agrupados definamos primero que es una marca de clase

MARCAS DE CLASE:

Es el punto medio de cada intervalo de clase, la denotaremos como X_{i ..}

Sea [a b] los datos en el intervalo de clase, entonces la marca de clase se define como:

SUBMUESTRAS:

Si se quiere dividir la muestra total de una población en varias submuestras y se hace necesario el cálculo total de la media

Donde

n = n₁ + n₂ + ...+ n_n

PROPIEDADES DE LA MEDIA ARITMÉTICA:

1. La media es única

2. El cálculo de la media es sencillo y de fácil comprensión

3. Cuando existen datos extremos suficientemente distantes de la mayoría de los datos la media no es una medida muy confiable.

MEDIANA:

Determina la posición central que ocupa un dato en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella.

MEDIANA PARA DATOS NO AGRUPADOS:

Si los datos no están agrupados y la distribución de datos es impar, entonces la mediana es el dato central.

Si el número de datos es impar, el dato central de la distribución organizada en forma ascendente o descendente es la mediana.

X₁, X₂, X₃, X₄, ... , X_n n Impar

M_e= X_i , donde X_i representa el dato central

Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.

X₁, X₂, X₃, X₄, ... , X_n n par

M_e= , donde X_i, X_j representan Los datos centrales

MEDIANA PARA DATOS AGRUPADOS:

Dónde:

Li = Limite real inferior a la clase mediana

n = Es el tamaño de la muestra o población

Fa = Frecuencia acumulada anterior a la clase mediana.

C = Ancho del intervalo

f= Frecuencia observada en la clase mediana

CLASE MEDIANA:

Se entiende por clase mediana al primer intervalo de clase que contiene en las frecuencias acumuladas el valor de n /2, siempre que el número de intervalos sea par, de lo contrario la clase mediana es el intervalo central.

LOS CUANTILES:

Son medidas derivadas de la mediana, e intentan medir en valores de proporción más pequeña que la mediana misma a una muestra. Los cuantiles se dividen en:

1. Cuartiles

2. Deciles

3. Percentiles

4. Quintiles

CUARTILES:

Los cuartiles son valores posiciónales. Son medidas de tendencia central que dividen la distribución de datos en cuatro partes iguales. Muestra la importancia de la cuarta parte de la muestra analizada. Se simboliza con Q.

El primer cuartil deja el 25% de la información por debajo de él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la información en dos partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por encima.

Gráficamente:

0% 25% 50% 75%

Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente determinada.

CUARTIL 1: Q1

Representa el 25% de la muestra tomada. Por encima de este valor esta el 75% de los valores de una distribución.

CUARTIL 2: Q2

Se obtiene cuando K = 2; representa el 50% de la muestra tomada. Por encima de este valor esta el 50% de los valores de una distribución.

CUARTIL 3: Q3

Se obtiene cuando K = 3; representa el 75% de la muestra tomada. Por debajo de este valor esta el 25% de los valores de una distribución.

DECILES:

Se definen como la medida de tendencia central que divide la distribución de datos en diez partes iguales. Muestra la importancia de la décima parte de la muestra analizada. Se simboliza con D.

PERCENTILES:

Se definen como la medida de tendencia central que divide la distribución de datos en cien partes iguales. Muestra la importancia de la centésima parte de la muestra analizada. Se simboliza con P.