martes, 7 de octubre de 2014

GRACIAS

ESPERO

 QUE LES HAYA GUSTADO

 NUESTRO BLOG 

SOLUCION COMPENDIO EJERCICIO 9

> datos=read.table("nhijos.txt")
> datos
         V1
1    4hijos
2    5hijos
3    3hijos
4    4hijos
5    6hijos
6    6hijos
7    5hijos
8    5hijos
9    7hijos
10   3hijos
11   2hijos
12   5hijos
13   5hijos
14   7hijos
15   3hijos
16   6hijos
17   5hijos
18   3hijos
19   4hijos
20   5hijos
21   6hijos
22   2hijos
23   8hijos
24   3hijos
25   5hijos
26   7hijos
27   2hijos
28   2hijos
29   5hijos
30   8hijos
31   5hijos
32   3hijos
33   6hijos
34   5hijos
35   3hijos
36   6hijos
37   5hijos
38   5hijos
39   4hijos
40   5hijos
41   3hijos
42   4hijos
43   4hijos
44   3hijos
45   4hijos
46   2hijos
47   5hijos
48   4hijos
49   4hijos
50   6hijos
51   3hijos
52   3hijos
53   9hijos
54   6hijos
55   4hijos
56   2hijos
57   4hijos
58   6hijos
59   2hijos
60   6hijos
61   5hijos
62   2hijos
63   2hijos
64   3hijos
65   5hijos
66  10hijos
67   3hijos
68   5hijos
69   4hijos
70   5hijos
71   5hijos
72   4hijos
73   2hijos
74   4hijos
75   3hijos
76   4hijos
77   3hijos
78   4hijos
79   4hijos
80   4hijos
81   3hijos
82   4hijos
83   4hijos
84   4hijos
85   1hijos
86   4hijos
87   4hijos
88   5hijos
89   2hijos
90   2hijos
91   4hijos
92   4hijos
93   1hijos
94   4hijos
95   5hijos
96   5hijos
97   7hijos
98   3hijos
99   2hijos
100  4hijos
> f=table(nhijos)
Error in table(nhijos) : object 'nhijos' not found
> f=table(datos)
> f
datos
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       2      13      17      27      23      10       4       2       1
> n=sum(f)
> n
[1] 100
> h=(f/n)*100
> h
datos
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       2      13      17      27      23      10       4       2       1
> F=cumsum(f)
> F
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       3      16      33      60      83      93      97      99     100
> H=cumsum(h)
> H
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       3      16      33      60      83      93      97      99     100
> cbind(f,h,F,H)
         f  h   F   H
10hijos  1  1   1   1
1hijos   2  2   3   3
2hijos  13 13  16  16
3hijos  17 17  33  33
4hijos  27 27  60  60
5hijos  23 23  83  83
6hijos  10 10  93  93
7hijos   4  4  97  97
8hijos   2  2  99  99
9hijos   1  1 100 100
> mean(datos)
[1] NA
Warning message:
In mean.default(datos) : argument is not numeric or logical: returning NA
> datos
         V1
1    4hijos
2    5hijos
3    3hijos
4    4hijos
5    6hijos
6    6hijos
7    5hijos
8    5hijos
9    7hijos
10   3hijos
11   2hijos
12   5hijos
13   5hijos
14   7hijos
15   3hijos
16   6hijos
17   5hijos
18   3hijos
19   4hijos
20   5hijos
21   6hijos
22   2hijos
23   8hijos
24   3hijos
25   5hijos
26   7hijos
27   2hijos
28   2hijos
29   5hijos
30   8hijos
31   5hijos
32   3hijos
33   6hijos
34   5hijos
35   3hijos
36   6hijos
37   5hijos
38   5hijos
39   4hijos
40   5hijos
41   3hijos
42   4hijos
43   4hijos
44   3hijos
45   4hijos
46   2hijos
47   5hijos
48   4hijos
49   4hijos
50   6hijos
51   3hijos
52   3hijos
53   9hijos
54   6hijos
55   4hijos
56   2hijos
57   4hijos
58   6hijos
59   2hijos
60   6hijos
61   5hijos
62   2hijos
63   2hijos
64   3hijos
65   5hijos
66  10hijos
67   3hijos
68   5hijos
69   4hijos
70   5hijos
71   5hijos
72   4hijos
73   2hijos
74   4hijos
75   3hijos
76   4hijos
77   3hijos
78   4hijos
79   4hijos
80   4hijos
81   3hijos
82   4hijos
83   4hijos
84   4hijos
85   1hijos
86   4hijos
87   4hijos
88   5hijos
89   2hijos
90   2hijos
91   4hijos
92   4hijos
93   1hijos
94   4hijos
95   5hijos
96   5hijos
97   7hijos
98   3hijos
99   2hijos
100  4hijos
> datos=read.table("hijos.txt")
> datos
    V1
1    4
2    5
3    3
4    4
5    6
6    6
7    5
8    5
9    7
10   3
11   2
12   5
13   5
14   7
15   3
16   6
17   5
18   3
19   4
20   5
21   6
22   2
23   8
24   3
25   5
26   7
27   2
28   2
29   5
30   8
31   5
32   3
33   6
34   5
35   3
36   6
37   5
38   5
39   4
40   5
41   3
42   4
43   4
44   3
45   4
46   2
47   5
48   4
49   4
50   6
51   3
52   3
53   9
54   6
55   4
56   2
57   4
58   6
59   2
60   6
61   5
62   2
63   2
64   3
65   5
66  10
67   3
68   5
69   4
70   5
71   5
72   4
73   2
74   4
75   3
76   4
77   3
78   4
79   4
80   4
81   3
82   4
83   4
84   4
85   1
86   4
87   4
88   5
89   2
90   2
91   4
92   4
93   1
94   4
95   5
96   5
97   7
98   3
99   2
100  4
> f=table(datos)
> f
datos
 1  2  3  4  5  6  7  8  9 10
 2 13 17 27 23 10  4  2  1  1
> n=sum(f)
> h=(f/n)*100
> F=cumsum(f)
> H=cumsum(h)
> cbind(f,h,F,H)
    f  h   F   H
1   2  2   2   2
2  13 13  15  15
3  17 17  32  32
4  27 27  59  59
5  23 23  82  82
6  10 10  92  92
7   4  4  96  96
8   2  2  98  98
9   1  1  99  99
10  1  1 100 100
> boxplot(datos)
> summary(datos)
       V1    
 Min.   : 1.00
 1st Qu.: 3.00
 Median : 4.00
 Mean   : 4.25
 3rd Qu.: 5.00
 Max.   :10.00

SOLUCIÓN COMPENDIO EJERCICIO 8

> datos=read.table("Escalafon.txt")
> attach(datos)
> datos
V1
1 1
2 1
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 1
12 1
13 1
14 2
15 2
16 2
17 2
18 2
19 2
20 2
21 2
22 2
23 2
24 2
25 2
26 2
27 3
28 3
29 3
30 3
31 3
32 3
33 3
34 3
35 3
36 3
37 3
38 3
39 3
40 4
41 4
42 4
43 4
44 4
45 4
46 4
47 4
48 4
49 4
50 4
51 4
52 2
53 5
54 5
55 5
56 5
57 5
58 5
59 5
60 5
61 5
62 5
63 5
64 3
65 3
66 6
67 6
68 6
69 6
70 6
71 6
72 6
73 6
74 6
75 6
76 6
77 6
78 6
79 7
80 7
81 7
82 7
83 7
84 7
85 7
86 7
87 7
88 7
89 7
90 7
91 2
92 8
93 8
94 8
95 8
96 8
97 8
98 8
99 8
100 8
101 8
102 8
103 9
104 9
105 9
106 9
107 9
108 9
109 9
110 9
111 9
112 9
113 9
114 9
115 9
116 9
117 9
118 10
119 10
120 10
121 10
122 10
123 10
124 10
125 10
126 10
127 10
128 9
129 9
130 3
131 11
132 11
133 11
134 11
135 11
136 11
137 11
138 11
139 11
140 1
141 1
142 1
143 12
144 12
145 12
146 12
147 12
148 12
149 12
150 12
151 12
152 12
153 12
154 12
155 12
156 12
157 13
158 13
159 13
160 13
161 13
162 13
163 13
164 13
165 2
166 2
167 2
168 3
169 3
170 14
171 14
172 14
173 14
174 14
175 14
176 14
177 1
178 1
179 1
180 1
181 1
182 1
183 2
184 2
185 2
186 3
187 3
188 3
189 2
190 2
191 2
192 2
193 2
194 2
195 9
196 9
197 9
198 9
199 9
200 9
> f=table(datos)
> f
datos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
22 27 21 12 11 13 12 11 23 10 9 14 8 7
> n=sum(f)
> n
[1] 200
> h=(f/n)*100
> h
datos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
11.0 13.5 10.5 6.0 5.5 6.5 6.0 5.5 11.5 5.0 4.5 7.0 4.0 3.5
> F=cumsum(f)
> F
1 2 3 4 5 6 7 8 9 10 11 12 13 14
22 49 70 82 93 106 118 129 152 162 171 185 193 200
> H=cumsum(h)
> H
1 2 3 4 5 6 7 8 9 10 11 12 13 14
11.0 24.5 35.0 41.0 46.5 53.0 59.0 64.5 76.0 81.0 85.5 92.5 96.5 100.0
> cbind(f,h,F,H)
f h F H
1 22 11.0 22 11.0
2 27 13.5 49 24.5
3 21 10.5 70 35.0
4 12 6.0 82 41.0
5 11 5.5 93 46.5
6 13 6.5 106 53.0
7 12 6.0 118 59.0
8 11 5.5 129 64.5
9 23 11.5 152 76.0
10 10 5.0 162 81.0
11 9 4.5 171 85.5
12 14 7.0 185 92.5
13 8 4.0 193 96.5
14 7 3.5 200 100.0
> summary(datos)
V1
Min. : 1.00
1st Qu.: 3.00
Median : 6.00
Mean : 6.34
3rd Qu.: 9.00
Max. : 14.00
> boxplot(datos, main="Grados de Escalafon", xlab="Escalafon", ylab="Numero de docentes")
> boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Grados de escalafon", xlab="Docentes")
datos1=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,3,9)
quantile(datos1, prob = seq(0, 1, length = 11), type = 5)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
1.0 2.0 3.0 4.0 6.0 7.5 9.0 10.0 11.0 13.0 14.0
quantile(datos1)
0% 25% 50% 75% 100%
1.00 3.75 7.50 10.25 14.00
quantile(datos1, prob = c(0.15, 0.25, 0.35))
15% 25% 35%
2.05 3.75 5.00
quantile(datos1, prob = c(0.2,0.4,0.6,0.8))
20% 40% 60% 80%
3 6 9 11
em=c(16,17,22,21,27,19,22,31,15,19,22,19,20,18,18,19,16,18,16,21)
eh=c(13,12,22,21,22,18,22,27,15,10,11,19,20,18,17,19,36,18,19,20)
boxplot(em,eh)
datos2=cbind(em,eh)
summary(datos2)
em eh
Min. :15.00 Min. :10.00
1st Qu. :17.75 1st Qu. :16.50
Median :19.00 Median :19.00
Mean :19.80 Mean :18.95
3rd Qu. :21.25 3rd Qu.:21.25
Max. :31.00 Max. :36.00
f=table(em)
f
em
15 16 17 18 19 20 21 22 27 31
1 3 1 3 4 1 2 3 1 1
f=table(eh)
f
eh
10 11 12 13 15 17 18 19 20 21 22 27 36
1 1 1 1 1 1 3 3 2 1 3 1 1




                                                       

SOLCUION COMPENDIO EJERCICIO 7

>datos=c(48,39,35,29,30,38,42,37,40,38,22,37,34,55,48,35,50,36,48,42,53,35,38,38,35,40,50,23,3 2,45,35,42,59,28,38,34,38,44,46,23,40,48,34,30,35,43,32,36,32,46)
> datos
[1] 48 39 35 29 30 38 42 37 40 38 22 37 34 55 48 35 50 36 48 42 53 35 38 38 35
[26] 40 50 23 32 45 35 42 59 28 38 34 38 44 46 23 40 48 34 30 35 43 32 36 32 46
> Rang=max(datos)-min(datos)
> Rang
[1] 37
> m=round(1+3.3*log10(50))
> m
[1] 7
> C=Rang/m
> C
[1] 5.285714
> C=6
> min(datos)
[1] 22
> max(datos)
[1] 59
> intervalos=cut(datos,breaks=c(19,25,31,37,43,49,55,61))
> intervalos
[1] (43,49] (37,43] (31,37] (25,31] (25,31] (37,43] (37,43] (31,37] (37,43]
[10] (37,43] (19,25] (31,37] (31,37] (49,55] (43,49] (31,37] (49,55] (31,37]
[19] (43,49] (37,43] (49,55] (31,37] (37,43] (37,43] (31,37] (37,43] (49,55]
[28] (19,25] (31,37] (43,49] (31,37] (37,43] (55,61] (25,31] (37,43] (31,37]
[37] (37,43] (43,49] (43,49] (19,25] (37,43] (43,49] (31,37] (25,31] (31,37]
[46] (37,43] (31,37] (31,37] (31,37] (43,49]
Levels: (19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
> f=table(intervalos)
> f
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
3 4 16 14 8 4 1
> n=sum(f)
> n
[1] 50
> h=(f/n)*100
> h
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
6 8 32 28 16 8 2
> F=cumsum(f)
> F
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
3 7 23 37 45 49 50

> H=cumsum(h)
> H
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
6 14 46 74 90 98 100
> cbind(f,h,F,H)
f h F H
(19,25] 3 6 3 6
(25,31] 4 8 7 14
(31,37] 16 32 23 46
(37,43] 14 28 37 74
(43,49] 8 16 45 90
(49,55] 4 8 49 98
(55,61] 1 2 50 100
> LimSup=c(25,31,37,43,49,55,61)
> LimInf=c(19,25,31,37,43,49,55)
> Marca=(LimSup+LimInf)/2
> Marca
[1] 22 28 34 40 46 52 58
> cbind(f,Marca,h,F,H)
f Marca h F H
(19,25] 3 22 6 3 6
(25,31] 4 28 8 7 14
(31,37] 16 34 32 23 46
(37,43] 14 40 28 37 74
(43,49] 8 46 16 45 90
(49,55] 4 52 8 49 98
(55,61] 1 58 2 50 100
> X=Marca*f
> X
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
66 112 544 560 368 208 58
> Media=sum(X)/n
> Media
[1] 38.32
> cbind(f,h,F,H,Marca,X)
f h F H Marca X
(19,25] 3 6 3 6 22 66
(25,31] 4 8 7 14 28 112
(31,37] 16 32 23 46 34 544
(37,43] 14 28 37 74 40 560
(43,49] 8 16 45 90 46 368
(49,55] 4 8 49 98 52 208
(55,61] 1 2 50 100 58 58

> hist(datos, col = "green", border = 1, main = "Edad Microempresarios", xlab = "Edad" , ylab =
"frecuencia")
> plot(LimInf, F)
> lines(c(min(LimInf), LimInf,max(LimSup)),c(0,F,0),type="l")

SOLUCIÓN COMPENDIO EJERCICIO 6

>datos=c(200,190,150,148,152,158,100,174,187,188,160,178,153,151,128,137,174,199,103,168,188,127,150,130,175)
> datos
[1] 200 190 150 148 152 158 100 174 187 188 160 178 153 151 128 137 174 199 103
[20] 168 188 127 150 130 175
> Rango=max(datos)-min(datos)
> Rango
[1] 100
> min(datos)
[1] 100
> max(datos)
[1] 200
> m=round(1+3.3*log10(25))
> m
[1] 6
> C=Rango/m
> C
[1] 16.66667
> C=17
> intervalos=cut(datos, breaks=c(99,116,133,150,167,184,201))
> intervalos
[1] (184,201] (184,201] (133,150] (133,150] (150,167] (150,167] (99,116]
[8] (167,184] (184,201] (184,201] (150,167] (167,184] (150,167] (150,167]
[15] (116,133] (133,150] (167,184] (184,201] (99,116] (167,184] (184,201]
[22] (116,133] (133,150] (116,133] (167,184]
Levels: (99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
> f=table(intervalos)
> f
intervalos
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
2 3 4 5 5 6
> n=sum(f)
> n
[1] 25
> h=(f/n)*100
> h
intervalos
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
8 12 16 20 20 24
> F=cumsum(f)
> F
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
2 5 9 14 19 25
> H=cumsum(h)
> H
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
8 20 36 56 76 100
> cbind(f,h,F,H)
f h F H
(99,116] 2 8 2 8
(116,133] 3 12 5 20
(133,150] 4 16 9 36
(150,167] 5 20 14 56
(167,184] 5 20 19 76
(184,201] 6 24 25 100
> LimSup=c(116,133,150,167,184,201)
> LimInf=c(99,116,133,150,167,184)
> Marca=(LimSup+LimInf)/2
> Marca
[1] 107.5 124.5 141.5 158.5 175.5 192.5
> cbind(f,Marca,h,F,H)
F Marca h F H
(99,116] 2 107.5 8 2 8
(116,133] 3 124.5 12 5 20
(133,150] 4 141.5 16 9 36
(150,167] 5 158.5 20 14 56
(167,184] 5 175.5 20 19 76
(184,201] 6 192.5 24 25 100
> x=Marca*f
> x
intervalos
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
215.0 373.5 566.0 792.5 877.5 1155.0
> Media=sum(x)/n
> Media
[1] 159.18
> hist(datos, col = "green", border = 1, main = "Ahorros Voluntarios", xlab = "Ahorro" , ylab = "frecuencia")
> plot(LimInf, F) lines(c(min(LimInf), LimInf,max(LimSup)),c(0,F,0),type="l




ALGUNOS TERMNINOS UTILIZADOS

MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMÉTICA:

El principal resumen que se puede hacer de una colección de datos es el promedio al que llamaremos media aritmética. Su cálculo  se basa en la magnitud de los datos

Aunque es una medida de cálculo sencillo la información brindada por el número  por si sola no es del todo confiable, dice poco de la distribución de los datos. Por ejemplo si decimos que el rendimiento académico de un grupo es de 2 y lo clasificamos como insuficiente, individualmente existirán estudiantes que superaron el logro y la valoración de 2. Así como existen estudiantes por debajo de esta valoración.  La media aritmética es un resumen muy bueno, pero no da los detalles. El cálculo de la media aritmética depende de la forma como este dada la distribución de los datos, por eso el cálculo se lo hace de dos formas diferentes:

1. MEDIA PARA DATOS NO AGRUPADOS:

Se calcula sumando todos los datos y dividiendo por el número total de ellos.

Sean  X1, X2, X3,…Xdatos no agrupados de una distribución numérica.

Si los datos enteros son pocos y se pueden ordenar en una tabla de frecuencias absolutas .


MEDIA PARA DATOS AGRUPADOS:

Hace referencia a la media calculada para los datos organizados en una distribución de frecuencias, que por lo general corresponden a datos de tipo continuo, y en una cantidad que exceden a 20 datos. Para el cálculo de la media para datos agrupados definamos primero que es una marca de clase

 

MARCAS DE CLASE:


Es el punto medio de cada intervalo de clase, la denotaremos como Xi ..

Sea [a   b] los datos en el intervalo de clase, entonces la marca de clase se define como:




SUBMUESTRAS:

Si se quiere dividir la muestra total de una población en varias submuestras y se hace necesario el cálculo total de la media




Donde
n = n1 + n2 + ...+ nn



PROPIEDADES DE LA MEDIA ARITMÉTICA:

1. La media es única
2. El cálculo de la media es sencillo y de fácil comprensión
3. Cuando existen datos extremos suficientemente distantes de la mayoría de los datos la media no es una medida muy confiable.

MEDIANA:

Determina la posición central que ocupa un dato en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella.

MEDIANA PARA DATOS NO AGRUPADOS:


Si los datos no están agrupados y la distribución de datos es impar, entonces la mediana es el dato central.
Si el número de datos es impar, el dato central de la distribución organizada en forma ascendente o descendente es la mediana.

X1, X2, X3, X4, ... , Xn  n Impar
                   Me= Xi , donde Xi  representa el dato central

Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.
 X1, X2, X3, X4, ... , Xn  n par
                   Me= , donde Xi, X representan Los datos centrales

MEDIANA PARA DATOS AGRUPADOS:






Dónde:

Li = Limite real inferior a la clase mediana
n = Es el tamaño de la muestra o población
Fa = Frecuencia acumulada anterior a la clase mediana.
C = Ancho del intervalo
f= Frecuencia observada en la clase mediana

 

CLASE MEDIANA:


Se entiende por clase mediana al primer intervalo de clase que contiene en las frecuencias acumuladas el valor de n /2, siempre que el número de intervalos sea par, de lo contrario la clase mediana es el intervalo central.


LOS CUANTILES:

Son medidas derivadas de la mediana, e intentan medir en valores de proporción más pequeña que la mediana misma  a una muestra. Los cuantiles se dividen en:

1. Cuartiles
2. Deciles
3. Percentiles
4. Quintiles

CUARTILES:

Los cuartiles son valores posiciónales. Son  medidas de tendencia central que  dividen la distribución de datos en cuatro partes iguales. Muestra la importancia de la cuarta parte de la muestra analizada. Se simboliza con Q.

El primer cuartil deja el 25% de la información por debajo de él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la información en dos partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por encima.

Gráficamente:

0%           25%             50%          75%
 



Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente determinada.
 

CUARTIL 1: Q1

Representa el 25% de la muestra tomada. Por encima de este valor esta el 75% de los valores de una distribución.


CUARTIL 2: Q2

Se obtiene cuando K = 2; representa el 50% de la muestra tomada. Por encima de este valor esta el 50% de los valores de una distribución.

 
 
CUARTIL 3: Q3

Se obtiene cuando K = 3; representa el 75% de la muestra tomada. Por debajo de este valor esta el 25% de los valores de una distribución.



 
DECILES:

Se definen como la  medida de tendencia central que  divide la distribución de datos en diez partes iguales. Muestra la importancia de la décima parte de la muestra analizada. Se simboliza con D.



PERCENTILES:

Se definen como la  medida de tendencia central que  divide la distribución de datos en cien partes iguales. Muestra la importancia de la centésima  parte de la muestra analizada. Se simboliza con P.








TALLER EN CLASE










MAPA MENTAL

                                                                           MAPA MEDIDAS DE TENDENCIA CENTRAL

lunes, 6 de octubre de 2014