martes, 7 de octubre de 2014

GRACIAS

ESPERO

 QUE LES HAYA GUSTADO

 NUESTRO BLOG 

SOLUCION COMPENDIO EJERCICIO 9

> datos=read.table("nhijos.txt")
> datos
         V1
1    4hijos
2    5hijos
3    3hijos
4    4hijos
5    6hijos
6    6hijos
7    5hijos
8    5hijos
9    7hijos
10   3hijos
11   2hijos
12   5hijos
13   5hijos
14   7hijos
15   3hijos
16   6hijos
17   5hijos
18   3hijos
19   4hijos
20   5hijos
21   6hijos
22   2hijos
23   8hijos
24   3hijos
25   5hijos
26   7hijos
27   2hijos
28   2hijos
29   5hijos
30   8hijos
31   5hijos
32   3hijos
33   6hijos
34   5hijos
35   3hijos
36   6hijos
37   5hijos
38   5hijos
39   4hijos
40   5hijos
41   3hijos
42   4hijos
43   4hijos
44   3hijos
45   4hijos
46   2hijos
47   5hijos
48   4hijos
49   4hijos
50   6hijos
51   3hijos
52   3hijos
53   9hijos
54   6hijos
55   4hijos
56   2hijos
57   4hijos
58   6hijos
59   2hijos
60   6hijos
61   5hijos
62   2hijos
63   2hijos
64   3hijos
65   5hijos
66  10hijos
67   3hijos
68   5hijos
69   4hijos
70   5hijos
71   5hijos
72   4hijos
73   2hijos
74   4hijos
75   3hijos
76   4hijos
77   3hijos
78   4hijos
79   4hijos
80   4hijos
81   3hijos
82   4hijos
83   4hijos
84   4hijos
85   1hijos
86   4hijos
87   4hijos
88   5hijos
89   2hijos
90   2hijos
91   4hijos
92   4hijos
93   1hijos
94   4hijos
95   5hijos
96   5hijos
97   7hijos
98   3hijos
99   2hijos
100  4hijos
> f=table(nhijos)
Error in table(nhijos) : object 'nhijos' not found
> f=table(datos)
> f
datos
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       2      13      17      27      23      10       4       2       1
> n=sum(f)
> n
[1] 100
> h=(f/n)*100
> h
datos
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       2      13      17      27      23      10       4       2       1
> F=cumsum(f)
> F
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       3      16      33      60      83      93      97      99     100
> H=cumsum(h)
> H
10hijos  1hijos  2hijos  3hijos  4hijos  5hijos  6hijos  7hijos  8hijos  9hijos
      1       3      16      33      60      83      93      97      99     100
> cbind(f,h,F,H)
         f  h   F   H
10hijos  1  1   1   1
1hijos   2  2   3   3
2hijos  13 13  16  16
3hijos  17 17  33  33
4hijos  27 27  60  60
5hijos  23 23  83  83
6hijos  10 10  93  93
7hijos   4  4  97  97
8hijos   2  2  99  99
9hijos   1  1 100 100
> mean(datos)
[1] NA
Warning message:
In mean.default(datos) : argument is not numeric or logical: returning NA
> datos
         V1
1    4hijos
2    5hijos
3    3hijos
4    4hijos
5    6hijos
6    6hijos
7    5hijos
8    5hijos
9    7hijos
10   3hijos
11   2hijos
12   5hijos
13   5hijos
14   7hijos
15   3hijos
16   6hijos
17   5hijos
18   3hijos
19   4hijos
20   5hijos
21   6hijos
22   2hijos
23   8hijos
24   3hijos
25   5hijos
26   7hijos
27   2hijos
28   2hijos
29   5hijos
30   8hijos
31   5hijos
32   3hijos
33   6hijos
34   5hijos
35   3hijos
36   6hijos
37   5hijos
38   5hijos
39   4hijos
40   5hijos
41   3hijos
42   4hijos
43   4hijos
44   3hijos
45   4hijos
46   2hijos
47   5hijos
48   4hijos
49   4hijos
50   6hijos
51   3hijos
52   3hijos
53   9hijos
54   6hijos
55   4hijos
56   2hijos
57   4hijos
58   6hijos
59   2hijos
60   6hijos
61   5hijos
62   2hijos
63   2hijos
64   3hijos
65   5hijos
66  10hijos
67   3hijos
68   5hijos
69   4hijos
70   5hijos
71   5hijos
72   4hijos
73   2hijos
74   4hijos
75   3hijos
76   4hijos
77   3hijos
78   4hijos
79   4hijos
80   4hijos
81   3hijos
82   4hijos
83   4hijos
84   4hijos
85   1hijos
86   4hijos
87   4hijos
88   5hijos
89   2hijos
90   2hijos
91   4hijos
92   4hijos
93   1hijos
94   4hijos
95   5hijos
96   5hijos
97   7hijos
98   3hijos
99   2hijos
100  4hijos
> datos=read.table("hijos.txt")
> datos
    V1
1    4
2    5
3    3
4    4
5    6
6    6
7    5
8    5
9    7
10   3
11   2
12   5
13   5
14   7
15   3
16   6
17   5
18   3
19   4
20   5
21   6
22   2
23   8
24   3
25   5
26   7
27   2
28   2
29   5
30   8
31   5
32   3
33   6
34   5
35   3
36   6
37   5
38   5
39   4
40   5
41   3
42   4
43   4
44   3
45   4
46   2
47   5
48   4
49   4
50   6
51   3
52   3
53   9
54   6
55   4
56   2
57   4
58   6
59   2
60   6
61   5
62   2
63   2
64   3
65   5
66  10
67   3
68   5
69   4
70   5
71   5
72   4
73   2
74   4
75   3
76   4
77   3
78   4
79   4
80   4
81   3
82   4
83   4
84   4
85   1
86   4
87   4
88   5
89   2
90   2
91   4
92   4
93   1
94   4
95   5
96   5
97   7
98   3
99   2
100  4
> f=table(datos)
> f
datos
 1  2  3  4  5  6  7  8  9 10
 2 13 17 27 23 10  4  2  1  1
> n=sum(f)
> h=(f/n)*100
> F=cumsum(f)
> H=cumsum(h)
> cbind(f,h,F,H)
    f  h   F   H
1   2  2   2   2
2  13 13  15  15
3  17 17  32  32
4  27 27  59  59
5  23 23  82  82
6  10 10  92  92
7   4  4  96  96
8   2  2  98  98
9   1  1  99  99
10  1  1 100 100
> boxplot(datos)
> summary(datos)
       V1    
 Min.   : 1.00
 1st Qu.: 3.00
 Median : 4.00
 Mean   : 4.25
 3rd Qu.: 5.00
 Max.   :10.00

SOLUCIÓN COMPENDIO EJERCICIO 8

> datos=read.table("Escalafon.txt")
> attach(datos)
> datos
V1
1 1
2 1
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 1
12 1
13 1
14 2
15 2
16 2
17 2
18 2
19 2
20 2
21 2
22 2
23 2
24 2
25 2
26 2
27 3
28 3
29 3
30 3
31 3
32 3
33 3
34 3
35 3
36 3
37 3
38 3
39 3
40 4
41 4
42 4
43 4
44 4
45 4
46 4
47 4
48 4
49 4
50 4
51 4
52 2
53 5
54 5
55 5
56 5
57 5
58 5
59 5
60 5
61 5
62 5
63 5
64 3
65 3
66 6
67 6
68 6
69 6
70 6
71 6
72 6
73 6
74 6
75 6
76 6
77 6
78 6
79 7
80 7
81 7
82 7
83 7
84 7
85 7
86 7
87 7
88 7
89 7
90 7
91 2
92 8
93 8
94 8
95 8
96 8
97 8
98 8
99 8
100 8
101 8
102 8
103 9
104 9
105 9
106 9
107 9
108 9
109 9
110 9
111 9
112 9
113 9
114 9
115 9
116 9
117 9
118 10
119 10
120 10
121 10
122 10
123 10
124 10
125 10
126 10
127 10
128 9
129 9
130 3
131 11
132 11
133 11
134 11
135 11
136 11
137 11
138 11
139 11
140 1
141 1
142 1
143 12
144 12
145 12
146 12
147 12
148 12
149 12
150 12
151 12
152 12
153 12
154 12
155 12
156 12
157 13
158 13
159 13
160 13
161 13
162 13
163 13
164 13
165 2
166 2
167 2
168 3
169 3
170 14
171 14
172 14
173 14
174 14
175 14
176 14
177 1
178 1
179 1
180 1
181 1
182 1
183 2
184 2
185 2
186 3
187 3
188 3
189 2
190 2
191 2
192 2
193 2
194 2
195 9
196 9
197 9
198 9
199 9
200 9
> f=table(datos)
> f
datos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
22 27 21 12 11 13 12 11 23 10 9 14 8 7
> n=sum(f)
> n
[1] 200
> h=(f/n)*100
> h
datos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
11.0 13.5 10.5 6.0 5.5 6.5 6.0 5.5 11.5 5.0 4.5 7.0 4.0 3.5
> F=cumsum(f)
> F
1 2 3 4 5 6 7 8 9 10 11 12 13 14
22 49 70 82 93 106 118 129 152 162 171 185 193 200
> H=cumsum(h)
> H
1 2 3 4 5 6 7 8 9 10 11 12 13 14
11.0 24.5 35.0 41.0 46.5 53.0 59.0 64.5 76.0 81.0 85.5 92.5 96.5 100.0
> cbind(f,h,F,H)
f h F H
1 22 11.0 22 11.0
2 27 13.5 49 24.5
3 21 10.5 70 35.0
4 12 6.0 82 41.0
5 11 5.5 93 46.5
6 13 6.5 106 53.0
7 12 6.0 118 59.0
8 11 5.5 129 64.5
9 23 11.5 152 76.0
10 10 5.0 162 81.0
11 9 4.5 171 85.5
12 14 7.0 185 92.5
13 8 4.0 193 96.5
14 7 3.5 200 100.0
> summary(datos)
V1
Min. : 1.00
1st Qu.: 3.00
Median : 6.00
Mean : 6.34
3rd Qu.: 9.00
Max. : 14.00
> boxplot(datos, main="Grados de Escalafon", xlab="Escalafon", ylab="Numero de docentes")
> boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Grados de escalafon", xlab="Docentes")
datos1=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,3,9)
quantile(datos1, prob = seq(0, 1, length = 11), type = 5)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
1.0 2.0 3.0 4.0 6.0 7.5 9.0 10.0 11.0 13.0 14.0
quantile(datos1)
0% 25% 50% 75% 100%
1.00 3.75 7.50 10.25 14.00
quantile(datos1, prob = c(0.15, 0.25, 0.35))
15% 25% 35%
2.05 3.75 5.00
quantile(datos1, prob = c(0.2,0.4,0.6,0.8))
20% 40% 60% 80%
3 6 9 11
em=c(16,17,22,21,27,19,22,31,15,19,22,19,20,18,18,19,16,18,16,21)
eh=c(13,12,22,21,22,18,22,27,15,10,11,19,20,18,17,19,36,18,19,20)
boxplot(em,eh)
datos2=cbind(em,eh)
summary(datos2)
em eh
Min. :15.00 Min. :10.00
1st Qu. :17.75 1st Qu. :16.50
Median :19.00 Median :19.00
Mean :19.80 Mean :18.95
3rd Qu. :21.25 3rd Qu.:21.25
Max. :31.00 Max. :36.00
f=table(em)
f
em
15 16 17 18 19 20 21 22 27 31
1 3 1 3 4 1 2 3 1 1
f=table(eh)
f
eh
10 11 12 13 15 17 18 19 20 21 22 27 36
1 1 1 1 1 1 3 3 2 1 3 1 1




                                                       

SOLCUION COMPENDIO EJERCICIO 7

>datos=c(48,39,35,29,30,38,42,37,40,38,22,37,34,55,48,35,50,36,48,42,53,35,38,38,35,40,50,23,3 2,45,35,42,59,28,38,34,38,44,46,23,40,48,34,30,35,43,32,36,32,46)
> datos
[1] 48 39 35 29 30 38 42 37 40 38 22 37 34 55 48 35 50 36 48 42 53 35 38 38 35
[26] 40 50 23 32 45 35 42 59 28 38 34 38 44 46 23 40 48 34 30 35 43 32 36 32 46
> Rang=max(datos)-min(datos)
> Rang
[1] 37
> m=round(1+3.3*log10(50))
> m
[1] 7
> C=Rang/m
> C
[1] 5.285714
> C=6
> min(datos)
[1] 22
> max(datos)
[1] 59
> intervalos=cut(datos,breaks=c(19,25,31,37,43,49,55,61))
> intervalos
[1] (43,49] (37,43] (31,37] (25,31] (25,31] (37,43] (37,43] (31,37] (37,43]
[10] (37,43] (19,25] (31,37] (31,37] (49,55] (43,49] (31,37] (49,55] (31,37]
[19] (43,49] (37,43] (49,55] (31,37] (37,43] (37,43] (31,37] (37,43] (49,55]
[28] (19,25] (31,37] (43,49] (31,37] (37,43] (55,61] (25,31] (37,43] (31,37]
[37] (37,43] (43,49] (43,49] (19,25] (37,43] (43,49] (31,37] (25,31] (31,37]
[46] (37,43] (31,37] (31,37] (31,37] (43,49]
Levels: (19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
> f=table(intervalos)
> f
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
3 4 16 14 8 4 1
> n=sum(f)
> n
[1] 50
> h=(f/n)*100
> h
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
6 8 32 28 16 8 2
> F=cumsum(f)
> F
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
3 7 23 37 45 49 50

> H=cumsum(h)
> H
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
6 14 46 74 90 98 100
> cbind(f,h,F,H)
f h F H
(19,25] 3 6 3 6
(25,31] 4 8 7 14
(31,37] 16 32 23 46
(37,43] 14 28 37 74
(43,49] 8 16 45 90
(49,55] 4 8 49 98
(55,61] 1 2 50 100
> LimSup=c(25,31,37,43,49,55,61)
> LimInf=c(19,25,31,37,43,49,55)
> Marca=(LimSup+LimInf)/2
> Marca
[1] 22 28 34 40 46 52 58
> cbind(f,Marca,h,F,H)
f Marca h F H
(19,25] 3 22 6 3 6
(25,31] 4 28 8 7 14
(31,37] 16 34 32 23 46
(37,43] 14 40 28 37 74
(43,49] 8 46 16 45 90
(49,55] 4 52 8 49 98
(55,61] 1 58 2 50 100
> X=Marca*f
> X
intervalos
(19,25] (25,31] (31,37] (37,43] (43,49] (49,55] (55,61]
66 112 544 560 368 208 58
> Media=sum(X)/n
> Media
[1] 38.32
> cbind(f,h,F,H,Marca,X)
f h F H Marca X
(19,25] 3 6 3 6 22 66
(25,31] 4 8 7 14 28 112
(31,37] 16 32 23 46 34 544
(37,43] 14 28 37 74 40 560
(43,49] 8 16 45 90 46 368
(49,55] 4 8 49 98 52 208
(55,61] 1 2 50 100 58 58

> hist(datos, col = "green", border = 1, main = "Edad Microempresarios", xlab = "Edad" , ylab =
"frecuencia")
> plot(LimInf, F)
> lines(c(min(LimInf), LimInf,max(LimSup)),c(0,F,0),type="l")

SOLUCIÓN COMPENDIO EJERCICIO 6

>datos=c(200,190,150,148,152,158,100,174,187,188,160,178,153,151,128,137,174,199,103,168,188,127,150,130,175)
> datos
[1] 200 190 150 148 152 158 100 174 187 188 160 178 153 151 128 137 174 199 103
[20] 168 188 127 150 130 175
> Rango=max(datos)-min(datos)
> Rango
[1] 100
> min(datos)
[1] 100
> max(datos)
[1] 200
> m=round(1+3.3*log10(25))
> m
[1] 6
> C=Rango/m
> C
[1] 16.66667
> C=17
> intervalos=cut(datos, breaks=c(99,116,133,150,167,184,201))
> intervalos
[1] (184,201] (184,201] (133,150] (133,150] (150,167] (150,167] (99,116]
[8] (167,184] (184,201] (184,201] (150,167] (167,184] (150,167] (150,167]
[15] (116,133] (133,150] (167,184] (184,201] (99,116] (167,184] (184,201]
[22] (116,133] (133,150] (116,133] (167,184]
Levels: (99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
> f=table(intervalos)
> f
intervalos
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
2 3 4 5 5 6
> n=sum(f)
> n
[1] 25
> h=(f/n)*100
> h
intervalos
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
8 12 16 20 20 24
> F=cumsum(f)
> F
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
2 5 9 14 19 25
> H=cumsum(h)
> H
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
8 20 36 56 76 100
> cbind(f,h,F,H)
f h F H
(99,116] 2 8 2 8
(116,133] 3 12 5 20
(133,150] 4 16 9 36
(150,167] 5 20 14 56
(167,184] 5 20 19 76
(184,201] 6 24 25 100
> LimSup=c(116,133,150,167,184,201)
> LimInf=c(99,116,133,150,167,184)
> Marca=(LimSup+LimInf)/2
> Marca
[1] 107.5 124.5 141.5 158.5 175.5 192.5
> cbind(f,Marca,h,F,H)
F Marca h F H
(99,116] 2 107.5 8 2 8
(116,133] 3 124.5 12 5 20
(133,150] 4 141.5 16 9 36
(150,167] 5 158.5 20 14 56
(167,184] 5 175.5 20 19 76
(184,201] 6 192.5 24 25 100
> x=Marca*f
> x
intervalos
(99,116] (116,133] (133,150] (150,167] (167,184] (184,201]
215.0 373.5 566.0 792.5 877.5 1155.0
> Media=sum(x)/n
> Media
[1] 159.18
> hist(datos, col = "green", border = 1, main = "Ahorros Voluntarios", xlab = "Ahorro" , ylab = "frecuencia")
> plot(LimInf, F) lines(c(min(LimInf), LimInf,max(LimSup)),c(0,F,0),type="l




ALGUNOS TERMNINOS UTILIZADOS

MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMÉTICA:

El principal resumen que se puede hacer de una colección de datos es el promedio al que llamaremos media aritmética. Su cálculo  se basa en la magnitud de los datos

Aunque es una medida de cálculo sencillo la información brindada por el número  por si sola no es del todo confiable, dice poco de la distribución de los datos. Por ejemplo si decimos que el rendimiento académico de un grupo es de 2 y lo clasificamos como insuficiente, individualmente existirán estudiantes que superaron el logro y la valoración de 2. Así como existen estudiantes por debajo de esta valoración.  La media aritmética es un resumen muy bueno, pero no da los detalles. El cálculo de la media aritmética depende de la forma como este dada la distribución de los datos, por eso el cálculo se lo hace de dos formas diferentes:

1. MEDIA PARA DATOS NO AGRUPADOS:

Se calcula sumando todos los datos y dividiendo por el número total de ellos.

Sean  X1, X2, X3,…Xdatos no agrupados de una distribución numérica.

Si los datos enteros son pocos y se pueden ordenar en una tabla de frecuencias absolutas .


MEDIA PARA DATOS AGRUPADOS:

Hace referencia a la media calculada para los datos organizados en una distribución de frecuencias, que por lo general corresponden a datos de tipo continuo, y en una cantidad que exceden a 20 datos. Para el cálculo de la media para datos agrupados definamos primero que es una marca de clase

 

MARCAS DE CLASE:


Es el punto medio de cada intervalo de clase, la denotaremos como Xi ..

Sea [a   b] los datos en el intervalo de clase, entonces la marca de clase se define como:




SUBMUESTRAS:

Si se quiere dividir la muestra total de una población en varias submuestras y se hace necesario el cálculo total de la media




Donde
n = n1 + n2 + ...+ nn



PROPIEDADES DE LA MEDIA ARITMÉTICA:

1. La media es única
2. El cálculo de la media es sencillo y de fácil comprensión
3. Cuando existen datos extremos suficientemente distantes de la mayoría de los datos la media no es una medida muy confiable.

MEDIANA:

Determina la posición central que ocupa un dato en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella.

MEDIANA PARA DATOS NO AGRUPADOS:


Si los datos no están agrupados y la distribución de datos es impar, entonces la mediana es el dato central.
Si el número de datos es impar, el dato central de la distribución organizada en forma ascendente o descendente es la mediana.

X1, X2, X3, X4, ... , Xn  n Impar
                   Me= Xi , donde Xi  representa el dato central

Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.
 X1, X2, X3, X4, ... , Xn  n par
                   Me= , donde Xi, X representan Los datos centrales

MEDIANA PARA DATOS AGRUPADOS:






Dónde:

Li = Limite real inferior a la clase mediana
n = Es el tamaño de la muestra o población
Fa = Frecuencia acumulada anterior a la clase mediana.
C = Ancho del intervalo
f= Frecuencia observada en la clase mediana

 

CLASE MEDIANA:


Se entiende por clase mediana al primer intervalo de clase que contiene en las frecuencias acumuladas el valor de n /2, siempre que el número de intervalos sea par, de lo contrario la clase mediana es el intervalo central.


LOS CUANTILES:

Son medidas derivadas de la mediana, e intentan medir en valores de proporción más pequeña que la mediana misma  a una muestra. Los cuantiles se dividen en:

1. Cuartiles
2. Deciles
3. Percentiles
4. Quintiles

CUARTILES:

Los cuartiles son valores posiciónales. Son  medidas de tendencia central que  dividen la distribución de datos en cuatro partes iguales. Muestra la importancia de la cuarta parte de la muestra analizada. Se simboliza con Q.

El primer cuartil deja el 25% de la información por debajo de él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la información en dos partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por encima.

Gráficamente:

0%           25%             50%          75%
 



Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente determinada.
 

CUARTIL 1: Q1

Representa el 25% de la muestra tomada. Por encima de este valor esta el 75% de los valores de una distribución.


CUARTIL 2: Q2

Se obtiene cuando K = 2; representa el 50% de la muestra tomada. Por encima de este valor esta el 50% de los valores de una distribución.

 
 
CUARTIL 3: Q3

Se obtiene cuando K = 3; representa el 75% de la muestra tomada. Por debajo de este valor esta el 25% de los valores de una distribución.



 
DECILES:

Se definen como la  medida de tendencia central que  divide la distribución de datos en diez partes iguales. Muestra la importancia de la décima parte de la muestra analizada. Se simboliza con D.



PERCENTILES:

Se definen como la  medida de tendencia central que  divide la distribución de datos en cien partes iguales. Muestra la importancia de la centésima  parte de la muestra analizada. Se simboliza con P.








TALLER EN CLASE










MAPA MENTAL

                                                                           MAPA MEDIDAS DE TENDENCIA CENTRAL

lunes, 6 de octubre de 2014

martes, 2 de septiembre de 2014

SOLUCION COMPENDIO 2

COMPENDIO DOS
ORGANIZANDO LAS TABLAS EN R PARA DATOS NO AGRUPADOS

Comandos en R

Resultado

Construimos la tabla de frecuencias absolutas
datos=read.table("logros.txt")
attach(datos)
      datos
f=table(datos)
f




A D E I S
5 4 3 3 5
Ahora se ordena los datos


A S D E I
5 5 4 3 3
Suma de frecuencias absolutas
n=sum(f)
n

[1] 20
Frecuencias relativas
h=(f/n)*100
h

A  S  D  E  I
25 25 20 15 15
Frecuencias Absolutas Acumuladas
F=cumsum(f)
F

A  S  D  E  I
5 10 14 17 20

Frecuencias Relativas Acumuladas
H=cumsum(h)
H


A   S   D   E   I
25  50  70  85 100
Tabla de frecuencias
cbind(f,h,F,H)
   f  h   F   H
A  5  25  5   25
S  5  25  10  50
D  4  20  14  70
E  3  15  17  85
I  3  15  20  100

El comando table, permite obtener inicialmente la tabla de frecuencias absolutas

EJERCICIOS DE APLICACIÓN:

1. En un estudio relacionado con el turismo en el Meta se realizó la siguiente pregunta
Cuál es el principal motivo por el cual usted visita al departamento del Meta?
Las opciones se clasifican así:


Se aplicó  la pregunta a 100 turistas y se obtuvieron los siguientes resultados
1
4
4
2
5
3
3
2
4
5
1
6
2
3
2
6
1
1
6
3
4
2
6
2
1
6
3
2
3
6
2
1
3
4
1
3
6
2
1
3
6
2
3
6
3
4
3
6
3
5
3
3
4
5
6
3
5
3
3
4
5
5
3
5
3
4
4
5
5
6
1
3
4
4
4
4
1
3
1
4
4
4
1
2
1
5
4
3
1
2
1
5
3
2
4
2
5
5
3
2

Elabore en R una tabla de frecuencias para la información obtenida.

1.    En una encuesta aplicada a microempresarios de la ciudad de Villavicencio se desea indagar sobre su formación de acuerdo a la siguiente información:

La encuesta se aplicó a 150 microempresarios y los resultados fueron los siguientes
4
3
2
4
4
2
2
4
2
4
4
4
3
2
4
3
2
4
3
4
2
3
4
4
4
2
1
3
3
3
2
4
2
3
4
3
4
3
4
4
2
4
4
4
4
4
3
3
3
4
3
3
3
4
4
4
4
2
3
3
4
3
3
3
4
3
5
4
4
4
4
2
3
4
4
4
3
3
3
3
2
2
3
4
4
4
3
4
2
4
1
3
3
4
3
4
5
4
3
4
4
4
4
4
3
4
3
3
4
4
4
3
3
3
4
4
4
4
2
3
4
5
2
4
4
3
4
3
4
4
4
3
2
3
2
4
4
2
4
4
4
4
4
4
2
4
3
4
3
3
Elabore en R una tabla de frecuencias para los datos encontrados
GRAFICOS EN R PARA DATOS ENTEROS (NO AGRUPADOS)

Comandos en R

Gráficos

Grafico para frecuencias absolutas ( Diagrama de barras verticales)

barplot(f,col=c(2,3,4,5,6),names.arg=c(" "),main="DIAGRAMA DE BARRAS", ylab="Frecuencia absoluta",xlab=" ")
legend(4,5,c("A","S","D","E","I"), fill = c(2,3,4,5,6))


Las barras también pueden tener el siguiente aspecto.
barplot(f,space=5,col="blue",
ylim=c(0,6),ylab="f",main="Gráfico de Líneas: Valoraciones")
      abline(h=0)

Grafico para frecuencias relativas, Grafico circular o grafico de tortas.
pie(h,col=c(2,3,4,5,6),main="GRAFICO CIRCULAR")



Grafico para frecuencias acumuladas
plot.ecdf(H,main="distribución acumulada")

SOLUCION COMPENDIO 3

EJERCICIOS DE APLICACIÓN


1. Solicite la estatura de 25 de sus compañeros de clase y determine para los datos obtenidos

a.    Una distribución de frecuencias

b.    Gráficos en R correspondientes a: Histogramas, Polígonos y ojivas.

 



2. Realice interpretación del siguiente gráfico






3. En el hospital regional de la ciudad se recogió la siguiente información, de la población allí recepcionada.
Deficiencia de Insulina                                  8 casos
Deficiencias enzimáticas                                12 casos
Deficiencias en el crecimiento óseo                 20 casos
Parálisis muscular y nerviosa                          15 casos
Escorbuto                                                    18 casos
Raquitismo                                                  30 casos
Realizar una representación gráfica usando los gráficos más apropiados para representar la información.





SOLUCION MEDIANTE GRAFICO DE BARRAS




4. En una encuesta realizada por un grupo de estudiantes sobre el tipo de cultivo más representativo en la región, se obtuvieron los siguientes datos.



Determine una gráfica apropiada, para representar la información, suministrada.


II. Las siguientes preguntas corresponden a modelos de preguntas que realiza el Instituto Colombiano para el fomento de la educación superior ICFES,  en sus pruebas a bachilleres que desean ingresar a la educación superior

1. Una firma de producción múltiple tiene 4 líneas de productos durante el mes de octubre del 2003 los resultados obtenidos al hacer la operación de control de calidad fueron:



El promedio porcentual de artículos defectuosos en el mes de octubre es de
A. 263.5       B. 264.5      C. 265.5       D. 266.5      E. 267.5



Se calcula la frecuencia de todos los productos se totalizan y luego se divide por el número de productos y el resultado se divide en 100

2. Se realiza un censo a un grupo de familia de una comunidad educativa para determinar el número de hijos que habita en cada hogar. El porcentaje de hijos por familia está representado por las siguiente grafica




3. En la Cafetería de la universidad se ha creado con estudiantes y profesores una cooperativa para atender en los descansos a los demás estudiantes, para tal caso fabrican chocolates en una cantidad apreciada por ser el producto de mayor venta. La   siguiente grafica se muestra las ventas reales de enero a julio de chocolates. 
3. En la Cafetería de la universidad se ha creado con estudiantes y profesores una cooperativa para atender en los descansos a los demás estudiantes, para tal caso fabrican chocolates en una cantidad apreciada por ser el producto de mayor venta. La   siguiente grafica se muestra las ventas reales de enero a julio de chocolates.

A. La grafica corresponde a un polígono de frecuencias ya que se unió los puntos medios de un intervalo de clase.


B. Las ventas crecieron entre Abril y Mayo
C. La grafica no brinda suficiente información sobre el comportamiento de las ventas durante los meses de enero a junio
D. Las peores ventas estuvieron entre marzo y abril
E. Entre enero y febrero se vendió lo mismo que entre los meses de mayo y junio.

4. La grafica de tortas corresponde a 50 estudiantes de una universidad, cuantos estudiantes tienen notas por debajo de 3.


A. 20
B. 10
C. 25
D. 30
E. 15




5. Varios profesores de una  fueron consultados sobres sus prácticas deportivas. Cada profesor marco con una X sus deportes preferidos. Según la tabla, cuantos profesores practican fútbol, Atletismo pero no Coleo? P1, P2, P3, P4, P5; Son los profesores.




7. La siguiente gráfica muestra el porcentaje de ventas de lámparas  respecto a la capacidad máxima de producción de una microempresa durante los doce meses del año., los que aparecen numerados así: 1 es el mes de enero, el 2 es febrero y así sucesivamente



De acuerdo con la información contenida en la gráfica, se puede afirmar todo lo siguiente, excepto:
  1. Hay mayores ventas entre junio y  agosto que entre septiembre y octubre
  2. Las ventas en los meses de julio y octubre fueron las mismas
  3. Entre agosto y octubre no se vendieron lámparas
  4. Entre el mes de abril y agosto las ventas de lamparas aumentaron aproximadamente en un 55%.
8. De acuerdo a la tabla el número de familia con un número de hijos, se puede afirmar que el porcentaje de familias que tiene un solo hijo es de:
A.   20.5%
B.   12.5%
C.   1 Familia
D.   25 familias
E.    28.9%



9. Una encuesta de 1990 a 1,000 adultos y a 500 adolescentes estudió la pregunta: ¿Cuál es el problema principal de los colombianos? Los resultados fueron como sigue:

A. Entre las dos generaciones de edad el mayor problema observado es la drogadicción.
B. La pobreza y el SIDA en los adultos y adolescentes tiene poca significancia
C. El promedio de adultos que opinaron sobre la guerra sobrepasa al promedio de los adolescentes.
D. El problema de la drogas, en los adultos y adolescentes no sobrepasa al cuartel de la población total.
E. EL Déficit presupuestal es lo que menos les importa a los Colombianos.

 

  


10. Varios profesores de un colegio fueron consultados sobres sus prácticas deportivas. Cada profesor marco con una X sus deportes preferidos. Según la tabla, cuantos profesores practican fútbol, Atletismo pero no Coleo? P1, P2, P3, P4, P5; Son los profesores.


11. El siguiente diagrama de barras Representa las notas de los resultados de un examen de estadística



12EL consejo de administración de una cooperativa de vivienda desea investigar la posibilidad de contratar un supervisor para el parque de juegos infantiles. Se hizo una encuesta en la totalidad de las 616 familias de la cooperativa y cada familia tuvo un solo voto, cualquiera que fuera el tamaño del apartamento los resultado fueron.

La grafica que corresponde correctamente a la distribución es: c


13. Los empleados de la fábrica, xyz, entraron en protesta debido a los bajos salarios (En miles de pesos) Devengados, se basaron en un estudio estadístico realizado por uno de los trabajadores que estudia Administración de empresas en la universidad, el cual justifico su teoría mediante la gráfica de abajo.

De esta información se puede aceptar que:
1. Los mayores salarios recibidos están únicamente entre $200.000 y $300.000
2. Los mayores salarios recibidos están entre [$200.000, $300.000] y entre [$500.000, $600.000]
3. El 45.4% ganan salarios inferiores a $400.000
4.  10 empleados ganan $200.000 y $500.000



  

14. Una de las siguientes gráficas corresponde a la distribución dada en la gráfica: