Skip to content

Commit 6cbdbe2

Browse files
committed
differences for PR #42
1 parent c44b716 commit 6cbdbe2

15 files changed

+119
-14
lines changed

Visualizacion.md

Lines changed: 118 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -274,6 +274,81 @@ covid19_resumen <- covid19 %>%
274274
the `.groups` argument.
275275
```
276276

277+
Notemos que el mensaje de salida nos notifica que
278+
luego de usar `summarise()` se ha removido
279+
una variable del agrupamiento previamente configudado por `group_by()`.
280+
Esto es porque la segunda variable ("sexo") es ahora una sola fila
281+
dentro de la variable de agrupamiento ("fecha_reporte_web").
282+
Veamos el resultado de la operación anterior:
283+
284+
285+
``` r
286+
covid19_resumen
287+
```
288+
289+
``` output
290+
# A tibble: 1,539 × 3
291+
# Groups: fecha_reporte_web [782]
292+
fecha_reporte_web sexo casos
293+
<date> <fct> <int>
294+
1 2020-03-14 masculino 1
295+
2 2020-03-17 masculino 1
296+
3 2020-03-19 masculino 1
297+
4 2020-03-20 masculino 1
298+
5 2020-03-23 femenino 1
299+
6 2020-03-24 masculino 2
300+
7 2020-03-26 masculino 1
301+
8 2020-03-28 masculino 1
302+
9 2020-03-29 femenino 4
303+
10 2020-03-30 masculino 1
304+
# ℹ 1,529 more rows
305+
```
306+
307+
También podemos verificar el motivo del mensaje usando la función `dplyr::group_vars()`.
308+
309+
::::::::: spoiler
310+
311+
Exploremos el paso a paso usando la función `dplyr::group_vars()`:
312+
313+
314+
``` r
315+
# Agrupar por "fecha" y "sexo"
316+
# Con dplyr::group_vars() confirmamos agrupamiento
317+
covid19 %>%
318+
dplyr::group_by(fecha_reporte_web, sexo) %>%
319+
dplyr::group_vars()
320+
```
321+
322+
``` output
323+
[1] "fecha_reporte_web" "sexo"
324+
```
325+
326+
``` r
327+
# Resuminos por "fecha" y "sexo"
328+
# Con dplyr::group_vars() confirmamos que
329+
# luego de usar dplyr::summarise()
330+
# removemos la última variable de agrupamiento ("sexo")
331+
# debido a que ese grupo es ahora una sola fila por cada "fecha".
332+
covid19 %>%
333+
dplyr::group_by(fecha_reporte_web, sexo) %>%
334+
dplyr::summarise(casos = n()) %>%
335+
dplyr::group_vars()
336+
```
337+
338+
``` output
339+
`summarise()` has grouped output by 'fecha_reporte_web'. You can override using
340+
the `.groups` argument.
341+
```
342+
343+
``` output
344+
[1] "fecha_reporte_web"
345+
```
346+
347+
Este es el resultado por defecto.
348+
Puedes ver las opciones disponibles usando el [argumento `.groups` dentro de la función `summarise()`](https://dplyr.tidyverse.org/reference/summarise.html#arg--groups).
349+
350+
:::::::::
351+
277352
Luego, podemos usar la estética de los gráficos de `ggplot2` indicando
278353
las variables a usar en cada dimensión, en este caso en el eje X
279354
tendremos la variable de tiempo (fecha_reporte_web) y en el eje Y el
@@ -290,7 +365,7 @@ ggplot(data = covid19_resumen,
290365

291366
La visualización que generamos es la siguiente:
292367

293-
<img src="fig/Visualizacion-rendered-unnamed-chunk-7-1.png" style="display: block; margin: auto;" />
368+
<img src="fig/Visualizacion-rendered-unnamed-chunk-9-1.png" style="display: block; margin: auto;" />
294369

295370
### Geometría (Geometry)
296371

@@ -334,7 +409,7 @@ ggplot(data = covid19_fecha,
334409

335410
Y obtenemos el siguiente gráfico:
336411

337-
<img src="fig/Visualizacion-rendered-unnamed-chunk-10-1.png" style="display: block; margin: auto;" />
412+
<img src="fig/Visualizacion-rendered-unnamed-chunk-12-1.png" style="display: block; margin: auto;" />
338413

339414
#### Ejemplo 3: Gráfico de barras
340415

@@ -348,7 +423,7 @@ ggplot(data = covid19) +
348423
geom_bar(aes(x = sexo))
349424
```
350425

351-
<img src="fig/Visualizacion-rendered-unnamed-chunk-11-1.png" style="display: block; margin: auto;" />
426+
<img src="fig/Visualizacion-rendered-unnamed-chunk-13-1.png" style="display: block; margin: auto;" />
352427

353428
En este ejemplo podemos observar que `ggplot2` automáticamente calcula
354429
el eje Y.
@@ -377,7 +452,7 @@ ggplot(data = covid19_ubicacion, aes(x = ubicacion_del_caso, y = casos)) +
377452

378453
Se obtendrá la siguiente gráfica:
379454

380-
<img src="fig/Visualizacion-rendered-unnamed-chunk-14-1.png" style="display: block; margin: auto;" />
455+
<img src="fig/Visualizacion-rendered-unnamed-chunk-16-1.png" style="display: block; margin: auto;" />
381456

382457
En este caso tenemos las barras en orientación vertical. Si desearamos
383458
poner las barras en orientación horizontal podemos lograrlo, usando al
@@ -392,7 +467,7 @@ ggplot(data = covid19_ubicacion, aes(x = ubicacion_del_caso, y = casos)) +
392467

393468
Obteniendo como resultado:
394469

395-
<img src="fig/Visualizacion-rendered-unnamed-chunk-16-1.png" style="display: block; margin: auto;" />
470+
<img src="fig/Visualizacion-rendered-unnamed-chunk-18-1.png" style="display: block; margin: auto;" />
396471

397472
Si queremos ordenar la ubicación del caso por el número de casos,
398473
podemos utilizar el comando `reorder` en el eje donde está la ubicación
@@ -412,7 +487,7 @@ ggplot(covid19_ubicacion,
412487

413488
Y la gráfica queda así:
414489

415-
<img src="fig/Visualizacion-rendered-unnamed-chunk-18-1.png" style="display: block; margin: auto;" />
490+
<img src="fig/Visualizacion-rendered-unnamed-chunk-20-1.png" style="display: block; margin: auto;" />
416491

417492
::: challenge
418493
Pregunta ¿cómo produciría esta misma gráfica, pero en orden ascendente?
@@ -510,7 +585,7 @@ ggplot(covid19_ubicacion,
510585

511586
De esta manera, el nuevo gráfico se vería así:
512587

513-
<img src="fig/Visualizacion-rendered-unnamed-chunk-20-1.png" style="display: block; margin: auto;" />
588+
<img src="fig/Visualizacion-rendered-unnamed-chunk-22-1.png" style="display: block; margin: auto;" />
514589

515590
::: discussion
516591
¿Qué diferencias ve con la última gráfica del Ejemplo 4.?
@@ -543,6 +618,36 @@ covid19_sexo <- covid19 %>%
543618
`.groups` argument.
544619
```
545620

621+
Notemos nuevamente que el mensaje de salida nos notifica que
622+
luego de usar `summarise()` se ha removido la última
623+
variable del agrupamiento previamente configudado por `group_by()`.
624+
Esto es porque la segunda variable ("sexo") es ahora una sola fila
625+
dentro de la variable de agrupamiento ("edad").
626+
Veamos el resultado de la operación anterior:
627+
628+
629+
``` r
630+
covid19_sexo
631+
```
632+
633+
``` output
634+
# A tibble: 209 × 3
635+
# Groups: edad [106]
636+
edad sexo casos
637+
<dbl> <fct> <int>
638+
1 1 masculino 245
639+
2 1 femenino 218
640+
3 2 masculino 199
641+
4 2 femenino 165
642+
5 3 masculino 185
643+
6 3 femenino 168
644+
7 4 masculino 175
645+
8 4 femenino 136
646+
9 5 masculino 203
647+
10 5 femenino 144
648+
# ℹ 199 more rows
649+
```
650+
546651
Usando los datos de `covid-19`, vamos a representar la variable `casos`
547652
por `edad` en dos paneles por `sexo` usando `facet_wrap` así:
548653

@@ -553,7 +658,7 @@ ggplot(data = covid19_sexo, aes(x = edad, y = casos)) +
553658
facet_wrap(~sexo)
554659
```
555660

556-
<img src="fig/Visualizacion-rendered-unnamed-chunk-22-1.png" style="display: block; margin: auto;" />
661+
<img src="fig/Visualizacion-rendered-unnamed-chunk-25-1.png" style="display: block; margin: auto;" />
557662

558663
::: challenge
559664
De acuerdo con lo aprendido anteriormente, piense cómo podría hacer que
@@ -562,7 +667,7 @@ variable `sexo` ¿cómo cambiaría el código?
562667

563668
El gráfico que debe producir es el siguiente:
564669

565-
<img src="fig/Visualizacion-rendered-unnamed-chunk-23-1.png" style="display: block; margin: auto;" />
670+
<img src="fig/Visualizacion-rendered-unnamed-chunk-26-1.png" style="display: block; margin: auto;" />
566671

567672
::: solution
568673

@@ -584,7 +689,7 @@ ggplot(covid19_sexo, aes(edad, casos)) +
584689
facet_wrap(~sexo)
585690
```
586691

587-
<img src="fig/Visualizacion-rendered-unnamed-chunk-25-1.png" style="display: block; margin: auto;" />
692+
<img src="fig/Visualizacion-rendered-unnamed-chunk-28-1.png" style="display: block; margin: auto;" />
588693

589694
### Tema
590695

@@ -618,7 +723,7 @@ ggplot(data = covid19_sexo, aes(x = edad, y = casos)) +
618723
theme_classic()
619724
```
620725

621-
<img src="fig/Visualizacion-rendered-unnamed-chunk-26-1.png" style="display: block; margin: auto;" />
726+
<img src="fig/Visualizacion-rendered-unnamed-chunk-29-1.png" style="display: block; margin: auto;" />
622727

623728
#### Ejemplo 7. Usando theme classic
624729

@@ -632,7 +737,7 @@ ggplot(data = covid19_sexo, aes(x = edad, y = casos)) +
632737
theme_dark()
633738
```
634739

635-
<img src="fig/Visualizacion-rendered-unnamed-chunk-27-1.png" style="display: block; margin: auto;" />
740+
<img src="fig/Visualizacion-rendered-unnamed-chunk-30-1.png" style="display: block; margin: auto;" />
636741

637742
::: callout
638743
Para revisar la lista de `theme()` que tiene disponible `ggplot2`, puede
@@ -661,7 +766,7 @@ ggplot(data = covid19_sexo,
661766
)
662767
```
663768

664-
<img src="fig/Visualizacion-rendered-unnamed-chunk-28-1.png" style="display: block; margin: auto;" />
769+
<img src="fig/Visualizacion-rendered-unnamed-chunk-31-1.png" style="display: block; margin: auto;" />
665770

666771
::: keypoints
667772

26.2 KB
Loading
4.3 KB
Loading
128 Bytes
Loading
-467 Bytes
Loading
-493 Bytes
Loading
-5.58 KB
Loading
-12.2 KB
Loading
14.3 KB
Loading
-4.74 KB
Loading

0 commit comments

Comments
 (0)