Armando un proyecto de trabajo

class: center, middle, inverse, title-slide

# Armando un proyecto de trabajo
## R + Ciencias Sociales

---

# Hoja de ruta

## ✔️ Paquetes

## ✔️ Lectura / escritura de archivos

## ✔️ Proyectos

---
class: inverse, middle, center

# Paquetes

---
# Paquetes

### Con R podemos aumentar las funciones para realizar operaciones a través de los **paquetes**.

---
# Paquetes

.pull-left[

### Para poder usar un paquete, primero debemos __instalarlo__:

```r

`install.packages("nombre_del_paquete")`

```

]

.pull-right[

### Cada vez que queremos utilizar una función del paquete, debemos __convocarlo__:

```r

`library(nombre_del_paquete)`

```
    
]

---
class: inverse, middle, center

# Lectura / importación de datos

***

---
# Lectura / importación de datos

## R base tiene una función para cada extensión de archivo:

- `read.table()` --> _.txt_

- `read.csv()` --> _.csv_

- `readRDS()` --> _.rds_

---
# Lectura / importación de datos

## Pero... ¿no están todas, no?

### Para ello, instalaremos algunos paquetes que nos permiten incorporar más funciones para leer más tipos de datos.

Por ejemplo, el paquete `haven` incorpora:

- `read_sas()` --> _.sas (SAS)_

- `read_spss()` --> _.sav (SPSS)_

- `read_stata()` --> _.dta (STATA)_

y el paquete `readxl`:

- `read_xlsx()` --> _.xlsx (Excel)_

---
# Lectura / importación de datos

### Supongamos que descargo la base de datos de registros de certificados [CUIDAR-VERANO](http://datos.yvera.gob.ar/dataset/certificado-unico-habilitante-para-circulacion-cuhc---verano) en formato separado por comas (_.csv_) y la quiero importar con R.

### la función que me permite importar una base de datos de tipo _.csv_ se llama `read.csv()`:

```r
base_cuidar <- read.csv(
  file = "C:/Users/pablo/Desktop/proyecto_cuidar/entradas/certificados-personas-por-fecha-ingreso.csv",
  header = TRUE, 
  sep = ",", 
  dec = ".")

```

---
# Lectura / importación de datos

- A tener en cuenta respecto a la ruta donde se ubica el archivo:

```r
base_cuidar <- read.csv(
  'file = "C:/Users/pablo/Desktop/proyecto_cuidar/entradas/certificados-personas-por-fecha-ingreso.csv",'
  header = TRUE, 
  sep = ",", 
  dec = ".")
```

- Si se la compartimos a otra persona, __se rompe__
    
- Si cambiamos de computadora, __se rompe__
    
- Si lo cambiamos de lugar, __se rompe__
   
---
class: inverse, center, middle

---
class: inverse, center, middle

---
# Proyectos y rutas de trabajo

.pull-left[

#### Paso 1:

]

.pull-right[

#### Paso 2:

]

---
# Proyectos y rutas de trabajo

.pull-left[

#### Paso 3:

]

.pull-right[

#### Resultado:

]

---
# Proyectos y rutas de trabajo

### Armando un proyecto con Rstudio, la función se escribiría de esta forma:

```r
base_cuidar <- read.csv(
  'file = "entradas/certificados-personas-por-fecha-ingreso.csv",'
  header = TRUE, 
  sep = ",", 
  dec = ".")
```

### Ventajas:

- Le indicamos a R dónde "vive" nuestra carpeta de trabajo

- La ruta ya no contiene ninguna referencia personal que impida ser abierto en otra computadora

---
class: inverse, middle, center

---
# Proyectos y rutas de trabajo

### Supongamos que queremos comenzar un nuevo proyecto para analizar el conjunto de certificados solicitados para vacacionar durante la temporada verano del año 2021

#### El flujo de trabajo sería el siguiente:

1) Armo la carpeta del proyecto, por ejemplo con la estructura siguiente:

- 📂 cuidar

- 📂 entradas
    
    - 📂 salidas
    
    - 📂 scripts
    
    - 📂 docs_metodologicos
        
---
# Lectura / escritura de datos

2) Ubico la base de datos en la carpeta correspondiente (__entradas__):

- 📂 cuidar

- 📂 entradas
    
         - 📄 certificados-personas-por-fecha-ingreso.csv
    
    - 📂 salidas
    
    - 📂 scripts
    
    - 📂 docs_metodologicos

---
# Lectura / escritura de datos

3) Abro Rstudio y creo un proyecto, ubicado en la carpeta principal (__cuidar__)

- 📂 cuidar
   
     -  <img src = "data:image/png;base64,#../img/Rproject.png" style="height: 35px; width:35px;"/>  _proyecto_cuidar.Rproj_
  
     - 📂 entradas
     
         - 📄 _certificados-personas-por-fecha-ingreso.csv_
     
     - 📂 salidas
     
     - 📂 scripts
     
     - 📂 docs_metodologicos

---
# Lectura / escritura de datos

4) Creo un script llamado _levantar_datos.R_ para trabajar en R y lo guardo en la carpeta __script__

- 📂 cuidar
    
    -  <img src = "data:image/png;base64,#../img/Rproject.png" style="height: 35px; width:35px;"/>  _proyecto_cuidar.Rproj_
  
    - 📂 entradas
  
        - 📄 _certificados-personas-por-fecha-ingreso.csv_
  
    - 📂 salidas
    
    - 📂 scripts
    
        - 📄 _1_levantar_datos.R_
    
    - 📂 docs_metodologicos

---
# Lectura / escritura de datos

5) En el script, cargo los paquetes cuyas funciones voy a utilizar. En este caso, voy a probar el paquete `readr` para poder importar bases de datos de una extensión _.csv (archivo separado por comas)_:

```r
library(readr)
```

6) Creo un objeto en el cual voy a importar la base de datos y utilizo la función `read_csv()` para hacerlo.

__Recordar:__ _Estamos en un proyecto, por lo que la ruta es a partir de la carpeta en la que se encuentra el mismo_

```r
base_cuidar <- read_csv(file = "entradas/certificados-personas-por-fecha-ingreso.csv")
```

---
# Funciones para una primera mirada a la base de datos:

---
class: inverse, middle, center

# PRÁCTICA

---
class: inverse, middle

# Práctica

1. Crear una carpeta donde alojar el proyecto de trabajo

1. Crear la estructura de carpetas propuesta

1. En la carpeta __entradas__ incorporar una base de datos, preferentemente que usemos cotidianamente (no importa el formato)

1. Crear un script de trabajo y alojarlo en la carpeta __scripts__

1. Importar la base de datos y aplicar alguna de las funciones descritas previamente