R - Tema 7: Trabajo con Datos Reales

R - de Cero a Profesional

Trabajo con Datos Reales

Importación de datos desde diferentes fuentes

En R, la importación de datos es un paso crucial para el análisis de datos. Puedes importar datos desde diversas fuentes, como archivos CSV, Excel, bases de datos SQL y APIs web. R proporciona varias funciones y paquetes que facilitan esta tarea, permitiéndote trabajar con diferentes formatos y fuentes de datos de manera eficiente.

Código:

				
					# Cargar paquetes necesarios
library(readr)    # Para leer archivos CSV
library(readxl)   # Para leer archivos Excel
library(DBI)      # Para conectarse a bases de datos SQL
library(RSQLite)  # Para usar SQLite

# Importación desde un archivo CSV
datos_csv <- read_csv("ruta/al/archivo.csv")

# Importación desde un archivo Excel
datos_excel <- read_excel("ruta/al/archivo.xlsx", sheet = "Hoja1")

# Conexión a una base de datos SQLite
con <- dbConnect(RSQLite::SQLite(), dbname = "ruta/a/la/base_de_datos.sqlite")

# Importación de datos desde una base de datos SQL
datos_sql <- dbGetQuery(con, "SELECT * FROM tabla")

# Cerrar la conexión a la base de datos
dbDisconnect(con)

# Ejemplo de importación de datos desde una API web
library(jsonlite)  # Para manejar JSON

url <- "https://api.ejemplo.com/datos"
datos_api <- fromJSON(url)

Explicación del código:

Importación desde un archivo CSV:
- Utiliza la función read_csv del paquete readr para leer archivos CSV. Por ejemplo, datos_csv <- read_csv("ruta/al/archivo.csv") importa los datos desde el archivo especificado y los almacena en el data frame datos_csv.
Importación desde un archivo Excel:
- Utiliza la función read_excel del paquete readxl para leer archivos Excel. Por ejemplo, datos_excel <- read_excel("ruta/al/archivo.xlsx", sheet = "Hoja1") importa los datos desde la hoja especificada del archivo Excel y los almacena en el data frame datos_excel.
Conexión a una base de datos SQLite:
- Utiliza el paquete DBI para conectarse a bases de datos SQL. Por ejemplo, con <- dbConnect(RSQLite::SQLite(), dbname = "ruta/a/la/base_de_datos.sqlite") establece una conexión a una base de datos SQLite.
- Utiliza dbGetQuery para ejecutar una consulta SQL y obtener los datos. Por ejemplo, datos_sql <- dbGetQuery(con, "SELECT * FROM tabla") ejecuta la consulta y almacena los datos en el data frame datos_sql.
- Cierra la conexión a la base de datos con dbDisconnect(con).
Importación de datos desde una API web:
- Utiliza el paquete jsonlite para manejar datos en formato JSON. Por ejemplo, datos_api <- fromJSON("https://api.ejemplo.com/datos") descarga los datos desde la URL especificada y los convierte en un data frame datos_api.

Limpieza y preparación de datos para análisis

La limpieza y preparación de datos son pasos esenciales antes de realizar cualquier análisis. Estos procesos incluyen la eliminación de valores nulos, la transformación de variables, la corrección de errores y la normalización de datos. R ofrece varias funciones y paquetes, como dplyr y tidyr, que facilitan estas tareas, asegurando que los datos estén en el formato adecuado para el análisis.