lunes, 11 de mayo de 2015

SELECCIONAR DATOS III


#######################################################
###   Filtrar datos por filas o columnas de un DF   ###
#######################################################

# Establezco el directorio de trabajo
setwd("C:/Users/Raul Ortiz/Desktop/Proyectos R")

# Importo los datos
Datos = read.table("Potato.csv", header=T, sep="," , dec=".")

# Verifico los datos cargados
head (Datos)    # Verifico los primeros datos
str(Datos)      # Compruebo la estructura.
summary(Datos)  # Veo resumen de datos

######################################################################
###   Seleccionar datos del dataframe, usando libreria - dplyr -   ###
######################################################################

library(dplyr) # Si es la primera vez que la usas, antes tendras que instalar el paquete (menu Tools).

filter (Datos, Variedad=="Krone") # La estructura es igual que subset.

select (Datos, Tratamiento, Variedad, Weightto40, Weight41to45, Weight46to60, Weight61on)

select (Datos, Tratamiento, Variedad, contains ("Weight"))

select (Datos, Tratamiento, Variedad, ends_with ("61on"))

?select

### Encadenando ordenes con - %>% - que se puede leer como - entonces... -

# Sin encadenar
filter (select (Datos, Tratamiento, Variedad), Tratamiento=="UTC")
# Filtra seleccionando en el DF Datos las variables Tratamiento y Variedad, cuando Tratamiento sea igual UTC

# Encadenando
Datos %>% select (Tratamiento, Variedad) %>% filter (Tratamiento=="UTC")
# Trabaja con el DF Datos, despues seleciona las variables Tratamiento y Variedad, y despues las filtras

1 comentario: