#######################################
### DataFrames o Marco de datos ###
#######################################
# En videos anteriores hemos visto como crear y trabajar con vectores y matrices, pero realmente
# el DataFrame es la estructura mas versatil y con la que mas cosas podremos hacer.
# Puede estar compuesto por elementos de distinta clase y esto es bueno, porque cuando tengamos entre
# nuestros datos variables cuantitativas podremos trabajar con la clase numeric y cuando tengamos variables
# cualitativas, trabajaremos con variables tipo factor.
# Todo bajo la misma estructura, el df.
# Es como una matriz, pero con la posibilidad de albergar datos de distintas naturaleza.
##############################
### Crear un DataFrame ###
##############################
# Se puede crear un df a partir de vectores.
plantas = c(15,16,18,18,12,12,25,10,15,22,14,14,16,4,8,5,7,3,9,12) # Plantas nacidas por m2
tratamiento = c("s","s","s","s","s","s","s","s","s","s","n","n","n","n","n","n","n","n","n","n")
Datos = data.frame(tratamiento, plantas) # Creamos un df con los dos vectores. Cada vector es de distinta clase
################################
### Explorar el DataFame ###
################################
Datos # La consola nos ofrece los datos del DF, pero puede resultar poco practico cuando es muy grande.
head(Datos) # Vemos los 6 primeros datos del DF.
head(Datos, 10)
# Los nombres de las columnas son los que le dimos a cada vector.
dim(Datos) # Nos da las dimensiones del DF, el numero de filas y de columnas.
str(Datos) # Tipo de datos y muestra
summary(Datos) # El resumen varia segun sean variables cualitativas (factor) o cuantitativas (mumerico)
plot(Datos) # El resultado de este comando puede variar segun el tipo de variables,
# pero ya estudiaremos lo graficos en profundidad, en futuros videos.
# Para ver una variable en concreto, escribiremos el nombre del DF seguido por $ y el nombre de la variable.
Datos$tratamiento
Datos$plantas
No hay comentarios:
Publicar un comentario