Foro de debate

Analizar por casos

Analizar por casos

de Carolina Leal -
Número de respuestas: 4
Tengo una base de datos de temperaturas en el mar, que está compuesta por tomas de muestras en diferentes sectores y subsectores de la costa, cada uno identificado con su nombre. Necesito hacer análisis descriptivos sobre estos sectores, más adelante haré análisis multivariados tb.
Mi problema es que no sé de qué manera calcular la media, ds, histogramas, test de normalidad, etc... por sector, luego por subsector... etc. sin tener que manipular la base fuera de R.


gracias!
En respuesta a Carolina Leal

Re: Analizar por casos

de Antonio Jesús Arriaza Gómez -
Si usas Rcmdr, la opción: Estadísticos -> Resúmenes-> Resúmenes numéricos...
y seleccionas en la ventana emergente la opción [Resumen por grupos]

Si necesitas un subconjunto de tus datos para realizar un análisis multidimensional, puedes hacerlo mediante: Datos -> Conjunto de datos activos -> subconjunto de datos activo...

en la expresión para filtrar debes usar algo del estilo:

sexo=="mujer"

y con esto nos quedamos con todos los individuos se sexo femenino del conjunto de datos.

Si no usas Rcmdr las órdenes explicadas arriba son:

# Resumen numérico
numSummary(Dataset[,"var1"], groups=Dataset$var2, statistics=c("mean", "sd",
"quantiles"), quantiles=c(0,.25,.5,.75,1))

# Subconjunto de datos

datos_filtrados <- subset(Dataset, subset=sexo=="mujer", select=c(var1))

Un saludo


En respuesta a Antonio Jesús Arriaza Gómez

Re: Analizar por casos

de Carolina Leal -
muchas gracias, Antonio,

la funcion numSummary muy útil (se debe cargar antes Rcmdr aunque no se utilice directamente desde R.comander)

lo de los subconjunto de datos me encantó.... pero si fuese una variable dicotómica, como la del ejemplo ... mujer, hombre... muy bien, en mi caso, tengo 58 tipos diferentes... me hubiese gustado automatizar más.

otra pregunta al respecto: si quiero filtrar, por ejemplo por sexo y nacionalidad ( o más variables), traté de ingresar un vector en el argumento subset, pero no me funciona... algun pista????

Saludos!
En respuesta a Carolina Leal

Re: Analizar por casos

de Antonio Jesús Arriaza Gómez -
La siguiente orden hace lo que pides:

datos_filtrados <- subset(Dataset, subset=(var2=="hombre")&(var3=="española"))

Por cierto, me gustaría saber una cosa, se supone que tienes una variable factor que toma 58 valores distintos, y supongo que quieres analizar varias variables numéricas según cada valor de la variable factor. ¿Existen datos suficientes de cada valor de la variable factor como para hacer por ejemplo análisis de regresión?

Si la respuesta es NO, te aconsejo que selecciones aquellos valores de la variable para los que hay una gran variedad de datos.

Un saludo

Antonio




En respuesta a Antonio Jesús Arriaza Gómez

Re: Analizar por casos

de Carolina Leal -
Gracias por tu sugerencia, Antonio. La verdad es que algunas variables las tengo a niveles tan micro que mis tamaños muestrales son grandes, sin embargo tengo otras a nivel más macro, lo que me obligaría a resumir el resto de las variables y mis tamaños disminuyen. El tipo de análisis que haré aún no lo decido, por ahora espero que la descripción me entregue información suficiente para tomar esa decisión.


Probaré el último código que me envías


Muchas gracias, de nuevo :)