Foro de discusión y soporte para usuarios de R

Un foro abierto a todos los temas relacionados con R que quiera.
Nota: Una url estable a este foro es https://knuth.uca.es/R-foro.

Error in gzfile(file, "wb") : cannot open the connection

de JOSE LUIS TORTAJADA -
Hola!!  Soy nuevo en esto...a ver si alguien me puede ayudar

Estoy intetando hacer un subset del data.frame Males, para quedarme con las filas en que el atributo year = 1987. Year es un atributo tipo integer.

data87 <- subset(Males, 'year' == 1987)

pero al intentar visualizar el resultado da error "Error in gzfile(file, "wb") : cannot open the connection"

Al hacer el str(Males) muestra la siguiente clase del objeto:

Classes ‘tbl_df’,  ‘tbl’ and 'data.frame':	4360 obs. of  13 variables:

Es Males un data.frame y puede aplicarse la funcion subset???

fechas en R studio

de Antonio Alonso -

Hola, buenos días a todos

Tengo un archivo .CSV con estos datos


DATE,IUMABEDR
31 Jan 1975,11.3295
28 Feb 1975,10.6875
31 Mar 1975,10.2632
30 Apr 1975,9.9091
31 May 1975,9.9762
30 Jun 1975,10
31 Jul 1975,10.1739
31 Aug 1975,11
30 Sep 1975,11
31 Oct 1975,11.8696
30 Nov 1975,11.875
31 Dec 1975,11.4643
31 Jan 1976,10.8333
29 Feb 1976,9.625
31 Mar 1976,9.0543

Lo puedo leer con el código:

stuckey <- read.csv("resultsinteresrates.csv", header=TRUE, sep=",", dec=".")

Pero al intentar cambiar la fecha de str a date con códigos como este entre otros:

stuckey$DATE<-as.Date(stuckey$DATE,"%d-%m-%Y")

siempre me da NA

str(stuckey)
'data.frame': 502 obs. of  2 variables:
 $ DATE    : Date, format: NA ...
 $ IUMABEDR: num  11.33 10.69 10.26 9.91 9.98 ...


¿Alguien puede ayudarme por favor?

Gracias por leerme

Un cordial saludo


Actualizado el manual en español "Iniciaciación a Commander"

de Manuel Muñoz Márquez -

La interfaz de usuario R-Commander es un excelente método para iniciarse en el uso de R. Permite al usuario novel la realización de las tareas más usuales sin necesidad de teclear instrucciones. Al mismo tiempo las instrucciones que realizan dichas tareas son mostradas, por lo que el usuario las va aprendiendo de forma progresiva.

Interfaz R Commander

El autor de R-Commander incluye el manual "Getting Started With R Commander" de John Fox y Milan Bouchet-Valat. Dicho manual se ha traducido al español "Iniciación a R-Commander". Dicha traducción se hace dentro del proyecto R-UCA que también mantiene la traducción al español del propio R-Commander.

Este manual muestra los aspectos fundamentales del trabajo con R Commander lo que lo convierte en una excelente forma de iniciarse en el mismo.

El propio manual está disponible en R Commander, si bien, esta actualización no estará disponible hasta la próxima versión de R-Commander.

instalación R cmdr

de Alicia MP -

Hola, estoy intentando instalar Rcmdr y me sale este mensaje:

Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]]) : 

  there is no package called ‘htmlTable’

Además: Warning messages:

1: package ‘RcmdrPlugin.UCA’ was built under R version 3.3.2 

2: package ‘car’ was built under R version 3.3.2 

3: package ‘randtests’ was built under R version 3.3.2 

4: package ‘Rcmdr’ was built under R version 3.3.2 

5: package ‘RcmdrMisc’ was built under R version 3.3.2 

6: package ‘sandwich’ was built under R version 3.3.2 

Error: package ‘RcmdrMisc’ could not be loaded

Tengo el paquete de RcmdrMisc descargado y no entiendo porque no puedo instalarlo, Muchas gracias de antemano!

concatenar columnas en R

de celeste c c -

Hola, yo estoy empezando a aprender R por mi trabajo, y me está costando un poquito....Gracias que acabo de encontrar este foro en español!!!!!

Lo que necesito hacer seguro que se puede hacer de forma rápida con una o dos líneas, pero llevo todo el día probando y buscando y nada... 

tengo un fichero1 con muchas columnas, y quiero generar un fichero2 que contenga en la primera columna los datos de las tres primeras columnas del fichero1, separados los datos por (;), por ejemplo. ¿cómo puedo hacer eso? 

Esto que escribo es lo único que no me da error...

setwd("mi_ruta")

data1 <-read.table(file="fichero1", header=TRUE, sep="\t", stringsAsFactors=F, fill=TRUE)


Espero que me podáis ayudar. Muchas gracias

Modelos lineares generalizados (GLM)

de Cristina Alonso -

Buenas tardes,

no se si alguien me podría aclarar unas dudas que tengo trabajando con GLM en R, es un caso particular de ecología marina y he seguido como guía el libro de Zuur (2009). Tengo que aplicar un modelo GLM utilizando la familia Poisson, para ver la relación entre variables explicativas y la variable de respuesta (abundancia de una determinada especie), como tengo muchas variables explicativas el método a seguir es ir añadiendo (o quitando) variables hasta que consiga un modelo adecuado. Cuando aplico la fórmula glm: obtengo-->glm.fit: fitted rates numerically 0 occurred --> no se donde está el error, la variable de respuesta es discreta ya que se trata de conteos de individuos. Quizás es porque tengo muchos ceros en la tabla o porque también hay muchas casillas con NA.

Gracias

Problema al sacar percentil en R

de Willy Rodriguez Barcelo -

Hola muy buenas, estoy haciendo un trabajo en R y me piden lo siguiente...

Las calificaciones obtenidas en una prueba educativa están distribuidas normalmente con  media = 500 y desviación tipica = 100

Me piden calcular el 90 percentil de la distribución y sus cuartiles.

¿Cómo puedo hacer esto?

En papel se hacerlo mas o menos sin problemas pero en R no se como realizarlo,ojala alguien pueda ayudarme.


Interpolación de datos georeferenciados

de Manel G O -

Buenas

Estoy haciendo un proyecto y la idea es calcular la temperatura en un punto concreto (indicando las coordeandas) a partir de los valores de temperatura de puntos cercanos. Tengo un data.frame con varias filas (tantas como puntos cercanos) con una columna indicando la temperatura en ese punto y las columnas de lat/long con las coordenadas de dichos puntos.

Necesito saber como conseguir calcular la temperatura del punto concreto a partir de la interpolacion de valores de temperatura de los puntos cercanos. La idea es poder obtener el valor, y no un mapa de colores de temperatura pintado por interpolación.

Muchas gracias

Realizacion de trabajo en R

de luciano armanini -

hola quisiera saber si alguno me puede dar una mano con esto estoy muy complicado con unos trabajos para la facultad. bueno lo que tengo que hacer es:

Objetivo: Aprender a hacer gráficos con R y explorar algunos de los gráficos clásicos.1. Datos del INDEC. 

a. Dispersión múltiple. Utilizando los datos del indec, explore las posibles asociaciones entre las variables de la tabla “tiempos.tuc” usando la función pairs() o splom() del paquete “lattice”.

b. Dispersión condicionada. Basándose en las figuras del punto anterior, elija 3 variables que parezcan estar relacionadas. Confeccione un gráfico condicionado para explorar cómo se relacionan, usando la función coplot() o xyplot() del paquete “lattice”.

c. Torta. Divida la ventana de grafico en tres. Elija tres provincias y grafique, para cada una, una torta donde se muestre el tiempo que le dedican los encuestados a: actividades domésticas (dom), ayuda escolar (esc), cuidado de personas (cui), ayuda a vecinos (vec) y voluntariados en organizaciones (vol). Es el mismo grafico que en el ejemplo, pero con provincias en lugar del país entero. 

d. Distribución de densidades. Cree un gráfico de densidades para la variable“tiempo_tv” en Tucumán utilizando al función densityplot(). 

2. Gráfico libre. Haga un gráfico más, sobre cualquiera de los dos set de datos (u de otro), el que más le haya gustado o le interese aprender. La única condición es que no repita lo que hizo en los puntos anteriores.

https://knuth.uca.es/moodle/pluginfile.php/68/mod_forum/post/2322/luciano%20armanini.pdf

https://knuth.uca.es/moodle/pluginfile.php/68/mod_forum/post/2322/luciano%20armanini.csv

problemas de tapply en función

de Josep Llasdf -

Saludos!

mi problema és el siguiente: tengo que hacer muchos test (shapiro.test, chisqr.test... ) en varias variables de un dataframe. Diseñé una funcion para ahorrar tiempo, pero no me funciona, el tapply me falla:


getwd()
load("ALA_plu_any.Rdata")
trest <- function(dafra, fact1, fact2, tesT){
  tapply(dafra$fact1, dafra$fact2, tesT)
  dafra_pvalor <- as.data.frame(sapply(tapply(dafra$fact1, dafra$fact2, tesT), "[[", 'p.value'))
  colnames(dafra_pvalor)<-paste(as.character(fact1), as.character(fact2), as.character(tesT), "_", "p-valor", collapse="_", sep="")
  dafra_xsquared <- as.data.frame(sapply(tapply(dafra$fact1, dafra$fact2, tesT), "[[", 'statistic'))
  colnames(dafra_xsquared)<-paste(as.character(fact1), as.character(fact2), as.character(tesT), "_", "p-valor", collapse="_", sep="")
  tttt <- cbind(dafra_pvalor, dafra_xsquared)
  return(tttt)
}


ALA_plu_any<-data.frame( Any=c("X1995", "X1996", "X1997", "X1998", "X1999", "X2000", "X2002", "X2003", "X2004", "X2005", "X2006", "X2007", "X2008", "X2009", "X2011", "X1995", "X1996", "X1997", "X1998", "X1999", "X2000", "X2002", "X2003", "X2004", "X2005", "X2006", "X2007", "X2008", "X2009", "X2010", "X2011", "X2012", "X2013", "X2014", "X2015", "X2006", "X2007", "X2009", "X2010", "X2011", "X2012", "X2013", "X2015", "X1995", "X1996", "X1997", "X1998", "X1999", "X2000", "X2002", "X2003", "X2004", "X2005", "X2006", "X2007", "X2008", "X2009", "X2010", "X2011", "X2012", "X2013", "X2014", "X2015", "X2002", "X2003", "X2004", "X2005", "X2006", "X2007", "X2008", "X2009", "X2010", "X2011", "X2012", "X2013", "X2014", "X2015", "X1996", "X1997", "X1998", "X1999", "X2000", "X2002", "X2003", "X2004", "X2005", "X2006", "X2007", "X2008", "X2009", "X2010", "X2011", "X2012", "X2013", "X2014", "X2015", "X1996", "X1997", "X1998", "X1999"), Pluviometria=c(999, 1167, 746, 476, 862.5, 604, 1094.5, 845, 844, 750, 560, 437.7, 1027, 969, 1020.6, 570, 1027, 586.2, 513.4, 649.4, 522.1, 768.6, 624, 551.2, 519.8, 505.6, 440.6, 787.1, 596.6, 780.9, 825.2, 467.8, 640.5, 787.3, 503, 581, 478, 636, 662, 905.3, 466.6, 20.4, 476.4, 618.9, 1183, 627.9, 580, 691.6, 557.1, 869.2, 716.7, 587.8, 592.9, 528.6, 465.3, 874.5, 634.2, 801, 846.3, 487.6, 575.4, 787.7, 411.6, 849.5, 838.5, 632.5, 582.5, 550, 516, 900.5, 643.5, 734.7, 807.9, 495.6, 738.3, 860.3, 410.8, 1268, 778, 781.5, 781.5, 600, 1015, 895.5, 762, 783, 704, 547, 1091.5, 743.5, 916.5, 1035.1, 614.3, 998.7, 1066.9, 696.7, 1558, 787.5, 836.5, 820))



TTT <- trest(ALA_plu_any, Pluviometria, Any, chisq.test)
#dafra = dataframe ; fact1 y fact 2= factores ; tesT = test



#Muchas gracias!!