Foro de discusión y soporte para usuarios de R

Un foro abierto a todos los temas relacionados con R que quiera.
Nota: Una url estable a este foro es https://knuth.uca.es/R-foro.

Implementación para encontrar los índices de todas las coincidencias de los elementos de un vector en otro vector

de Lurdes Calle López -

Hola! La funcion match devuelve un vector con las posiciones de las primeras coincidencias de un argumento en en otro, ¿Alguién sabría cómo podría encontrar no solo la primera coincidencia, sino la de todas?

Como por ejemplo

x <- c(2,3,9)

y <- c(1,2,6,2,9)

match(x,y)

>  2 NA  5

Es decir, ¿existe una función, en la que para el valor 2, que se repite no solo en la segunda, sino también en la cuarta, te de todas las posiciones en las que aparezca?

Muchas gracias por adelantado :)

 

Marcas:

Filtrar valores 0 de todas las variables

de Mercedes Gil -

Hola, 

Tengo una base de datos en R con 420 variables numéricas (consumo de un alimento) y una n de 340000 aprox (consumidores). 

Necesito filtrar esa base, creando una tabla donde figure la n de consumidores y  la n de no consumidores por cada variable.

Sería algo así:

                consumidores (n)    no consumidores (n)

Variable1
Variable2 
Variable3  
.

.etc

 

 

Alguien sabe cómo ?

 

Gracias!

Replicar resultados de una matriz

de Cesar Andres Saavedra Vanegas -

Buen dia, me gustaría saber como puedo crear 100 matrices de datos contaminados con NA a partir de una matriz completa original, El codigo para generar los NA de forma aleatoria ya lo tengo y funciona para los porcentajes de Na que quiera agregar, el problema esta en que no se como a partir de esa matriz contaminada generar 100 matrices mas aleatorias. Gracias

Cambiar columnas a filas en R o Rstudio

de Laura Rojas -

Tengo unos datos de concentración de contaminantes atmosféricos organizados en 15 variables, entre las cuales se encuentra la fecha, el lugar, y los contaminantes. En esta última se encuentran los contaminantes PM2.5, PM10, entre otros.

Quisiera saber cómo puedo cambiar esta variable de contaminantes, y separarla para que cada contaminante sea una variable. Es decir, pasar los datos de esa columna, a una fila con sus respectivos datos.

Muchas Gracias por su colaboración.


Marcas:

Que opinan de python como alternativa para R

de Andres Mayor -

Soy usuario de Python desde hace años, y hace poco en mi empresa me asignaron funciones de llevar a cabo ciertos estudios de algunos datos que me proporcionaron. En internet encontre algunas librerias para trabajar Data analysis con python, siempre he escuchado que R es el programa por excelencia para estadistica y data. ¿Que me sugieren ustedes? , mi PC actual no es tan potente y estoy corto de dinero por un prestamo que pedi en https://fin32.com/ , tambien quiere trabajar con el programa que requiera menos recursos de hardware. Quiero destacar que soy ing. electronico en vez de informatico, en algunos aspectos de la informatica no estoy muy claro.

Test homogeneidad

de mark lopez -

Buenas, 

Tengo datos de las llegadas de clientes a un call center distribuidos por horas y me gustaría saber si existe algún test en R que me marque homogeneidad en los datos.

Gracias,

Un saludo

extraccion datos tabla

de mark lopez -

Buenos dias,

Tengo un excel con 3000 observaciones y 9 variables del que quiero guardar en un vector el valor  "interarrivals" cuando la variable "time" este entre las 7 y las 9 de la mañana, adjunto pantallazo de la estructura de la tabla

El codigo que habia hecho era

library(readxl)
M1 <- read_excel("M1.xlsx",
                  col_types = c("numeric", "numeric", "numeric",
                                "numeric", "numeric", "numeric",
                                "numeric", "numeric", "date"))
a<-c()
tiempo_llegadas<-M1[1:3694,9]
tiempo_entre_llegadas<-M1[1:3694,8]
for (i in 1:3694) {
  if (7<=tiempo_llegadas[i,1]<9){a<-c(a,tiempo_entre_llegadas[i,1])}
}

Pero me da error, ¿Podeis echarme una mano?

Gracias,

Función simple

de Samuel Naranjo De Zulategi -
Hola estoy tratando de resolver el siguiente ejercicio:

Escriba una función que tome como argumentos un vector numérico y su nombre (imagine que el vector numérico es una variable) y que como resultado regrese el valor mínimo, máximo, promedio y la desviación estándar en una línea de texto de la siguiente manera:: “El valor promedio de la variable XX es XX, su valor mínimo es igual a XX, su valor máximo es igual a XX y tiene una desviación estándar de XX” cuando el contenido de la matriz es numérico. Si el vector no es numérico deberá aparecer una línea de texto que diga: “La variable XX no es numérica”.

Hasta ahora he hecho lo siguiente, sin embargo, no me funciona (alguien tiene alguna idea?):

estadisticas_descriptivas<-function(x){

  promedio<-mean(x)

  maximo<-max(x)

  minimo<-min(x)

  desviacion<-sd(x)

  if (is.numeric(x)==T){paste("El valor promedio de la variable",x, "es",promedio<-mean(x), "su valor mínimo

                               es igual a",minimo<-min(x), "su valor máximo es igual a", maximo<-max(x), "y tiene una desviación estándar

                               de", desviacion<-sd(x))} else {paste("La variable",x, "no es numérica")}

}


Marcas: