Foro de discusión y soporte para usuarios de R

Un foro abierto a todos los temas relacionados con R que quiera.
Nota: Una url estable a este foro es https://knuth.uca.es/R-foro.

Anovas

de borja aramburu munoa -

Hola!

Que tipo de estudio de suposiciones básicas para llevar a cabo una Anova debería hacer en una base de datos con número de muestras mayor a 50? (he leído que cuando la cantidad se excede de 50 shapiro ya no es fiable) Gracias!!

Join de dos marco de datos

de Marlon Pabón -

Tengo el siguiente inconveniente: tengo dos dataframes con la misma estructura (variables) de dos trimestres diferentes, de reportes de gastos de entidades, la cuestión está en que en el siguiente trimestre reporta un mayor número de entidades que el trimestre anterior (el número de filas se incrementa cada trimestre) pero debo hacer un ejercicio tipo panel en donde tenga los registros trimestrales de todo un año solo con las entidades que reportan cada trimestre.

En mi caso son 41.000 registros del primer trimestre  y 45.000 del segundo semestre, el resultado que espero es un panel de dos trimestres con 41000 filas, pero al hacer los join me resultan muchas más. Lo único que necesito es agregar una sola columna de valores del segundo semestre

Quisiera saber como hacer un join que me resulte en un data frame de solo 41000 filas que me traiga los valores del segundo semestre de una sola variable. Gracias


Trabajar con fechas

de eva rota -

Buenos días,

Tengo un problema con las fechas de una base de datos donde hay una fecha de inicio y otra de fin sobre un consumo de agua, pero necesito saber si por ejemplo el intervalo de fechas es: 

FECHA INICIO: 2019-01-08

FECHA FIN: 2019-03-08

Saber cuántos días pertenecen a enero en este caso serian 23, cuáles a febrero que sería 29 y cuáles a marzo que son 8. 

He conseguido crear dos intervalos con el paquete lubridate, uno donde x <- interval(FECHA INICIO, FECHA FIN), y otro intervalo donde y <- interval(inicioenero - finalenero) "teniendo en cuenta que el intervalo es entre el 01/01/2019 y 31/01/2019" y entonces comparar los dos intervalos y ver si se solapan o no con el comando: int_overlaps(x,y)

El resultado que da te dice 'TRUE' si el intervalo de fechas de mi base de datos se solapa con el intervalo del mes de enero y 'FALSE' si no se solapa. 

Sólo me faltaria saber qué días són los que pertencen a enero, en mi caso de ejemplo serian 23. 

Alguien sabe algun comando que me de este resultado? Sería de mucha ayuda,  Muchas gracias!!!

Un saludo.

 Fdo: Eva Roa
 Blogger como hacer un curriculum

Clustering Jerarquico aplicado a microbiologia

de Elliot Josué Gómez Vanegas -

Tengo un data-frame donde básicamente tengo 31 individuos (CEPAS) , a los cuales les he realizado 114 pruebas (MEDIO DE CULTIVO) a cada uno y los resultados de esas pruebas (que cada individuo reacciona de manera particular) en la columna (FENOTIPO), el data frame incluye otras variables de identidad como se ven en la imagen.

Los resultados (que están en la columna FENOTIPO) se expresan como positivo (+), negativo (-), debil (W), lento (S), latente (LAT).

El problema es que de los 31 quiero seleccionar n cantidad de individuos digamos 5, pero que gran representativos de todos, osea quiero hacer una especie de match de los 5 sub grupos con individios más parecidos en tus resultados, pero a la vez más diferentes de los otros 4 subgrupos.

La opción lógica es un análisis de clustering jerárquico, pero no se como implementarlo en mi data frame, si necesito convertir los valores de la columna de resultados a números, o hay alguna otra alternativa.

Nota: La pregunta va mas orientada a que función usar para lograr subgrupos heterogeneos entre si pero con individuos homogeneos, o en todo caso como implementar el clustering jerarquico para logarlo, que metodo como definir las distancias.

Cualquier ayuda sera muy agradecida.


Loops en R

de Santiago Sanchez -

Hola. Soy nuevo con R, estoy intentado realizar un loop o bucle. He probado esto y me funciona correctamente. 

for (j in 1:10000){

  m1 <- ifelse(datos$ANO1 < 120,'Falso','Verdadero')

  m2 <- ifelse(datos$ANO2 < 120,'Falso','Verdadero')

  table <- ifelse((m1=='Verdadero')&(m2=='Verdadero'), 'VERDADERO', 'FALSO')

}

z <- data.frame(table)

Ahora quisiera hacer lo mismo pero para más valores, puesto que solo me estoy limitando en un valor que es el 120. En lugar de eso quisiera usar un vector que inicie en 0 hasta 300 e ir guardando todos los resultados en una matriz. 

Lo he intentado haciendo un bucle anidado pero no lo he logrado.

¿Alguna idea?

Extraer una cadena de caracteres especifica dentro de un cadena mayor

de Leoanrdo Bode Caceress -

Mi problema es el siguiente tengo una cadena de String que deseo extraer otra pero el tamaño de lo que deseo extraer es dinámico .

Ejemplo: 'LABEL=BONIAT-3, CellIndex=53, CGI=3680100DD001B'

De aqui deseo extraer BONIAT-3

Ejemplo: 'LABEL=UCI2, CellIndex=53, CGI=3680100DD001B'

De aqui UCI2


En fin lo que deseo extraer esta después de el signo ''=''  y antes de la primera ","


Si me pudierana ayudar 


Gracias




grafos

de juan cevallos -

hola amigos necesito hacer un grafo para aplicar el metodo de amplitud, pero me han pedido que pinte de un color diferente el camino recorrido. alguien sabe como pintar de diferente color los vertices de los grafos.

Ademas como crear grafos con pesos en los vertices y aristas. teniendo en los vertices letras para recorrer el grafo


saludos!

utilizar tablas de excel para amelia II

de jorge quishpe -

buenas tardes con todos, tengo un pequeño problema, al momento que importo tablas de excel, se me genera en data una variable con mis datos pero esos datos quiero que se cree un harchivo Rdata, para poder importarlo al programa amelia y hacer el relleno de datos si alguien sabe porfavor ayudeme gracias adjunto una captura de lo que hagoesos datos de fecha y viento quiero que esten en un RData