Foro de debate

Clustering Jerarquico aplicado a microbiologia

Clustering Jerarquico aplicado a microbiologia

de Elliot Josué Gómez Vanegas -
Número de respuestas: 0

Tengo un data-frame donde básicamente tengo 31 individuos (CEPAS) , a los cuales les he realizado 114 pruebas (MEDIO DE CULTIVO) a cada uno y los resultados de esas pruebas (que cada individuo reacciona de manera particular) en la columna (FENOTIPO), el data frame incluye otras variables de identidad como se ven en la imagen.

Los resultados (que están en la columna FENOTIPO) se expresan como positivo (+), negativo (-), debil (W), lento (S), latente (LAT).

El problema es que de los 31 quiero seleccionar n cantidad de individuos digamos 5, pero que gran representativos de todos, osea quiero hacer una especie de match de los 5 sub grupos con individios más parecidos en tus resultados, pero a la vez más diferentes de los otros 4 subgrupos.

La opción lógica es un análisis de clustering jerárquico, pero no se como implementarlo en mi data frame, si necesito convertir los valores de la columna de resultados a números, o hay alguna otra alternativa.

Nota: La pregunta va mas orientada a que función usar para lograr subgrupos heterogeneos entre si pero con individuos homogeneos, o en todo caso como implementar el clustering jerarquico para logarlo, que metodo como definir las distancias.

Cualquier ayuda sera muy agradecida.