Foro de debate

Ayuda con R

Ayuda con R

by Oscar Viera -
Number of replies: 0

Estoy aprendiendo a usar a R mediante unos videocursos, no se si el problema soy yo pero la verdad me mandaron a hacer unos prácticos y no entiendo nada, alguien podría explicarme como hacer esto paso a paso por favor, muchas gracias

La biblioteca de R mclust contiene un conjunto de datos llamado banknote. Los datos corresponden a
medidas físicas (ancho, longitud, etc) de 200 billetes Suizos, donde 100 de los mismos son falsificaciones y 100
son verdaderos. La variable Status es un factor que indica si el billete es real (genuine) o falso (counterfeit).

1. Cargar los datos. Instale y cargue la biblioteca mclust, luego con el comando data(banknote)
los datos quedan disponibles para trabajar. Puedes confirmar que tienes los datos haciendo
head(banknote).

2. Transforma la variable Status en un factor, con niveles “falso” y “genuino”

3. Descripción global. Utiliza alguna función para inspeccionar globalmente los datos. Comenta los
resultados: describe alguna de las características básicas y destaca si hay aspectos que te llaman la
atención.

4. Calcula una nueva variable que sea la diferencia entre Left y Right y obtiene su desvío típico
SIN utilizar la funciones var() ni sd()

5. Histogramas. Usando ggplot2 dibuja un histograma de alguna de las dimensiones físicas de los
billetes que permitan ver diferencias entre los genuinos y los falsos. Mapea la variable Status a fill
para apreciar las diferencias, utiliza los argumentos del histograma (ej: bins o binwidth) para asegurar
que no haya huecos en el medio del histograma. Para el gráfico seleccionado: (1) explica la estructura
del gráfico, ¿que tipo de gráfico es? ¿que datos se mapean a que elementos estéticos ?. (2) ¿Cual es el
mensaje principal del gráfico?

6. Diagramas de dispersión (). Usando ggplot2 encuentra un diagrama de dispersión con dos de
las medidas numéricas de los billetes. Mapea la variable Y al color de los puntos. Asegurarte de elegir
dos variables que separen completamente los casos falsos de los genuinos. Para el gráfico seleccionado,
(1) explica la estructura del gráfico, ¿que tipo de gráfico es? ¿que datos se mapean a que elementos
estéticos ?. (2) ¿Cual es el mensaje principal del gráfico?

7. Mostrar histogramas de todas las variables en un solo gráfico. Primero debemos estructurar
los datos con reshape. En primer lugar ejecuta el siguiente código:
colnames(banknote)[2:7] <- paste0('md.', colnames(banknote)[2:7])

Luego utiliza reshape para estructurar los datos en formato long. Recuerda que las variables que varying
son las medidas físicas. Una vez que los datos están en formado long, dibuja el histograma del punto 4,
coloreando Status (como en el punto 4) y dejando paneles separados para cada medida. Es probable que
debas fijar scales='free' dentro de facet.