Hola buen dia potrai ayudarme,
Tengo un data frame de 30mil filas, donde tengo mis X y la variable respuesta Y, los X son repetidos (alrededor de 150), pero cambian en otras características como año, lugar, asesor, etc.
Yo quisiera comparar por ejemplo X1 con X2, que me den sus medias, N de cada uno, diferencia entre ambos, porcentaje de veces que gana uno sobre el otro.
Y que también lo pueda filtrar por las características. Hay alguna librería o funciones que me recomiendes??? O que pueda realizar una función que pueda comparar los X (Y).
Muchas gracias.
Ejemplo
X Y A L D Marca
x1 1,98 2007 cordoba carlos a
x2 2,3 2007 madrid roberto b
x3 2,5 2007 zaragoza alex c
x2 1,88 2008 cadiz guillermo b
x1 2,01 2008 santander mauricio a
x3 3,02 2008 madrid roberto c