Prólogo: Estadística Básica con R y R-Commander

Introducción

La Universidad de Cádiz es pionera en España en la búsqueda de soluciones de conocimiento abierto, consciente de que es la forma más eficiente de lograr sus objetivos institucionales relacionados con la docencia y la investigación. En concreto, el Punto 1 del Artículo 2 de sus Estatutos, que describe los fines esenciales de la institución, establece como objetivo fundamental: "La creación, desarrollo, transmisión y crítica de la ciencia, la técnica y la cultura y su integración en el patrimonio intelectual heredado''. Mientras que en el Punto 6 del mismo artículo dice: "Acoger, defender y promover los valores sociales e individuales que le son propios, tales como la libertad, el pluralismo, el respeto de las ideas y el espíritu crítico, así como la búsqueda de la verdad''.

La creación de la Oficina de Software Libre, OSLUCA, el 15 de marzo de 2004, la aprobación de la Normativa para el intercambio de información institucional el 27 de septiembre de 2004 y la apuesta decidida de utilización de herramientas de formato abierto en las aplicaciones de comunicación y gestión de la Universidad, son actuaciones que, en los últimos años, han contribuido al desarrollo de soluciones basadas en formatos abiertos en el ámbito de la docencia y la investigación en la Universidad de Cádiz.

Una de los primeras iniciativas que se pusieron en marcha al amparo de ese ambiente favorable, fue el Proyecto R-UCA, que contó con el apoyo decidido de la OSLUCA. El Proyecto R-UCA "persigue facilitar la implantación del paquete estadístico R como estándar para la actividad docente e investigadora dentro del campo estadístico, en especial en la Universidad de Cádiz''. El Proyecto R-UCA, cuyas líneas principales de actuación pueden consultarse en la página web del mismo: https://knuth.uca.es/R, contemplaba, entre otras acciones, la elaboración de material para la docencia y la investigación, constituyendo el manual Estadística básica con R y R-Commander, del que hoy presentamos la 2ª edición revisada, el primer trabajo editorial. También se ha construido una distribución del paquete R denominada R-UCA adaptada a las necesidades de cursos básicos y medios de Estadística en titulaciones de primer y segundo ciclo, los actuales grados. Dicha distribución contempla su instalación en las plataformas más extendidas: linux, windows y mac.

Los miembros del Proyecto R-UCA, pensamos que una institución como la Universidad debe preocuparse de proporcionar a sus miembros las mejores herramientas para el desarrollo de sus tareas, a través de una transferencia interna de conocimiento, que, aunque de carácter instrumental, tiene una importancia estratégica. Por otro lado, la transferencia de conocimiento que se ofrece través de soluciones tecnológicas de carácter abierto tienen un valor doble, ya que, por una parte, permiten que sean analizadas y modificadas en función del interés de sus usuarios y, por otra, facilitan la transferencia de los resultados que se consigan a partir de ellas. Para el caso concreto de las necesidades que se plantean en el entorno del análisis de datos, la existencia de alternativas de software libre, con igual o mejor calidad que las propietarias, supone una tentación difícil de rechazar.

Centrándonos en esta segunda edición revisada del manual de Estadística básica con R y R-Commander, y como pusimos de manifiesto en el prólogo de la primera edición, cuando nos planteamos confeccionar este manual, tuvimos claro que no queríamos enseñar a manejar un programa, sino a hacer análisis estadísticos con el apoyo de una herramienta que facilitara el cálculo y la aplicación de los procedimientos numéricos y gráficos.

La decisión de elegir R fue fácil entonces y el crecimiento exponencial en procedimientos y, sobre todo, de usuarios, nos ha venido a dar la razón ahora. Ningún otro programa en la actualidad reúne las condiciones de madurez, cantidad de recursos y manejabilidad que posee R, además de ser el que tiene una mayor implantación en la comunidad científica. El incorporar la interfaz gráfica de usuario (GUI) Rcmdr pretende, en primera instancia, facilitar el manejo de R y, en segundo lugar, servir como generador de instrucciones R. Es posible que muchos de los usuarios de este Manual no necesiten otro nivel de uso que el que proporciona Rcmdr, pero la mayoría del personal investigador, una vez superado el respeto inicial a la herramienta, se decantarán por manejarse directamente con la consola de R, creando y editando instrucciones con una evidente economía de recursos y, lo que es más importante, con un control total sobre los procedimientos que en cada momento se van a aplicar.

Respecto a los contenidos, el libro pretende abarcar las necesidades prácticas de un programa básico de estadística, y así, salvo el primer capítulo, donde se presenta de forma muy sucinta el software, el resto está dedicado a los tópicos habituales de un curso introductorio: Análisis Exploratorio en una y dos Dimensiones, Distribuciones de Probabilidad, Inferencia Paramétrica y no Paramétrica y Análisis de la Varianza de un Factor. El esquema de presentación de los temas incluye una breve descripción de los conceptos, la resolución de una serie de ejemplos con la ayuda de R y la propuesta de ejercicios para evaluar los conocimientos adquiridos.

Al objeto de facilitar el uso del software, los primeros capítulos están soportados básicamente sobre la interfaz Rcmdr. A partir del capítulo 5 aumenta el uso de funciones construidas directamente en la ventana de instrucciones, en parte por necesidad y en parte por motivos estratégicos, puesto que para entonces consideramos que nuestros alumnos están bien familiarizados con la sintaxis de las funciones de R.

No queremos dejar pasar esta oportunidad para agradecer la colaboración, el apoyo y las aportaciones que durante estos años hemos recibido de la comunidad científica. Tanto a través del foro de soporte del propio Proyecto R-UCA, como de los distintos formatos de comunicación, electrónica y tradicional. El "feed-back'' que hemos recibido ha sido realmente espectacular y podemos presumir con evidencias contrastables de que este proyecto es un referente del uso de \R\ en lengua hispana. En este sentido queremos destacar que, el 1 abril de 2013, se habían producido más de 52.000 descargas del manual y más 70.000 del Paquete R-UCA. A éste número de descargas habría que añadir las descargas efectuadas desde servidores ajenos al proyecto que no podemos contabilizar.

Esperamos que esta segunda edición revisada del manual sea de utilidad y, como en la primera edición, ponemos nuestro trabajo a disposición de la comunidad científica para que se hagan las mejoras, ampliaciones y adaptaciones que se deseen.

Los autores.

History (Histórico)

Este libro surge como material de apoyo a un curso de estadística básica con R. La génesis está en la creación del proyecto R-UCA en mayo del 2007 y su primera versión ve la luz en enero de ese mismo año. Los autores en orden alfabético inverso son Antonio Sánchez Navas, Sonia Pérez Plaza, Manuel Muñoz Márquez, María Auxiliadora López Sánchez, Fernando Fernández Palacín y Antonio Jesús Arriaza Gómez.

Entre junio de 2012 y marzo de 2013 se hace una revisión y actualización completa del libro. Cabe destacar que se ha reescrito completamente el capítulo: Comenzando con R y se ha añadido el capítulo: Organización y manipulación de datos con R.

Última modificación: lunes, 30 de octubre de 2017, 14:40