Esta semana, por diversas razones, ha sido complicada, y además la mayoría de mis alumnos se examinan la semana que viene. Así que seguramente todos, ellos y yo, agradeceremos una entrada del blog más relajada que las anteriores. Además, estoy escribiendo una entrada más larga, con los primeros pasos en R como lenguaje de programación, y todavía no está acabada. Así que, mientras ese trabajo llega a puerto, haremos una excursión breve a algunos temas sueltos que han ido quedando por el camino. El denominador común es mejorar nuestra experiencia como usuarios de R.
Lo primero es hacer justicia con quienes nos abrieron el camino
Aunque este blog aspira a proporcionar una lectura autosuficiente sobre R, lo cierto es que hay muchas fuentes de información que yo usé, en su momento, para aprender a usar R y a las que sigo acudiendo en busca de lo mucho, muchísimo, que siempre queda por delante. Y os animo a que las exploréis. Hay gente haciendo cosas increíbles, que nos hacen soñar con llegar a ser algún día la décima parte de buenos en lo que hacemos.
La primera de esas fuentes no hay que ir a buscarla muy lejos. En cualquier instalación de R hay disponible un documento, al que todos nos referimos como R-Intro. En Windows, por ejemplo, para localizarlo, vamos a la ventana RGui (donde aparecen los gráficos, no la de Rcmdr), y en el menú Ayuda seleccionamos Manuales (en pdf) y luego An Introduction to R, como en esta figura.
Este documento, en inglés (en este enlace hay una traducción al castellano de una versión algo más antigua), es relativamente fácil de leer y constituye un curso de choque a algunas de las posibilidades del programa. Es el primer paso para empezar a convertirse en un usuario avanzado de R, aunque -pese a su título- a veces da la sensación de que está más pensado como una guía de referencia que como una ayuda al aprendizaje.
Aparte de este, y otros documentos parecidos, hay varios (muchos) blogs disponibles con un espíritu similar a este. Sin embargo, no conozco ninguno, en español, que se plantee como objetivo enseñar a usar R a un completo novato, como acompañamiento para un primer curso en Estadística. Además, incluso en los blogs en inglés, muchas veces se presentan muchos detalles técnicos de R antes de empezar con las aplicaciones estadísticas. Y por esas razones, entre otras, existe este blog.
Volviendo a los blogs en inglés, hay dos que he consultado bastantes veces, y que tienen nombres casi idénticos :
- R tutorial. Contiene a su vez varios temas, de los cuales los más relacionados con este blog son por un lado Elementary Satistics with R y por otro R Introduction. Contiene numerosos ejemplos de problemas estadísticos resueltos con R.
- R tutorials. Probablemente el blog más parecido a este en sus intenciones. Pero no usa Rcmdr, sino la interfaz más espartana de R (y yo no me atrevo a infligir semejante castigo a mis ya suficientemente sufridos lectores). En cualquier caso, contiene un montón de información útil y bastante bien organizada.
Pero el universo de los blogs sobre R es mucho más amplio. De hecho, existe una página (R bloggers) que se dedica a recopilar información sobre blogs que hablan de R (y tienen más de 400 registrados, mayoritariamente en inglés, pero también en otros idiomas…). Así que puedes buscar el que más te guste.
Ayuda directa sobre comandos desde el propio R
Por otra parte, el propio R, como cualquier programa mínimamente decente, incluye documentación interna sobre sus propios comandos. Por ejemplo, ya conocemos el comando sample, que hemos usado en la novena sesión para fabricar muestras. Para acceder a la ayuda interna sobre el comando, tecleamos en R su nombre precedido de un paréntesis, así:
?sample
Al ejecutar este comando se abrirá nuestro navegador de internet (pero no hace falta estar conectados, la ayuda reside en nuestro ordenador), y nos mostrará la documentación del comando sample (en inglés):De forma equivalente, puedes usar el comando help(sample) para obtener el mismo documento.
Toda la documentación de R está disponible también en internet, con copias en múltiples servidores. Así que muchas veces, a pesar de todos los sistemas de ayuda que hemos mencionado, lo más rápido es usar un buscador de internet, teclear algo como «Binomial distribution with R«, y hojear los resultados.
Asignaciones con flechas
Es algo que he querido mencionar en el blog desde hace tiempo, pero que nunca parecía encontrar su sitio. Hasta hoy, claro. SI vais a consultar el código r escrito por otras personas, descubriréis que, donde yo pondría:
datos = c(2,5,12,3,4)
mucha otra gente escribe:
datos <- c(2,5,12,3,4)
Lo que estamos haciendo, en cualquier caso, es una asignación, en este caso guardando un vector de números en la variable datos. Y la notación tradicional en R para las asignaciones utiliza esa especie de flecha <- en lugar del símbolo igual. Es una buena idea, en principio, porque el símbolo = ya se utiliza en matemáticas para indicar que dos cosas son iguales, y no con este sentido de «guarda esto en la variable…» Pero en la práctica hay tres razones que me llevan a usar = en lugar de la flecha.
- la primera, es que el símbolo = se utiliza en muchos lenguajes de programación para las asignaciones (no en todos, pero sí en muchos de los más usados).
- la segunda es que el símbolo elegido, la flecha <- , no me parece demasiado afortunado. En otros lenguajes se usan alternativas como := (dos puntos seguidos de un igual), que me parecen más logradas.
- y finalmente, ¡da igual! Puedes cambiar las flechas por iguales o viceversa, y R no protestará (al menos, ninguna versión moderna de R).
Gracias por la atención.