Porqué dejé de trabajar con SPSS y comencé a trabajar con R

Esta historia comienza en 1999, cuando comencé mi tesis de pregrado. Fui donde un estadístico como quien va a ver al gran chaman, poniendo mis datos en sus sagradas manos y esperando que algún mágico poder sacara las respuestas que esperaba oir. Por supuesto que nada de eso ocurrió y en su lugar recibí docenas de papeles o "output" de un programa llamado SPSS. Al tiempo después, decidí que iba a aprender lo que pudiera para hacer mi propio análisis estadístico. Y así comencé un viaje de autoaprendizaje que me facilitó mucho la evaluación de las investigaciones. Incluso más, comencé a asesorar a quienes tuviesen consultas estadísticas.
Me convertí en una especie de traductor, traduciendo de ida y vuelta lo que el investigador y el estadístico estaban hablando. De ese tiempo recuerdo que el mejor libro que leí fue Biostatistics: The Bare Essentials de Norman y Streiner.
Comencé utilizando SPSS 8 en adelante. Antes de eso había utilizado Epi Info 6.0, pero en ese entonces comenzaron a aparecer las interfaces gráficas.
Cada vez iba haciendo análisis más y más complejos, o eso creía yo. Y aquí está el problema de SPSS, era hacer click y click y algo salía. Y el problema de fondo era que mi rutina mental había cambiado desde "cuál es el problema y cómo lo puedo resolver" hacia "que función de SPSS se acomoda para resolver este problema".

Hace un tiempo atrás había escuchado hablar de R, el programa (o lenguaje) del que todo el mundo hablaba. Traté de comenzar a utilizarlo, pero me encontré con una gran curva de aprendizaje, así que lo fui posponiendo hasta que decidí no más. Tuve la inmensa suerte que en mi doctorado podía tomar cualquier curso, y encontré uno de Bioestadística Avanzada del Programa de Doctorado en Ciencias mención Ecología y Evolución. Y lo tomé. Wow, que curso. De haberlo sabido lo hubiese tomado el primer año de mi doctorado. Cumplió y superó cualquier expectativa que tenía, y lo más importante, ya estaba usando R. 

Y ¿porqué es importante usar R y no otro programa?
Porque R NO ES click y click. De hecho no hay nada, solo un terminal esperando instrucciones. 
Y aquí está la clave, hay que PENSAR antes de realizar el análisis. Ha sido un aprender algo nuevo cada día, pero lo más importante, he dejado atrás muchos errores que cometía, como usar métodos no-paramétricos, y he comenzado y descubierto una amplia gama de errores nuevos que cometer. Pero a diferencia de los errores anteriores, estos tienen un razonamiento detrás y no solo un "clic aquí, allá y listo"

Ventajas de R

  1. Gratis
  2. En constante desarrollo, tanto así que las principales empresas (Google, Linux Foundation, Microsoft, etc) acaban de crear un consorcio para apoyar el desarrollo de R
  3. Extensible. Esto significa que tiene programas específicos que se pueden añadir. Aquí puedes ver algunos de los miles. Esto significa que
  4. Dependiendo del análisis que requieras, la capacidad del pc puede ir desde mínima hasta miles de servidores. En la práctica, puede ser el programa perfecto para ocupar ese pc que ya nadie ocupa por viejo
  5. Desarrollo de código libre. Esto significa que no está a cargo de una empresa, sino de miles de colaboradores en todo el mundo. Piensa lo que le pasó a Encarta y a Wikipedia...
  6. A pesar de ser un programa de terminal, tiene interfaces gráficas, como R Commander y la que utilizo, R Studio
  7. Por ultimo y quizás lo más importante: para poder utilizarlo HAY que saber algo de estadística. Quizás es una buena idea en caso que requieras un análisis preguntar en qué programa harán el análisis. Prefiere a quienes te digan que lo van a hacer en R. 

Bueno, si alguien se anima, aquí hay varios recursos que me han sido de utilidad: 
  1. Getting Started with R – An Introduction for Biologists de Andrew Beckerman
  2. Try R en O'Reilly
  3. Programación en R en Coursera
  4. R en la UCLA
y dos libros un poco más avanzados: 
  1. Introductory Statistics with R de Dalgaard, Peter
  2. Discovering Statistics Using R de Field, Andy
También estoy publicando algunos análisis en mi página de RPubs
Un fantástico sitio donde obtener respuestas es Cross Validated o el buscador que hice para buscar específicamente temas de estadística y R: