El SCRUG organiza reuniones en linea sobre R. La participación es gratis para todos los interesados, y se organizan desde Costa Rica para todos los interesados en R en Latinoamerica.

Quieres participar? Ven a la siguiente reunion del San Carlos RUG. Las organizamos cada último jueves del mes de 19:00 a 20:00 (hora tica UTC-6). Las reuniones son en linea para que sea fácil asisistir, aún si no estas en San Carlos (o Costa Rica). Anunciamos las reuniones a travez de Meetup.com, y te agradecemos si anuncias tu participación allí.

Si vienes por primera vez

Todas las reuniones se hacen en linea, asi que no importa donde estes. Si vale la pena tomar en cuenta que solo hay espacio para 24 participantes en vivo. Los demas pueden participar viendo el stream en vivo en Youtube Live. Si te registras en meetup.com para el evento te llegará el link al hangout correspondiente.

Mira la introducción y listado de recursos para arrancar con R. En los talleres tratamos de acomodar todos los niveles. Así que aún si no has participado antes estas bienvenida/o. Puedes ver las presentaciones anteriores abajo (sigue los eslabones “Ver la presentación” al lado del anuncio de las sesiones.).


Agenda de reuniones

31 de Mayo de 2018

Tema: por anunciar

26 de Abril 2018

Tema: Como crear Dashboards con Shiny

El paquete Shiny ha sido una innovación en R importante porque nos permite crear productos de datos que permiten a usuarios no técnicos interactuar con datos. Es un entorno muy flexible para presentar datos como gráficos y tablas, o inclusive para gestionar procesos de análisis. Ejemplos de lo últimos son por ejemplo: permitir al usuario cambiar parámetros, o hacer downloads de resultados, o uploads de datos por analizar.

Para ver ejemplos de lo que se puede lograr vale la pena mirar la collección de ejemplos que mantiene RStudio aqui: https://shiny.rstudio.com/gallery/.

En esta reunión vamos a seguir de una forma muy práctica todo el proceso desde una idea para presentar datos de forma interactiva en un dashboard, hasta desplegar este dashboard en línea para que lo puedan acceder tus usuarios. Lo hacemos así para cerrar la brecha entre los ejemplos y documentación que está disponible en línea y la práctica de trabajar con Shiny en RStudio.

El código del ejemplo que usamos va estar disponible de antemano para que todos los participantes lo puedan seguir de forma práctica y poner sus preguntas de una vez en la reunión. El objetivos es que después de la reunión puedas empezar con un proyecto de forma independiente para implementar tu propio dashboard!

Mandaremos el código ejemplo a los que se han inscrito para participar unos días antes de la reunión. Pero no hace falta estudiarlo para participar! Mostraremos cómo dar todos los pasos y aprovechamos para introducir los conceptos claves que necesitas para trabajar con Shiny.

Al final mostramos como llevar tu app en Shiny a algo que funciona en línea usando shinyapps.io.

Esperamos verte en la siguiente reunión!

29 de Marzo

Tema: Trabajar con Tiempo en R

La medición del tiempo así como el uso de datos que hagan referencia a este es algo que puede ser particular ya que existen meses con diferente cantidad de días, en diferentes países y regiones el formato de fechas se emplea de manera distinta o existen años bisiestos y además para hacer cálculos podemos hacerlo en días, meses, segundos, horas o años.

Con esta complejidad podríamos pensar que usar datos de fechas para hacer análisis es algo difícil, sin embargo no lo es. R tiene un sistema robusto para poder lidiar con datos que representan fechas y horas de una manera sencilla.

Acompáñanos en la reunión del San Carlos R-user group donde estaremos aprendiendo sobre el manejo de datos de fechas y horas en R con el paquete base y con lubridate.

-Tipo y clase del tiempo en R -Sistema POSIX -Leer fechas y horas desde archivos -Cálculos con el tiempo -Generación de secuencias -Paquete Lubridate

22 de Febrero 2018

Tema: Aprende a correr Rstudio Server y Shiny Server sobre un Raspberry Pi

El objetivo de la sesión será ver cómo instalar un entorno de análisis y visualización de datos con las herramientas R Studio y Shiny Server en la famosa placa de bajo coste Raspberry Pi. Vamos a ver cómo preparar la rpi para que ajustarla a los requisitos de memoria y librerías necesarios para montar nuestro entorno de procesado y visualización de datos. La presentación esta a cargo de Jesus Armand Calejero, Chief Data Scientist de Fundalia. Jesus es un estadistico egresado de la Universidad de Granada y la Universidad de Valladolid con una amplia experiencia como cientifico de datos. Organizamos las reuniones del Grupo de Usuarios R en linea, y por lo tanto no hay cupo para mas que 25 participantes. Mas información sobre la agenda en nuestro sitio web: http://sancarlos-rug.github.io/

25 de Enero 2018

Tema: Crear Blogs y Websites en R con Blogdown

La versatilidad de las herramientas disponibles en el mundo R sigue incrementando rápidamente. Sobretodo la parte de la comunicación sobre lo que logramos hacer analizando datos esta bajo un auge de inicativas. Entre ellas esta Blogdown, un paquete desarrollado por Yihui Xie para (re-)usar Rmarkdown y presentarlos en un website estático.

Como esto es lo que estamos usando para crear el website de www.ConectaR2019.org, una conferencia sobre R que va tener lugar en Costa Rica en Enero del 2019, escuchamos que hay interés en saber como funciona. Porque hace la labor (y la diversión!) de compartir lo que estás haciendo con datos y con R mucho más fácil, y pone un blog o website bonito al alcance de todos los que estamos trabajando con R.

La reunión va ser informal enfocado en mostrar de forma practica como arrancar para crear un website con R y publicarlo en la web. Si tienes preguntas anotalas de antemano para que no se nos pasen. Después de la reunión espero que todos estemos cómodos para iniciar un proyecto propio.

1 ### 28 de Diciembre

Tema: Reunión de Final de Año

Llegamos a otro final de año con el Grupo de Usuarios R! Asi que es tiempo para evaluar como nos fué y ver que es del interés de todos ustedes para organizar el año entrante.

Cualquier propuesta de agenda que tengas mándala por favor por email. Me parece que sería bueno hablar por lo menos de los siguiente:

• Evaluar los temas de las reuniones anteriores, plantear temas para el 2018.

• Evaluar el formato y el medio de las reuniones.

• Evaluar el horario y duración

Ademas de esto añadimos los temas que ustedes proponen antes, o durante la reunión. El objetivo es organizar una serie de reuniones en el 2018 que sea útiles para ustedes atender.

30 de Noviembre 2017

Tema: Analysis reproducible con R en contenedores Docker

Vamos a hablar sobre cómo se pueden usar contenedores Docker para hacer poder lograr hacer análisis reproducible. El análisis reproducible es un tema recurrente en discusiones sobre mejores prácticas en la programación en R, es el análisis reproducible. Con eso no referimos a la posibilidad de poder repetir exactamente el análisis que un compañero ha hecho, o que nosotros mismos hemos hecho en el pasado.

El reto de hacer hacer reproducible un análisis es que necesitamos fijar todos los elementos del entorno técnico, no solamente los paquetes R que se usan, pero también el sistema operativo sobre el cual trabajamos. Esto también es clave cuando usamos código R en producción, ya que una actualización a uno de los paquetes R que usamos puede generar errores que no siempre podemos anticipar.

26 de Octubre 2017

Tema:: Analysis reproducible con R en contenedores Docker

En esta reunión vamos a hablar sobre cómo se pueden usar contenedores Docker para hacer poder lograr hacer análisis reproducible. El análisis reproducible es un tema recurrente en discusiones sobre mejores prácticas en la programación en R, es el análisis reproducible. Con eso no referimos a la posibilidad de poder repetir exactamente el análisis que un compañero ha hecho, o que nosotros mismos hemos hecho en el pasado.

El reto de hacer hacer reproducible un análisis es que necesitamos fijar todos los elementos del entorno técnico, no solamente los paquetes R que se usan, pero también el sistema operativo sobre el cual trabajamos. Esto también es clave cuando usamos código R en producción, ya que una actualización a uno de los paquetes R que usamos puede generar errores que no siempre podemos anticipar.

En esta reunión Frans van Dunné va a presentar como trabaja con contenedores tanto para compartir entornos de análisis como para llevar código a producción. Después de explicar lo que son contenedores Docker y como funciona, vamos a crear contenedores específicamente para códig R paso a paso. El objetivo es que el código y los métodos que presentamos sirvan de ejemplo para cuando tengas la necesidad, o la curiosidad para trabajar con contenedores.

28 Septiembre 2017 | Ver presentación

Tema:: R-Ladies: Promoviendo la diversidad de Género en la comunidad R

R-ladies es una organización mundial para promover la diversidad de género en la comunidad de R. Al igual que UseR tiene meetups con usuarios en distintas partes del mundo, y ha ido creciendo con usuarias de todas las edades y de todos los rincones del mundo. PyLadies es una organización similar, pero en este caso para mujeres que programan en Python.

En esta presentación, se tratará de resumir los propósitos y objetivos de ambas organizaciones, así como ejemplos de sus charlas y eventos, con el objetivo de incentivar la creación de un grupo similar para Costa Rica: R-ladies San José.

La presentación estará a cargo de Marcela Alfaro Córdoba: profesora Invitada de la Escuela de Estadística, Universidad de Costa Rica. La profesora se reincorporó a la UCR este año, después de finalizar sus estudios doctorales en estadística en la Universidad Estatal de Carolina del Norte (NC State). Una de sus metas personales es incentivar el uso de lenguajes de programación abiertos para la enseñanza y la práctica profesional de la estadística en Costa Rica, así como motivar y servir de mentora a poblaciones estudiantes infrarrepresentadas en el mundo de la programación.

31 de Agosto del 2017 | Ver presentación

Tema:: Introducción a los Grafos con igraph

En esta presentación Mauricio Leandro nos va hablar sobre Grafos. El contenido de la presentación es el siguiente:

1- Historia

2- ¿Qué es un grafo?

3- Grafos dirigidos

4- Grafos no dirigidos

5- Usos de los grafos en al vida cotidiana

6- Tratamiento de grafos en R con la librería igraph

Juan Mauricio Leandro Jiménez es licenciado en Ingeniería en Sistemas con énfasis en al Gestión de T.I., y tiene mas de 10 años de experiencia como analista de sistemas. TIene un amplio conocimiento en SQL y PL/SQL. A través de estos años se especializó en el manejo de datos con diferentes motores como ORACLE, SQL Server, MySql entre otros, Actualmente desempeña el cargo de CDO en Coopeservidores y se especializa en el tratamiento de datos con diferentes lenguajes como R y Python.

La relación de Juan Mauricio con el lenguaje R es que diariamente lo utiliza para el análisis de datos y construcción de diferentes modelos predictivos, ademas de conectarlo también con diferentes visualizadores de datos como Power Bi y Tableau para aprovechar las bondades de ambas herramientas.

27 de Julio del 2017 | Ver la presentación

Tema:: La incorporación de R desde la formación temprana en Estadística basado en el paquete mosaic

El proyecto MOSAIC es una iniciativa que busca incorporar R y RStudio como una herramienta que sea utilizada desde cursos introductorios de Estadística. La idea de esta práctica consiste en mejorar la estadística en su ámbito conceptual durante la enseñanza, en lugar de enfocarla en cálculos que se pueden volver tediosos; además de que R ofrece una oportunidad para generar gráficos de muy buena calidad. Lo anterior se logra mediante una simplificación que han generado de funciones básicas y de simulación, además de que da un enfoque en la simulación comparándolo con el enfoque clásico de las fórmulas basadas en distribuciones de probabilidad.

Además de lo ya mencionado, el paquete mosaic busca dar una visión de posibles notaciones en los comandos de R que preparan al estudiante para cuando se tenga que enfrentar a ellas en cursos de modelaje de datos y da una pequeña introducción a paquetes gráficos que requieren un manejo más minucioso como ggplot2.

Las guías educativas utilizadas para aprender a usar el paquete e incorporarlo educativamente se encuentran en inglés, por lo que se trabaja en traducirlas para volverlas un material de apoyo obligatorio para cursos de Estadística. Además de traducirlas, puesto que mosaic es un proyecto abierto se busca retroalimentar y expandir el alcance educativo de este mismo.

La presentación esta a cargo de Francisco Javier Jara: un estudiante de Estadística y Matemática en la Universidad de Costa Rica. Como proyecto de Práctica Profesional para finalizar el bachillerato en Estadística junto con el profesor Agustín Gómez participa en la confección de una propuesta educativa, basada en MOSAIC Project, para la incorporación de R y RStudio en la formación en la escuela de Estadística de la Universidad de Costa Rica. Actualmente se encuentra en el proceso de traducir los manuales que generó MOSAIC Project para sus manuales. Inició a utilizar R durante su segundo año de universidad y siempre le ha despertado una gran curiosidad el mismo, pues busca incorporarlo incluso en cursos que no es el software principalmente utilizado. Francisco se considera un usuario rookie, pero esperando algún día ser un usuario bastante experimentado.

25 de Mayo del 2017 | Ver la presentación

Tema:: Desarrollo de algoritmos para la aceleración de análisis de negocios

En el mundo de los negocios nos solemos encontrar con clientes que por su poca exposición al mundo de la ciencia de datos se preocupan de que que un análisis requiera del consumo de muchos recursos (variadas reuniones, tiempo, y aprobaciones directivas). Es así como la propuesta de crear paquetes para acelerar los análisis típicos se gesto. En este caso particular vamos a conversar de uno de los casos típicos, segmentación (clustering).La segmentación típica se considera un proceso relativamente sencillo, y lo es matemáticamente hablando, y también desde el punto de vista de programación. Pero en el mundo de los negocios no basta con elaborar un modelo de segmentación una vez y listo, sino que cada vez que se elabora un modelo se requieren de varios pasos. Es entonces donde elaborar algoritmos que reduzcan el tiempo efectivo en la consulta ayudan a poner al cliente de nuestro lado, por ejemplo, al utilizar funciones que nos ayudan a ahorrarnos pasos iterativos donde los expertos del cliente “meten cuchara” (como dirían los ticos) y alargan la duración de cada iteración. El desarrollo de estos algoritmos suele dividirse en 3 etapas principales, definición del “trabajo típico”, elaboración del flujo de trabajo, y finalmente definición de la optimización necesaria para la reducción de miseraciones.

La presentación nos la presenta Andrés Ramírez Gutiérrez, 27, graduado en estadística y geografía de la UCR, donde se graduó de la primera en 2014. Llevó los cursos que le generaban mayor interés de la segunda, mas nunca le dio clausura. Desde antes de graduarse trabaja para McKinsey&Company, una multinacional dedicada a la consultoría especializada o “tailor fit consulting”. Durante ese tiempo se desempeño durante su año de practica profesional, y el año y medio subsecuente, a elaborar modelos en las áreas de mercadeo y fijación de precios. A finales del año pasado cambio de rol a un equipo enfocado en el análisis de datos geográficos, elaborando modelos de estadística espacial. Logrando así combinar sus dos afinidades universitarias en su puesto actual, donde mantiene cierta relación con los departamentos de mercadeo de distintos clientes, así como también se desempeña en otras áreas como operaciones y elaboración de rutas (en menor medida), y agricultura. Inicio con R al inicio de su vida universitaria, mientras que llevaba los cursos de estadística, y se volvió versátil programando, pues cuando un profesor no utilizaba R, aprendía a su forma, y a la vez, investigaba como elaborar el mismo análisis en código abierto. Recientemente se introdujo en el mundo de la elaboración de paquetes de R, en donde tiene 3 proyectos personales que avanzan lentamente, y espera lograr efectivamente finalizarlos para finales de este año. Andrés se considera un usuario avanzado, pero no experto.

27 de Abril del 2017 | Ver la Presentación

Tema:: Comparaciones entre grupos con R

Un objetivo común de la aplicación de estadísticas al análisis de datos son las comparaciones entre grupos. Esto pueden ser grupos que se definieron en el diseño experimental (en por ejemplo experimentos de mercadeo o ciencia).

En la presentación de Ronny Hernandez sobre comparaciones entre grupos, hablará de herramientas para hacer comparaciones que están disponibles en R. Estos incluyen pruebas estadísticas como t.test y ANOVA para comparar grupos y hacer inferencias con nuestros datos.

Ronny Hernandez es fundador de la organización Brenesii. Entre sus proyectos de investigación el principal se enfoca en el análisis de la complejidad estructural a partir de imágenes digitales, en bosques de Osa. Ronny es estudiante de biología tropical (IV año) y asistente del LEFET (Laboratorio de Ecología Funcional y Ecosistemas Tropicales) de la Escuela de ciencias biológicas de la UNA.

6 de Abril del 2017

Tema:: Tidyverse: una breve introducción

R es, per se, un instrumento único para el análisis de información. Este papel se acrecenta en gran medida con la ayuda de la enorme cantidad de paquetes desarrollados para potenciar la plataforma. Una de las fuerzas en esta dirección son los paquetes desarrollados por Hadley Wickham, hoy llamado Tidyverse. Para este expositor hay un antes y un despues en el desarrollo de R, cuando se considera el Tidyverse. En esta breve introducción, veremos algunas de las fortalezas del uso de este conjunto de paquetes, las diferencias entre un enfoque tradicional de redacción de scripts y el tidyverse todo usando datos de CR.

Michael Herradora es analista de datos en Grupo Purdy Motor. Michael es Sociólogo e investigador egresado de la Facultad Latinoamericana de Ciencias Sociales. Tiene una amplia experiencia en estadísticas y ingenieria de datos. Ademas de geek es linuxero.

23 de Febrero del 2017

Tema :: Introducción practica a la predicción de series de tiempo.

En esta reunion Carlos Agüero nos presentará de manera practica el concepto de serie de tiempo, tendencia, estacionalidad, aleatoriedad así como la creación de modelos predictivos y su validación (estimación del error) utilizando paquetes de R.

26 de Enero del 2017

Ver la presentacion | Bajar los datos y codigo ejemplo

Tema :: Leer y procesar datos en R

Alguna vez has tenido tantos datos en Excel que tu computador se puso muy lento? O haz tratado de hacer gráficas que son imposibles crear sin hacer trabajo a mano? O quizás has querido aplicar un análisis que Excel no permite hacer.

Muchos de nosotros hemos comenzado a trabajar con R por esas mismas razones, y en esta introducción, presentada por Frans van Dunné, vamos a ver de forma muy practica como tomar datos que están en excel y trabajarlos en R.

Como es la primera presentación del año, vamos a tomar un momento para todos los que llegan por primera vez de hablar de las herramientas básicas como RStudio. Además introducimos algunos conceptos básico como la instalación y uso de paquetes R.

29 de Diciembre del 2016

Ver la presentacion

Para finalizar el año nos reunimos para evaluar las respuestas a la encuesta que mandamos, y evaluamos las opciones para mejorar el formato en el 2017.

Una de las propuestas sobre la mesa es incrementar la posibilidad de asistir remotamente, y ver grabaciones de las reuniones pasadas. Habrá espacio para discutir cualquier idea o propuesta que era demasiado elaborada para el cuestionario.

Como parte de las propuestas se presentó el crear un repositorio de libros, artículos y vídeos enfocados a autodidactas entusiastas de inicar en el mundo de R o reforsar sus conocimientos, esperamos puedas participar agregando materiales, puedes encontrar el material en el siguiente link Material para autodidactas

24 Noviembre del 2016

Cancelado por la alerta roja en Ciudad Quesada durante el paso del Huracan Otto.

27 Octubre del 2016

Con un grupo pequeño miramos en detalle como conectarnos con servicios de storage local (couchdb) y en la nuve (Cloudant). Ademas hicimos el ejercicio de crear una replica de la base de datos debajo de Actas Transparentes en Cloudant.

29 de Setiembre del 2016

Estuvo muy divertida la reunión de hoy, jugando con el AlchemyAPI en IBM Bluemix desde R! No puedo esperar hasta que el primero de nosotros logre pasar una acta por esta maquinaria de analisis.

25 de Agosto del 2016

17:00-18:00 Taller: “Temas en R”

18:00-19:00 Taller: “Actas Transparentes”

28 de Julio del 2016

16:00-17:00 Taller: “Temas en R” | Ver la presentación

Aparte de escribir código R y compartir codigo (como lo hacemos con el grupo en Github) llega el momento en que lo queremos poder en uso. Lleva todas las preguntas sobre este tema a la reunion. Por lo menos vamos a mirar:

17:00-18:00 Taller: “Actas Transparentes”

  • Estado y comentarios
  • Repaso de código propuesto
  • Repaso de incidentes

30 de Junio del 2016

Ahora que tenemos las bases en R cubiertas vamos a ver si organizamos los talleres con una agenda un poco diferente alrededor del proyecto. Nos enfocamos en el proyecto que estamos construyendo juntos, y eso da amplia oportunidad para profundizar temas a todos los niveles.

Al comienzo del taller hacemos una ronda para ver que temas quieren profundizar. Dependiendo de quienes están pueden ser preguntas básicas o mas avanzadas. No importa el nivel, lo que haya encontrado que te presento dificultad lo llevas a la mesa. La estructura de la reunion será mas o menos así:

16:00-17:00 Taller: “Temas en R” | Ver la presentación

  • Inventario de temas para profundizar en el taller
  • Breve repaso de lo que hicimos el mes pasado
  • Sesión para profundizar temas

17:00-18:00 Taller: “Actas Transparentes”

  • Estado y comentarios
  • Repaso de código propuesto
  • Repaso de incidentes

26 de Mayo del 2016

16:00-17:00 Taller: “Connectar a bases de datos” | Ver la presentación

Repaso del tema de leer datos de las semana pasada y trabajar con diferentes formas de conectar a bases de datos.

  • Conección a base de datos

17:00-18:00 Taller: “Actas Transparentes”

Seguimos trabajando en forma de taller con nuestro proyecto de Datos Abiertos / Gobierno abierto con las Actas del Municipio.


28 de Abril del 2016

16:00-17:00 Taller: “Leer datos” | Ver la presentación

Vamos a retomar impulso en las bases del uso de R. Todo comienza con datos, así que en esta hora vamos a ver y ensayar como leemos datos en los siguientes formatos comunes:

  • Formato text (txt, csv)
  • Formato Excel (.xls, .xlsx)
  • Proveniente de un API (por ejemplo Twitter)
  • Coneccion a base de datos

17:00-18:00 Taller: “Actas Transparentes”

Vamos a continuar nuestra exploración de R a través del proyecto Actas Transparentes. Es una iniciativa del uso de datos abiertos, donde trabajamos en hacer Text Mining en las actas de la municipalidad de San Carlos.

Vamos a repasar un momento los pasos del “mis en place” para este proyecto:

  • Asegurar que todos estamos conectados en Github
  • Pasos para arrancar con un proyecto Shiny en RStudio
  • Pasos para lanzar proyectos Shiny en www.shinyapps.io
  • Reunir requisitos y ver si podemos asignar tareas

31 de Marzo del 2016

16:00-16:30: Charla: “Dando vida a los datos máquina del IoT”

Por: Juan Pablo Rodriguez Rojas y Rogelio González Quirós

Estamos en vísperas de una explosión masiva de datos disponibles para análisis. No solo datos de personas, pero también de sistemas de producción. Esto va a incluir industrias como la agricultura y ganadería donde las posibilidad para reunir datos son masivas. Usar estos datos es uno de los grandes retos para el futuro, y uno de las las aplicaciones donde R se destaca como lenguaje.

16:30-18:00: Taller | Ver la presentación

Abre el taller del Grupo de Usuarios R en San Carlos. El foro esta abierto a propuestas para proyectos y ideas que podemos trabajar. Por favor añade el eslabón a los datos públicos que podemos usar.

No se te olvide llevar tu portátil con R y RStudio instalado. Si no tienes portátil disponible no importa: siempre hay alguien con quien compartir pantalla.


25 de Febrero del 2016

16:00-17:30: “Taller de introducción a R” | Ver la presentación

En lo posible lleva un portátil para poder seguir la introducción y sigue los pasos descritos aquí para llevar todo lo que necesitas cargado en tu computador. Cuéntanos si tienes preguntas especificas o temas que quisieras que discutamos.

18:00-19:00: Charla: “R para Minería de Datos: Caso Grupo Nación”

Por: Michael Herradora

Michael Herradora del Grupo Nación nos dará una charla sobre como ellos están usando R.