Programación Estadística para ciencias ambientales con R y RStudio – Edición Online

Programación estadística para ciencias ambientales con R y RStudio - Edición Online

Este curso cubre temas avanzados en la mayoría de los flujos de trabajo (workflow) de programación estadística para Ciencias Ambientales, como la estructura de datos y la gestión del espacio de trabajo, técnicas de visualización y análisis estadístico utilizando las plataformas libres y el lenguaje de programación R y su IDE RStudio.

El curso se imparte en cuatro módulos que cubren el análisis exploratorio de datos, técnicas estadísticas univariadas y multivariadas y una sesión de discusión final donde los estudiantes trabajan y discuten sus propios proyectos.

Imagen cedida por Transmitting Science

Módulo I. Programación en R y Rstudio

  • Se proporcionó una revisión de los archivos más utilizados en cualquier flujo de trabajo de programación estadística como los scripts (.R), la memoria asignada (.RData) y los nuevos proyectos de Rstudio (.Rproj) para establecer directorios de trabajo dedicados, espacio de trabajo, historial, y documentos fuente.

Módulo II. Análisis de datos exploratorios (ADE)

  • Durante cualquier flujo de trabajo de programación estadística se debe dedicar casi la mitad del tiempo a la exploración de datos. Sin embargo, no todas las exploraciones son un ejercicio válido. En este módulo, revisaremos el supuesto más común en un análisis estadístico clásico como normalidad, heterogeneidad e independencia en los datos.

Módulo III. Análisis estadístico univariado (UniStat)

  • En el módulo III, se revisa el enfoque univariante clásico para estadística, como los modelos lineales y sus extensiones. También se cubren los análisis más comunes como ANOVA, ANCOVA o análisis de Regresión. Para aquellos casos comunes en ecología, donde los modelos lineales fallan (por ejemplo, datos no negativos en datos de conteo / abundancia), presentaremos algunas extensiones que cubren los modelos lineales generalizados (GLM)  y revisaremos algunas ideas de los Modelos Aditivos Generalizados (GAM).

Módulo IV. Análisis estadístico multivariado (MultiStat)

  • En este cuarto módulo, se cubre el análisis de datos multivariados. Revisaremos dos enfoques diferentes para comprender los datos comunitarios (multivariados) basados en diferentes técnicas de ordenación. El primer enfoque, de ordenación sin restricciones, como el análisis de componentes principales (PCA) y el escalado multidimensional no métrico (nMDS), nos ayudarán a revelar patrones dentro de los datos de nuestra comunidad. Finalmente, utilizaremos dos enfoques de ordenación restringida como el Análisis de redundancia (RDA) y el Análisis de correspondencia canónica (CCA) para comprender el papel de algunas variables ambientales (explicativas) sobre la estructura en los datos de nuestra comunidad.

La primera edición de este curso se realizó en agosto de 2020. Fue impartido en línea por Antonio Canepa (Ph.D., OMDS team, @CanepaOneto)   y coordinado por Dr. Soledad De Esteban-Trivigno (Transmitting Science).

+ CONTENIDOS

Módulo I. Programación en R y Rstudio

  • Se proporcionó una revisión de los archivos más utilizados en cualquier flujo de trabajo de programación estadística como los scripts (.R), la memoria asignada (.RData) y los nuevos proyectos de Rstudio (.Rproj) para establecer directorios de trabajo dedicados, espacio de trabajo, historial, y documentos fuente.

Módulo II. Análisis de datos exploratorios (ADE)

  • Durante cualquier flujo de trabajo de programación estadística se debe dedicar casi la mitad del tiempo a la exploración de datos. Sin embargo, no todas las exploraciones son un ejercicio válido. En este módulo, revisaremos el supuesto más común en un análisis estadístico clásico como normalidad, heterogeneidad e independencia en los datos.

Módulo III. Análisis estadístico univariado (UniStat)

  • En el módulo III, se revisa el enfoque univariante clásico para estadística, como los modelos lineales y sus extensiones. También se cubren los análisis más comunes como ANOVA, ANCOVA o análisis de Regresión. Para aquellos casos comunes en ecología, donde los modelos lineales fallan (por ejemplo, datos no negativos en datos de conteo / abundancia), presentaremos algunas extensiones que cubren los modelos lineales generalizados (GLM)  y revisaremos algunas ideas de los Modelos Aditivos Generalizados (GAM).

Módulo IV. Análisis estadístico multivariado (MultiStat)

  • En este cuarto módulo, se cubre el análisis de datos multivariados. Revisaremos dos enfoques diferentes para comprender los datos comunitarios (multivariados) basados en diferentes técnicas de ordenación. El primer enfoque, de ordenación sin restricciones, como el análisis de componentes principales (PCA) y el escalado multidimensional no métrico (nMDS), nos ayudarán a revelar patrones dentro de los datos de nuestra comunidad. Finalmente, utilizaremos dos enfoques de ordenación restringida como el Análisis de redundancia (RDA) y el Análisis de correspondencia canónica (CCA) para comprender el papel de algunas variables ambientales (explicativas) sobre la estructura en los datos de nuestra comunidad.

+ EDICIONES anteriores

La primera edición de este curso se realizó en agosto de 2020. Fue impartido en línea por Antonio Canepa (Ph.D., OMDS team, @CanepaOneto)   y coordinado por Dr. Soledad De Esteban-Trivigno (Transmitting Science).

¿Te interesa este u otros cursos similares?

Share: