Comunidad Asociada Destacada - Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (CICADA)

Comunidad Asociada Destacada - Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (CICADA)#

Esta publicación es parte de una serie que destaca a las Comunidades asociadas del Proyecto Catalyst, quienes están utilizando la infraestructura en la nube del Proyecto Catalyst para avanzar en diversos proyectos en las biociencias. Nuestras Comunidades asociadas también juegan un papel vital en la configuración de nuestro modelo de gobernanza, ayudándonos a sostener, escalar y maximizar el impacto en América Latina, África y comunidades desatendidas en todo el mundo.

En esta publicación, María Inés Fariello Rico comparte cómo la asociación con el Proyecto Catalyst está impactando al Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (CICADA) en Uruguay.

¿Podrías presentarte a nuestros lectores? Cuéntanos sobre tu organización/instituto/proyecto y sobre la investigación en la que está trabajando actualmente tu comunidad.

Soy María Inés Fariello, también conocida como Maine, y formo parte de CICADA, un centro interdisciplinario que investiga ciencia de datos y aprendizaje automático. Tenemos varios proyectos que incluyen investigación bio-científica, como ecología, bioimagen, neurociencia y genómica. Estamos utilizando los servicios proporcionados por el Proyecto Catalyst para analizar datos de la población uruguaya y comprender patrones de migración, cuánto permanece de la huella nativa y qué se puede decir sobre las personas que vivían en el territorio uruguayo antes de la llegada de los europeos. Somos cinco investigadoras usando el hub, pero todo el equipo de CICADA tiene alrededor de 25 miembros.

“El Proyecto Catalyst nos permite trabajar de manera fácil y colaborativa. Las capacitaciones son atractivas, ya que son respetuosas con las personas, no se asume conocimiento previo, y los instructores son amables. De ese modo, invita a las personas a participar en los cursos. Como el conocimiento de los cursos es tan claro y los materiales proporcionados también, es fácil compartirlo con otras personas.”

¿Qué uso específico le están dando a la infraestructura en la nube? ¿Qué tipo de datos almacenan allí? ¿Qué paquetes de software utiliza tu comunidad?

Hicimos un muestreo genómico nacional de alrededor de 850 individuos (Uruguay tiene 3,5 millones de personas). Para analizar los genomas, realizamos el preprocesamiento de las muestras localmente y, una vez que tenemos los genomas en un formato de archivo de variantes (VCF, por Variant Call Format), los subimos al hub, donde utilizamos mayormente Python.

Trabajar con la infraestructura proporcionada por el Proyecto Catalyst nos brinda potencia de cómputo y facilita la colaboración, ya que es más cómodo que trabajar en clusters. Aún no hemos utilizado la infraestructura de Catalyst para fines educativos, pero planeamos usarla para un curso de bioinformática (genómica humana) que está programado para octubre de 2025.

¿Podrías contarnos cómo fue hasta ahora tu experiencia con el Proyecto Catalyst? Por ejemplo, ¿has participado en alguna capacitación ofrecida por Catalyst? ¿Qué es lo que has disfrutado más?

Mi colega Graciana Castro y yo participamos en el entrenamiento de 2i2c para Campeones y Campeonas del Hub y fue muy útil. De hecho, comenzamos a utilizar el hub inmediatamente después de esa capacitación. Todas las personas involucradas en el Proyecto Catalyst han sido amables y serviciales. Estoy deseando participar pronto en la capacitación de instructores de The Carpentries ofrecida por MetaDocencia.

A photo of a woman pointing at a laptop showing the Catalyst hub interface.

Esta foto muestra a las investigadoras de CICADA, Lucía y Micaela, utilizando la infraestructura para analizar datos genómicos a nivel mundial.#

Foto cortesía de María Inés Fariello Rico.