Category Archives: Redes de Alta Velocidad

Seminario Internacional Grid Computing

La Universidad de los Andes organizó un Seminario Taller con la colaboración del proyecto EELA (E-Infrastructure shared between Europe and Latin America), el cual fue apoyado por el Ministerio de Educación. Estuve allí esta mañana con gorra de Ministerio, y fue mi primera oportunidad de bloguear in situ y grabar in situ, todo en simultánea. Los posts fueron publicados poco después de cada conferencia, así que también logré reportar casi en vivo. Adicionalmente, tomé fotografías del asunto, así que este post tiene como intención compilar y organizar toda la información que, increiblemente, se produjo en una sola mañana.

Comentarios, dudas o sugerencias son muy bien recibidos.


Educast Colombia #2: Seminario Grid

EduCastColombia #2: Seminario Grid Computing

Marzo, 2007

Estos son los registros sonoros de la sesión de la mañana del Seminario Internacional Grid Computing, organizado por la Universidad de los Andes en Bogotá.


Seminario Grid: Experiencia EGEE

Esta charla está a cargo de Robert Jones, director del proyecto EGEE, del CERN.

Esta es una presentación por videoconferencia. Llevamos ya casi tres minutos con el video del conferencista (algo cortado) y con problemas de audio que se están solucionando.

Siguiente problema: La sincronización de los slides de la presentación. Um, ahora veo que lo que logramos en el seminario del año pasado fue MUY bueno. Valdría la pena sacar un pequeño conjunto de recomendaciones en este sentido para RENATA…

Ya vamos en 5 minutos y finalmente Robert Jones nos oye. Este tipo de cosas son importantes para que detectemos los aspectos que tenemos por resolver todavía, para lograr que las videoconferencias en eventos masivos sean exitosas…

Finalmente, aquí vamos! El video y el audio se ven bastante bien! No se logró sincronizar la presentación de manera remota.

Nada que funciona la presentación de las dispositivas. Los operarios deberían tener radios para comunicarse rápidamente…

So far (9:31), we are in talking head mode… How frustrating…

EGEE es el proyecto de servicios financiado por UE. Robert está hablando de la diversidad de proyectos que existen en EGEE, los que ya han sido mencionados en conferencias anteriores. La cantidad de información y procesamiento necesarios son impresionantes, como ya se ha dicho.

(El video se congela de vez en cuando. Algunas personas ya están bastante dispersas...)

La diapositiva 6 (si pudiéramos verla) muestra una imagen de Google Earth que muestra la distribución de los sitios conectados a la infraestructura de eScience, que ya son al menos 220 sitios.

(Ya vamos en la diapositiva 7, 17:55, y todavía no tenemos proyección en sala)

(Lo lograron! En 19:11!!! Por fin podemos ver las diapositivas!)

EGEE provee servicios de entrenamiento, helpdesk, eventos en línea (conferencias, foros, etc.) y cuenta con experiencia en aplicaciones grid.

Diapositiva 8: La misma que nos mostraron en la conferencia anterior, de cómo están distribuidos los proyectos GRID con los que colabora EGEE. NAREGI en Japón, TeraGrid y OSG en Estados Unidos. Con apoyo de la Unión Europea, EUChinaGrid e EUIndiaGrid en Asia, EELA en Latinoamérica. En Europa, KnowARC, BalticGRID, DEISA, EGEE, SEE-GRID EUMedGrid.

Diapositiva 9: La interoperabilidad es crítica para ofrecer servicios a comunidades de usuarios globales. Hay un grupo llamado Grid-Interoperability-Now que hace parte del OpenGridForum, trabajando en este tema. Robert señala la importancia de trabajar a partir de las necesidades de las comunidades.

Diap10: Promoción de la conferencia EGEE 2007, que se hace el 15 de Octubre en Budapest, Hungría.

Diap11: gLite es un middleware liviano para computación grid, que construye sobre la experiencia y componentes existentes de VDT, EDG/LCG y otros (qué cantidad de siglas tan impresionante!). gLite tiene un enfoque SOA, de componentes conectables entre sí. La licencia de uso se está moviendo a Apache2.

Diap12: Componentes de gLite: Acceso, Seguridad, Gestión de datos, Gestión de la carga de trabajo, Información y monitoreo. Hasta el momento, lo que veo con mucha más claridad es la complejidad del problema de los grids. Esta claridad no la tenía antes…

Diap13: El uso de la infraestructura es creciente en todas las áreas. Además, hay más sitios contribuyendo. En 2006, 17.5billones de trabajos ejecutados (6450 años-cpu). Los trabajos que nos son HEP han aumentado significativamente, llegando a 10000 trabajos por año.

Diap14: Es necesario prepararse para una infraestructura grid permanente, independiente de la financiación parcial de proyectos pequeños. Se busca llegar a una e-Infraestructura sostenible, de la mano con las redes de alta velocidad y las iniciativas nacionales existentes.

(Final de la mañana. Veo más portátiles, pero sólo a una persona que parece estar tomando notas…)

Diap15 (Summary): Los grids son acerca de compartir, de trabajar con otros. EGEE opera la infraestructura grid más grande del mundo para investigación científica multidisciplinaria. La interoperabilidad es crítica para lograr el nivel de servicio deseado.

(Terminó. Fue un lío lo de las diapositivas, pero salieron adelante).


Seminario Grid: Grid as a tool for eScience

Una más, esta vez a cargo de Dominique Boutigny, director de CC-IN2P3 (No entiendo cómo logran los franceses manejar tantas siglas... Estoy impresionado).

De nuevo, la idea de los grids es servir de intermediario para el procesamiento de cantidades masivas de datos que permiten realizar investigación fundamental. Es el cambio de la computación centralizada a la computación distribuida.

En los 80s CERN producía 2TB de datos. En los 90s subió a 15TB, procesados en CERN. En el 2000, estamos hablando de 1PB de datos, con procesamiento distribuido en cinco sitios, con un poder equivalente a 4000CPU actuales. Ahora estamos hablando de 10 billones de colisiones de partícuas por año, que generan 10-15PB de datos, con miles de personas involucradas en los experimentos.

Si se apilaran CD-ROMs, la cantidad de información generada en un año tendría alrededor de 20Km de altura… Es indispensable usar enfoques GRID.

La idea de la computación en malla empezó a tomar fuerza en el mundo HEP (High Energy Particles) en 1999/2000. En 2001 CERN lanzó el proyecto European DataGrid.

Enabling Grids for E-sciencE (EGEE) es el sucesor de los esfuerzos iniciales. Mayor alcance, más participantes. La idea de EGEE es proveer servicios, no infraestructura. De esto se encarga el proyecto W-LCG, a través del desarrollo de un modelo de conexión jerárquico: La capa central (T0) se conecta a la siguiente capa (T1) mediante enlaces de 10Gb/s. A su vez, las instituciones en esta capa se conectan entre si y con otras capas mediante los enlaces provistos por las redes de alta velocidad locales.

El crecimiento exponencial de la cantidad de información es un reto técnico en almacenamiento (discos, cintas) y en provisión de energía eléctrica.

Pero el grid no se dedica sólo a física de partículas. TEGEE tiene una organización biomédica muy activa.

SRB es un data grid desarrollado por el San Diego SuperComputing Center. Permite almacenar, distribuir y reproducir datos en un entorno distribuido, gestiona metadatos y es una solución elegante para datos distribuidos.