3 al 5 y del 24 a 26 de julio de 2017  9.00 a 18.00 hs.
CIFASIS (Rosario)

Docente:

  • Ing. Mg. Laura Angelone
  • Dra. Débora Arce
  • Lic. Esp. Mauro Gismondi
  • Lic. PhD. Javier Murillo
  • Ing. PhD. Flavio Spetale.

Docente invitado: Lic. Cristian Rohr

Objetivos

  • Introducir y entrenar a los estudiantes en la lógica de la programación orientada al desarrollo de aplicaciones y metodologías bioinformáticas que permitan analizar y resolver problemas biológicos in silico.
  • Conocer los formatos básicos y las herramientas necesarias para el análisis de calidad de secuencias generadas por tecnologías de secuenciación de alto rendimiento.
  • Familiarizarse con los fundamentos de programación de tareas automatizadas (scripts) en los  lenguajes PERL y R, orientados al procesamiento y análisis de secuencias de ADN/ARN y Proteínas. Utilización de módulos de R/BioPerl y paquetes de R/Bioconductor.

Contenidos:

Resolución de problemas algorítmicos. Análisis de problemas. Definición de Algoritmo. Diseño de algoritmos. Estrategias de resolución. Programación estructurada. Diferencia entre programación y empleo de utilitarios. Acciones primitivas. Estructuras de control. Buenos hábitos de programación. Programación modular. Subalgoritmos. Estructuras de datos. Ordenamiento y búsqueda. Ejercitación en Lenguaje R.

El lenguaje R. Tipo de Datos. Asignación de variables. Estructura de datos: Vectores, listas, matrices y data frame. Operaciones con archivos: lectura, escritura y extracción de datos desde planillas de cálculos tradicionales. Funcione. Estructuras de control. Nociones de gráficos. Nociones para la extracción datos desde una pagina web. Manipulación de secuencias basadas en el uso de utilidades de la distribución R base.

Formatos de archivos de uso más frecuente en Bioinformática. Fasta, GenBank, Embl, Pdb. Secuenciación de nueva generación (NGS): secuenciación de genomas, transcriptomas (RNA-Seq), y secuenciación de sitios de unión a factores de transcripción (Chip-Seq; DAP-Seq). Archivos relacionados a la tecnología de secuenciación masiva: FASTQ. BAM. SAM. BED. UCSC. Calidad de los archivos NGS. Uso de Samtools. Bedtools. Plataforma Galaxy: manejo de datos NGS, conversión de archivos, manipulación archivos de texto. Archivos de Anotaciones: GTF, GFF, TBL, BioMart

El lenguaje Perl. Aplicaciones. Fortalezas y debilidades. El intérprete Perl. Variables y sintaxis básica. Escalares y cadenas. Arreglos y tablas asociativas. Biblioteca de funciones en Perl. Funciones y operadores para escalares y cadenas. Expresiones regulares. Funciones para arreglos. Funciones sobre tablas asociativas. Estructuras de control. Subrutinas. Módulos. Creación de módulos. Utilización de módulos desde un programa. CPAN.

BIOPERL. Instalación de Bioperl. Cómo y dónde conseguir documentación de módulos. Extracción de anotación de un registro GeneBank. Convertir un registro GeneBank en otros formatos. Manejo de secuencias multifasta. Obtención de estadistica básica de secuencias. Operaciones con archivos y directorios: Manejo de archivos. Manejo de directorios. Procesando resultados de BLAST. Entrada, salida y formateo de datos. Llamadas al sistema operativo.Acceso remoto a bases de secuencias y BLAST.

6. CRAN. Bioconductor, definición, historia y sumario. Manejo de NGS. Input and Output: rtracklayer, Rsamtools, ShortRead. Manipulación de Secuencias: Biostrings. Manipulaciones basadas en Rangos: IRanges, GenomicRanges. Anotaciones: GenomicFeatures, AnnotationDbi, Bsgenome. Mapas de calor (Heatmap)

Programa analítico de prácticos (carga horaria 30hs)

  1. Nociones básicas de Linux. Instalación de R y Perl en Linux Ubuntu.
  2. Ejercicios en R para conocimiento del lenguaje: Operaciones con datos biológicos, uso de funciones, manejo de strings, gráficos. Trabajo integrativo orientado al manejo de secuencias biológicas.
  3. Ejercicios en Perl para conocimiento del lenguaje. Transcripción de una secuencia de DNA. Pattern matching en secuencias biológicas. Ejercicio de creación de subrutinas y módulos.
  4. Manejo de secuencias NGS con Bioconductor, comandos GNU y plataforma Galaxy.
  5. Trabajo integrador.

Actividades y formas de evaluación
La metodología de la actividad consistirá en clases teóricas/prácticas.
Para la aprobación se deberá entregar un Trabajo Práctico de lógia de programación codificado en lenguaje R (base) y un “script” programado en Perl para resolver un problema bioinformático (aplicación).

Requisitos para la aprobación
Asistencia al 75 % de las clases y obtención de 6 puntos sobre 10 en cada una de las actividades de evaluación.

Profesionales a los que está dirigido el curso
Biólogos, Ingenieros Agrónomos, Licenciados en Genética, Licenciados en Biotecnología, Licenciados en Análisis de Sistemas, Ingenieros Electrónicos, Licenciados en Estadística y carreras afines a Bioinformática.

Condiciones de ingreso
Ser egresado o alumno del último año de una carrera de Universitaria relacionada con las Ciencias Biológicas con concocimientos basicos de bionformatica .

Carga horaria:
40 hs. clases Teóricas/Prácticas, presenciales.

Arancel: $2000

Bibliografía:

  • Conrad Bessant, Ian Shadforth , Darren Oakley (2014) Building Bioinformatics Solutions: with Perl, R and MySQL. Second Edition Oxfordf University Press.
  • Joyanes, L.(2003) Fundamentos de Programación. Algoritmos, Estructuras de datos y Objetos, 3ª Ed., McGraw-Hill.
  • Introduccion a R – R Development Core Team (2000) https://cran.r-project.org/doc/contrib/R-intro-1.1.0-espanol.1.pdf
  • R. Gentleman, V. Carey, W. Huber, R. Irizarry, and S. Dudoit (2005) Bioinformatics and Computational Biology Solutions Using R and Bioconductor. Springer.
  • The Perl Programming Languaje. www.perl.org
  • Tom Christiansen, Nathan Torkington (1998) Perl Cookbok. O’Reilly.
  • Jose Miguel Prellezo Gutierrez (2002) Perl 5.0 Un lenguaje multisuso. http://ibon.unizar.es/admin/doc/perl/iespana.es/Perl.pdf
  • James Tisdall (2001) Beginning Perl for Bioinformatics. An Introduction to Perl for Biologists. O’Reilly.
  • BioPerl. http://bioperl.org/
  • Peter Schattener. (2007) BioPerlTutorial -a tutorial for bioperl. https://classes.soe.ucsc.edu/bme060/Winter07/bptutorial.html

Leave a Reply