Курс «Анализ геномных данных» разработан в рамках образовательных программ проекта «БиоЛогика» для специалистов в области биомедицины. Секвенирование геномов в последние десятилетия стало одним из основных исследовательских инструментов в молекулярной биологии и смежных разделах науки. Ключевым фактором в научном и практическом применении технологии секвенирования является не собственно получение массивов геномных данных, а их интерпретация, которая, в свою очередь, требует владения соответствующими методами анализа. Данные практический курс помогает молодым специалистам познакомиться с современными методами анализа геномных данных.

Апробация курса прошла 2–11 июля 2012 года в Новогорске.

День 1

9:00 Лекция и практикум: Введение в язык программирования R и набор модулей Bioсonductor (часть 1)
12:00 Обед
13:00 Лекция и практикум: Введение в язык программирования R и набор модулей Bioсonductor (часть 2)
16:30 Ужин
19:00 Знакомство: слушатели представляют свои научные проекты

День 2

09:00 Лекции: статистические аспекты анализа геномных данных (обзор статистических тестов, оценка значимости, p-value, поправка на множественное тестирование, дизайн эксперимента, робастность в статистике и др.)
12:00 Обед
13:00 Лекция: теории микрочипов
14:00 Лекция+практикум: Введение в классы Bioconductor для анализа микрочиповых данных
15:00 Практикум: анализ микрочиповых данных
16:00 Ужин
19:00 Доклад Rosemary Braun о ее научной работе

День 3

09:00 Лекции+практикумы: предобработка микрочиповых данных (контроль качества данных, нормализация и фоновая поправка данных Affimetrix и двухцветных систем, суммаризация данных Affimetrix)
12:00 Обед
13:00 Лекции: Оценка значимости в микрочиповых экспериментах (множестванное тестирование, линейные модели для дифференциальной экспрессии, эмперические баесовы подходы, limma)
16:00 Ужин
19:00 Доклад Mark Reimers о его научной работе

День 4

09:00 Лекция: Методы кластеризации (иерархическая кластеризация, k-means, консенсусная кластеризация)
10:30 Лекция: Уменьшение размерности (PCA, MDA, NMF, использование снижения размерности совместно с кластеризацией)
12:00 Обед
13:00 Лекция: Введение в контролируемое машинное обучение с подкреплением (базовое дерево решений, SAM/PAM, RandomForests)
16:30 Ужин
19:00 Лекция Михаила Гельфанда

 

День 5

09:00 Лекция + Практикум: Технологии высокопроизводительного секвенирования, работа с данными высокопроизводительного секвенирования
10:30 Лекция+практикум: инструменты Bioconductor для работы с данными высокопроизводительного секвенирования
12:00 Обед
13:00 Продолжение работы над утренними практическими работами
14:00 Презентация возможных самостоятельных проектов, обсуждение и начало работы над выбранными проектами
16:30 Ужин
19:00 Дискуссия: вопросы и ответы

День 6

Выполнение самостоятельных проектов

День 7

09:00 Лекция: Биологические пути и анализ наборов генов (обзор методов, простой анализ перепредставленности генов, гипергеометрический тест, методы анализа функционального обогащения: GSEA, MaxMean)
10:30 Практикум: получение аннотации для набора генов с помощью biomaRt, применение гипергеометрического теста и GSEA
12:00 Обед
13:00 Продолжение практикумов, работа над самостоятельными проектами
16:30 Ужин
19:00 Лекция: Метагеномика

День 8

09:00 Лекция: Интеграция эпигенетических и экспрессионных данных
10:30 Лекция: Теория тестов на значимость для счетных данных
12:00 Обед
14:30 Лекция: Wolfgang Huber (EMBL, Germany). Statistics of Expression Analysis with RNA-Seq
13:00 Практикум: работа с пакетами edgeR и DEseq. тестирование на уровне экзонов
16:00 Работа над самостоятельными проектами
18:00 Ужин
20:00 Lecture: Alexey Kondrashov: Detecting positive and negative selection from data on within- and between population sequence variation
21:30 Дискуссия, вопросы и ответы

День 9

09:00 Работа над самостоятельными проектами
10:00 Лекция: интегративный анализ
12:00 Обед
13:00 Лекция: краткое введение в ChIP-seq
14:00 Лекция: Olivier Elemento: ChIP-Seq
15:00 Практикум: ChIP-Seq, поиск пиков с помощью BayesPeak
16:00 Работа над самостоятельными проектами
18:00 Ужин
20:00 Lecture: Alexey Kondrashov: Detecting positive and negative selection from data on within- and between population sequence variation
21:30 Работа над самостоятельными проектами

День 10

09:00 Лекция и дискуссия: John Stamatoyannopoulos: High-resolution mapping and analysis of the human regulatory genome
12:00 Обед
13:00 Работа над самостоятельными проектами, подготовка презентаций
15:00 Представление самостоятельных проектов
16:00 Работа над самостоятельными проектами
19:00 Ужин
20:00 Lecture: Alexey Kondrashov: Detecting positive and negative selection from data on within- and between population sequence variation

 
Подробности программы по ссылке: http://biologica.org/project/genomic-data-analysis/