В данном курсе будут рассмотрены методы анализа данных, которые наиболее часто применяются при статистической обработке результатов в широчайшем круге научных и прикладных областей. Помимо теоретических заданий слушателей ожидают практические задачи, которые необходимо выполнять, используя язык программирования R. Знаний, полученных в результате прохождения данного курса, будет достаточно чтобы научиться более быстро и эффективно решать различные задачи, связанные с анализом данных.
В рамках трехнедельного курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения. Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
This course is designed to explain the fundamental of statistics. The course contains four weeks or four modules. The first module is devoted to the main concepts of statistics and data analysis. First of all we will introduce the concepts of sample, general population, descriptive statistics and normal distribution. At the end of the first module we will discuss the idea of statistical inference, one of the most important topics of our course. If you have just started to study statistics look more closely at the first week. All the lessons of the first module are extremely important to enable you to understand the rest of the course and more complicated concepts and methods of statistics. Each module contains lessons with short theoretical video lectures mixed with practical problems.
В первой части курса по анализу данных в R мы познакомились с основными этапами анализа данных в R: предобработка данных, применение статистических тестов, визуализация и презентация результатов анализа. В этом курсе мы углубимся во все вышеперечисленные этапы: научимся быстро и эффективно манипулировать с данными при помощи функций семейства apply и таких пакетов как dplyr и data.table. Мы более подробно обсудим процесс визуализации данных при помощи пакета ggplot2, а также научимся строить интерактивные графики. В последнем модуле курса мы поговорим о работе в R Markdown для создания отчетов о проделанной в R работе.
В данном курсе мы детально разберём процесс создания и применения нейронных сетей. В первую очередь, мы ставим перед собой цель объяснить основополагающие теоретические идеи и практические приёмы, использующиеся при обучении самых разных нейросетевых моделей. Первая часть курса фокусируется на алгоритмах, лежащих в основе обучения нейронных сетей, вторая больше ориентирована на практическое применение полученных знаний.
В рамках представленного курса слушатели познакомятся с операционной системой Linux и её базовыми возможностями. Наличие установленного Linux на компьютере не требуется, так как мы начнём знакомство с этой операционной системой с самого начала, а именно с ее установки.Далее в курсе будут рассмотрены основные возможности графического интерфейса Linux, которые очень напоминают знакомые большинству слушателей Windows или Mac OS X. После этого мы перейдем к изучению работы через командную строку, которая поначалу может показать не очень удобной, но постепенно станут понятны ее преимущества над графическим подходом.Следующий блок курса посвящен работе на удаленном сервере. Мы научимся заходить на него, запускать различные программы удаленно, а также копировать результаты их выполнения на свой локальный компьютер для дальнейшего анализа.Заключительная часть курса рассматривает несколько продвинутых тем, включающих в себя основы написания скриптов на языке bash, использование многофункционального текстового редактора vim и другие.В течение курса всем слушателям будет предложен ряд тестов и практических заданий на понимание и использование системы Linux. Кроме того, будет и несколько заданий по написанию небольших программ на языке bash.
В этом курсе по программированию на языке Python вы познакомитесь с базовыми понятиями программирования. Едва ли возможно научиться программировать без практики, поэтому в качестве домашних заданий вам будет предложено довольно много задач, в которых вы сможете потренировать своё умение программировать. Ваши решения будут проверяться автоматической системой, поэтому вы будете получать быструю обратную связь. В силу большого количества участников курса, преподаватели не смогут давать индивидуальных советов по каждой программе, но если у вас будут возникать проблемы, то их всегда можно обсудить с однокурсниками в комментариях к задачам. Также в курсе присутствует несколько задач повышенной сложности, которые являются необязательными для прохождения курса, однако желающие смогут поломать голову над придумыванием алгоритмов и реализацией программ к этим задачам. Курс подготовлен на базе программы Института биоинформатики.
В первой части курса «Введение в технологии высокоэффективного секвенирования» вы познакомитесь с основными типами секвенирования, их применениями, контролем качества, и многими другими аспектами применения этих технологий.Также вы научитесь самостоятельно проводить первичную обработку экспериментов, идентифицировать основные проблемы, возникающие в NGS-экспериментах, узнаете об основных используемых форматах данных и научитесь конвертировать и визуализировать их.
Курс посвящён основам филогенетики и современным методам, применяемые для построения филогении по данным последовательностей нуклеиновых кислот или белков. Кроме того, мы рассмотрим некоторые другие темы, необходимые для понимания закономерностей эволюции.
Курс познакомит слушателей с основными методами генной инженерии, применяемыми в лабораторной практике. В течение четырех недель мы рассмотрим базовые подходы к получению рекомбинантных ДНК, полимеразную цепную реакцию, ее модификации и их применение. Мы затронем понятие молекулярного клонирования и проведем краткий обзор технологий высокопроизводительного клонирования. В последних модулях мы поговорим о подходах к синтезу генов и целых геномов с нуля и о том, как генная инженерия применяется к задаче синтеза белков в различных организмах.
В данном курсе мы завершаем введение в наиболее распространенные методы анализа данных. Мы подробнее разберем методы регрессионного анализа, уделив особое внимание методам диагностики регрессионных моделей. Познакомимся с такими продвинутыми методами как смешанные регрессионные модели, узнаем что такое bootstrap и как его применять для проверки гипотез. Помимо теоретических заданий слушателей ожидают практические задачи, которые необходимо выполнять, используя язык программирования R. Данный курс будет полезен как для слушателей из академических, так и из прикладных областей.
В этом курсе вы узнаете фундаментальные принципы языка Python: как интерпретатор исполняет код, где он хранит переменные и данные, как определяются свои собственные типы данных и функции — на всё это мы приоткроем завесу тайны.Невозможно научиться программировать без практики, поэтому в качестве домашних заданий вам будут предложены задачи разной сложности и направленности: одни для закрепления материала, а другие, чтобы развить смекалку и найти способ, как применить только что изученный материал. Ваши решения будут проверяться автоматической системой, поэтому вы будете получать быструю обратную связь.В конце курса мы рассмотрим реальные задачи, с которыми может столкнуться современный человек, и научимся их решать средствами языка Python.В силу большого количества участников курса, преподаватели не смогут давать индивидуальных советов по каждой программе, но если у вас будут возникать проблемы, то их всегда можно обсудить с однокурсниками в комментариях к задачам (только не выкладывайте в задачах код -- это запрещено правилами курса и такие комментарии будут удаляться).
Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.
В рамках данного курса мы подробно разберем все основные этапы анализа данных при помощи R. Слушатели научатся без труда манипулировать данными, используя как стандартные методы R и Rstudio, так и специальные пакеты и библиотеки. Мы выясним, как применять основные методы статистического анализа: t-тест, корреляция, регрессия, дисперсионный и регрессионный анализ и др. Также мы научимся писать собственные функции в R. Особое внимание в курсе будет уделено визуализации получаемых результатов.
В этом курсе мы рассмотрим R в первую очередь как язык программирования, а не как инструмент для применения конкретных алгоритмов. В программе представлены основные типы данных и универсальные семантические правила, а также затронуты некоторые сложные темы, связанные с типичными задачами, возникающими в ходе обработки и анализа данных.