Яндекс.Метрика

    Обучение

    Отделение интеллектуальных систем РГГУ: взгляд преподавателя

    Мой предыдущий пост, посвященный использованию бесплатного статистического пакета R при обучении статистике, вызвал очень полезное (по крайней мере для меня) обсуждение. При этом один из участников предложил мне описать свой опыт преподавания в более широком контексте. Этот пост — попытка суммировать свой 15-летний опыт преподавания на отделении интеллектуальных систем РГГУ.
    В настоящее время в нескольких ВУЗах Москвы существуют кафедры и отделения, обучающие специальностям «Искусственный интеллект», «Интеллектуальные системы» и т. п. Среди них — кафедра «Математическая теория интеллектуальных систем» мехмата МГУ, кафедры № 29 «Управляющие интеллектуальные системы» и № 22 «Кибернетика» МИФИ, базовая кафедра «Интеллектуальные системы» ФУПМа МФТИ в ВЦ РАН…

    Менее известным является отделение интеллектуальных систем (в гуманитарной сфере) РГГУ. Идейным вдохновителем создания этого отделения и его руководителем является д.т.н., профессор Виктор Константинович Финн. Волей судьбы мне повезло учиться у него и работать под его руководством в ВИНИТИ РАН и на описываемом отделении. Принципы, заложенные в основу отделения, свободно обсуждались В.К. Финном со своими сотрудниками, поэтому, надеюсь, мое изложение их будет близким к оригиналу. Сделаю оговорку, что это — мое изложение, поэтому оно будет таким, как я это понимаю.

    Сейчас, в связи с переходом обучения на систему «бакалавр-магистр» учебные планы будут изменяться, поэтому в своем изложении я попытаюсь отразить улучшения (и ухудшения), привносимые в учебный процесс этой реорганизацией. В 2008 году ОИС РГГУ выиграло тендер Федерального агентства по образованию РФ на создание учебных программ по специальности «Интеллектуальные системы в гуманитарной сфере». Поэтому, описываемые принципы предполагается внедрять во всех университетах России, обучающих студентов по этой специальности.

    Идейно преподавание специальности ИСвГС разделяется на несколько блоков учебных дисциплин, проходящих через все обучение.

    Первый — прикладная математика:
    • математический анализ,
    • алгебра,
    • дискретная математика,
    • теория вероятностей и математическая статистика,
    • вычислительная математика,
    • алгебраические методы в информатике,
    • теория реляционных баз данных.

    Второй блок — логика:
    • математическая логика,
    • теория алгоритмов,
    • математическая лингвистика,
    • аксиоматические системы и элементы теории моделей.

    Третий — программирование:
    • программирование на языках С и С++,
    • операционные системы,
    • логическое программирование,
    • программирование БД,
    • введение в Windows-программирование (модель COM),
    • Интернет-программирование (язык Javascript).

    Четвертый — интеллектуальные технологии:
    • информационные системы,
    • интеллектуальные системы,
    • машинное обучение.

    Конечно, имеется некоторое число обязательных дисциплин общегуманитарного цикла.

    Большое количество дисциплин отнесено к вариативной части (могут выбираться студентами): генетические алгоритмы и нейросети, нечеткие множества, теория случайных процессов, теория сходства, параллельное программирование, онтологии и представление знаний и др. Многие из этих курсов в РГГУ читаются привлеченными специалистами.

    Исторически имеется большой блок лингвистических дисциплин: морфология, синтаксис, семантика, лексикография, компьютерная лингвистика. Из-за сокращения нагрузки на студента, в новых планах эта часть будет значительно сокращена.

    Однако, идеальность такого построения учебных планов наталкивается на реальные трудности. Главной из них считаю непонимание абитуриентами того, куда они поступают, какие предметы базовые, кем они станут после окончания ВУЗа. Другая трудность — несогласованность учебных курсов.

    Попробую объяснить это на личном примере. Я преподавал и преподаю курсы «Аксиоматические системы и элементы теории моделей», «Машинное обучение», «Логические средства интеллектуальных систем».

    Так как последний курс зависит от первого, а также от базового курса «Математическая логика», читаемого самим В.К. Финном в первых двух семестрах, то мне удавалось согласовать материал так, чтобы избежать дублирования (организовав, конечно, напоминание материала). Должен сказать, что студенты изучив метод аналитических таблиц на 1 курсе, в большинстве своем могут использовать его на 5 курсе, когда они изучают «Логические средства …».

    С курсом «Машинное обучение» ситуация кардинально отличается. Сейчас мой курс (под влиянием моих личных научных интересов) сдвигается в сторону вероятностной теории обучения (аля В.Н. Вапник). Но курс теории вероятности и статистики не предполагает изложение нужного мне материала (неравенства Чернова, метод повторной выборки и т. п.). Поэтому я вынужден прерывать изложение материала вставками из теории вероятностей. И все равно, как я считаю, понимания у студентов не появляется. Уж слишком сильно отличается вероятностный материал от алгоритмического. Также мной наблюдается факт полного забывания студентами материала о NP-полноте (это нужно для доказательства того, что иногда обучающегося алгоритма не существует). Это усугубляется еще тем обстоятельством, что курсы «Теория алгоритмов» и «Теория реляционных БД» трактуют ее в разных терминах. Наконец, про теорию информации по Шеннону (нужно для изложения алгоритма ID3 обучения деревьям решений) студенты ничего не знают вообще!

    В этом году я даже решился прочитать курс математической статистики, согласовав его с курсом теории вероятностей. Боюсь, правда, что это поможет мне только через год, когда третьекурсники начнут изучать «Машинное обучение».

    По поводу же неправильного целеполагания и неумения выделить главное у абитуриентов и студентов могу добавить лишь, что наблюдаю усердное изучение ими математического анализа, который они к 5 курсу благополучно забывают, так как (кроме как в курсе вычислительной математики) нигде не используется. Да и методы численного анализа наши выпускники, по моему мнению, вряд ли когда будут разрабатывать самостоятельно.

    Как я понимаю, большинство способных выпускников ОИСвГС РГГУ устраивается на работу компьютерными лингвистами в компанию ABBYY, так как конкурировать со студентами ВМиК МГУ и ФУПМ МФТИ за места программистов они не могут. Другая дорога — фрилансеры. По моему мнению, только несколько человек из почти 15-летнего выпуска отделения занимаются программированием (особенно интеллектуальных систем).

    В качестве позитива расскажу о научных направлениях, в которых принимают участие наши студенты. Их три: онтологии и представление знаний, компьютерная лингвистика и интеллектуальные системы.

    Первое направление посвящено разработке оригинальной системы представления знаний «ЭЗОП». Это — система формирования и использования онтологии, основанной на теории категорий и формальных грамматиках. Основным языком разработки является Prolog.

    Второе направление пытается разработать и внедрить общие модели представления лингвистических знаний, и применить их к задачам синтаксического и поверхностного семантического анализа. Основным языком разработки является LISP.

    Третье направление — создание интеллектуальных систем анализа данных в социологии, криминалистике, науках о жизни и робототехнике. Под руководством В.К. Финна группа исследователей из ВИНИТИ РАН разработала в начале 80-х годов оригинальный метод анализа данных — ДСМ