Отзы в о магистерской диссертации - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
К магистерской диссертации «Анти-Танзимат: общественно-политические... 1 12.43kb.
График разработки и подготовки к защите магистерской диссертации... 1 60.27kb.
Магистерской диссертации Пахорукова Константина Игоревича «Внешнеполитические... 1 20.61kb.
Тема магистерской диссертации: «Сетевой анализ патентной деятельности... 1 13.31kb.
Демина Мария Олеговна Адрес 1 29.03kb.
Отчет должен быть представлен не позднее 29 июня на кафедру для Афанасьевой Т. 1 84.79kb.
Клиймук А. В. Аннотация к магистерской диссертации 1 11.54kb.
Положение о магистерской диссертации 1 126.11kb.
Форм-факторы в процессах с участием сильновзаимодействующих частиц 1 41.78kb.
Резюме магистерской диссертации Богдановой Анны Петровны «Проблемы... 1 21.55kb.
Резюме к магистерской диссертации Кругловой Татьяны Олеговны. 1 19.81kb.
Кафедра Вычислительной техники 1 44.22kb.
Направления изучения представлений о справедливости 1 202.17kb.

Отзы в о магистерской диссертации - страница №1/1



О Т З Ы В

о магистерской диссертации
«Использование машинного обучения при автоматическом определении пола авторов комментариев в русскоязычных социальных сетях»,
выполненную А.С. Шепелевым, магистром 2 курса кафедры математической лингвистики филологического факультета Санкт Петербургского государственного университета
Магистерская диссертация А.С. Шепелева посвящена решению важной практической задачи— оценке различных алгоритмов машинного обучения при анализе коротких русскоязычных текстов разговорного стиля.

Машинное обучение возникло в 1950-е годы на основе теорий статистического управления и математической оптимизации, но бурный расцвет данного научного направления начался уже в начале XXI века. С помощью алгоритмов машинного обучения сегодня создаются самые современные инструменты обработки естественного языка. Однако основные исследования в этой области недоступны для широкой научной общественности, поскольку они ведутся за стенами коммерческих компаний. Поэтому данные, представленные в работе А.С. Шепелева, представляют заметную ценность для академических кругов в России.

В работе сравниваются наиболее распространенные алгоритмы машинного обучения с учителем: «наивный» байесовский классификатор, полиномиальный «наивный» байесовский классификатор, дискриминантный полиномиальный «наивный» байесовский классификатор и метод опорных векторов с последовательной оптимизацией. Для каждого из этих алгоритмов рассматривались наборы признаков двух объемов: большого и малого. Векторы для каждого набора формировались двумя разными способами: на основании вхождений и на основании частот. Таким образом, А.С. Шепелев сравнивал 16 различных конфигураций алгоритмов.

Работа А.С. Шепелева обладает тремя важными достоинствами, по одному на каждую главу магистерской диссертации.

Первая глава представляет собой введение в машинное обучение. А.С. Шепелев не только рассматривает и описывает основные методы этого научного направления, но и приводит обзор существующих прикладных исследований русского языка, выполненных с помощью машинного обучения. Учитывая острый дефицит вводных текстов о машинном обучении на русском языке, подобный обзор представляет большую ценность для прикладных лингвистов, желающих познакомиться с этой областью.

Во второй главе А.С. Шепелев разрабатывает процесс адаптации программы Weka для анализа русскоязычных данных. Ранее эта популярная программа не использовалась при обучении на материале русского языка. А.С. Шепелев исследовал, какие параметры, мета-алгоритмы и фильтры этой программы необходимо использовать для корректной обработки русскоязычных текстов. С помощью разработанных им рекомендаций, российские исследователи могут легко использовать указанную программу для машинного обучения на материале русского языка. Хочется предложить А.С. Шепелеву выложить полученное описание в открытый доступ для широкого использования. Возможно, его имеет смысл также отправить разработчикам ПО Weka для размещения его в качестве инструкции на официальном сайте программы с указанием фамилии автора и кафедры математической лингвистики СПбГУ.

Третья глава содержит описание проведенного эксперимента. В этой главе сравниваются различные конфигурации алгоритмов машинного обучения. Лучший результат был получен при использовании полиномиального «наивного» байесовского классификатора на большом количестве признаков.

В соответствии с жанром отзыва позволим отметить ряд положений дискуссионного характера.

1. В ходе исследования автору удалось выявить наиболее точный алгоритм при анализе собранного корпуса. Им оказался полиномиальный «наивный» байесовский классификатор на большом количестве признаков. Но будет ли этот же алгоритм наиболее эффективным при анализе высказываний из других социальных сетей, например, «Живого журнала», а также при анализе дискуссий на форумах отечественных СМИ. Чем был обусловлен выбор «Твиттера» при создании обучающего корпуса?

2. В какой мере представительными является использование для обучающей выборки высказываний жителей только трех городов России: Москвы, Санкт-Петербурга и Новосибирска? В крупных городах стилистические особенности речи нивелируются, особенно это касается гендерных различий в молодежной речи. А ведь именно молодежь чаще пользуется социальными сетями. Интересно было бы повторить подобный эксперимент на материале высказываний жителей небольших городов и деревень, разделив информантов по возрастному признаку. В таком случае, возможно, показатели полноты и точности для различных алгоритмов были бы выше. Хотя 70% точности, показанные «наивным» байесовскми классификатором — это достаточно хороший результат для современной речи.

Представляется, что указанные соображения могли бы способствовать развитию исследования. Автор магистерской диссертации А.С. Шепелев проявил себя как самостоятельный ученый, обладающий широким научным кругозором, свободно владеющий приемами компьютерной лингвистики. Ценность проведенного им новаторского исследования неоспорима.

Возглавляемая мною кафедра прикладной лингвистики на гуманитарном факультет ГУАП, в случае желания А.С. Шепелева, готова рассмотреть вопрос о трудоустройстве А.С. Шепелева для ведения семинаров в рамках учебного курса.

Магистерская диссертация А.С. Шепелева соответствует всем требованиям, предъявляемым к такого рода квалификационным работам, и заслуживает самой высокой оценки.

Заведующий кафедрой Прикладной лингвистики ГУАП

Заслуженный работник высшей школы РФ

к.ф.н. профессор

Р.А Орлов

10.06.2013 г.









Рок-музыка исполняется в таком темпе, что не успеваешь понять, какая это мелодия и у кого она украдена.
ещё >>