Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые пр - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
Похожие работы
Название работы Кол-во страниц Размер
Рабочая программа дисциплины опд. В. 02 «Практика аудирования» для... 1 44.6kb.
Курсовая работа Экспертные системы как прикладная область искусственного... 3 538.93kb.
Рабочая программа дисциплины б. 2 Квантитативная лингвистика и новые... 1 89.59kb.
«мати» ргту имени К. Э. Циолковского Кафедры «Прикладная математика... 1 13.63kb.
Рабочей программы по дисциплине «Полевая лингвистика» по направлению... 1 25.08kb.
Программа дисциплины Современная прикладная алгебра для направления... 1 183.4kb.
О работе научного советаран по методологии искусственного интеллекта 1 44.45kb.
Перспективные технологии искусственного интеллекта» и совещание руководителей... 1 52.53kb.
Рабочей программы дисциплины квантитативная лингвистика и новые информационные... 1 25.21kb.
Основные компьютерные технологии 1 97.33kb.
А. М. Казанцев предложение о создании глобального искусственного... 2 428.33kb.
Л. С. Риторический дискурс: когнитивно-прагматический и структурно-стилистический... 1 74.99kb.
Направления изучения представлений о справедливости 1 202.17kb.

Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические - страница №1/4

Лекция 11. Прикладная лингвистика. Моделирование языковых процессов. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры. Искусственные языки. Лингвостатистические методы. Новые информационные технологии.
Прикладная лингвистика — направление в языкознании, занима­ющееся разработкой методов решения практических задач, свя­занных с использованием языка.

Прикладные сферы языкознания издавна отличались широким разнообразием. Наиболее древние из них — письмо (графика), методика обучения родному и неродному языкам, лексикография. В дальнейшем появились перевод, дешифровка, орфография, терминоведение. Одно из традиционных направлений приклад­ной лингвистики связано с участием в языковой политике госу­дарства и формируется как языковая политика и языковое строи­тельство. Одновременно с развитием и совершенствованием классических областей прикладного языкознания во второй поло­вине XX в. наметился и определился ряд новых его направлений, которые представляют собой логическое продолжение историче­ского развития прикладной лингвистики на новом этапе, обусловленном современной научно-технической революцией, укреплением взаимосвязи общественных, естественных и техни­ческих наук. К этим направлениям относятся: обработка инфор­мации, моделирование знаний, автоматическая обработка языка в его письменной и устной формах.


Методы прикладной лингвистики. Разнообразие методов прикладной лингвистики вполне сопоставимо с разнообразием конкретных областей приложения научных знаний о языке: каждая конкретная прикладная дисциплина обладает своим уникальным набором методов. Тем не менее можно выделить нечто общее, характерное для методов прикладной лингвистики в целом. Эта общая часть хорошо видна при сравнении методических инструментариев описательной, теоретической и прикладной лингвистики.

Перед описательной лингвистикой стоит задача описания фактов языка. На первом плане при этом находится метод классификации, т.е. выявления той сетки параметров, которая позволяет охватить все существенные свойства языковых структур. Теоретическая лингвистика формирует само представление о том, какие свойства языка являются существенными, а какие – нет. Создаваемые в теоретической лингвистике концептуальные модели языка не просто описывают наблюдаемые факты, но и претендуют на их объяснение. При этом как описательная, так и теоретическая лингвистика исходят из познавательной установки, известной как «God"s Truth» («Божественная Истина»). Иными словами, классификации языковых фактов и концептуальные модели теоретической лингвистики претендуют на описание того, как действительно устроен язык.

Прикладная лингвистика также использует и метод классификации, и метод моделирования. Однако поскольку задачи прикладной лингвистики сосредоточены в области оптимизации функций языка, а оптимизация определяется конкретной задачей, то в прикладной лингвистике широкое распространение имеет познавательная установка, известная под несколько ироническим названием «Фокус-покус» (более уважительное название – «инженерный подход»). Эта установка в качестве основной ценности выдвигает не познание того, «как все обстоит на самом деле», а решение конкретной задачи, в частном случае – удовлетворение требований «заказчика», преследующего свои собственные цели. Это, впрочем, не означает, что результаты прикладных исследований не представляют никакой ценности для теории языка: напротив, прикладные модели оказывают значительное влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания.

В силу сказанного важнейшим общим свойством методов прикладной лингвистики является ориентация на создание такой модели данной проблемной области, которая отображает только те ее свойства, которые необходимы для решения конкретной практической задачи. Иными словами, если теоретическое исследование в идеале стремится к полному описанию проблемной области со всеми ее сложностями и т.п., то прикладное описание обязано удовлетворять только данной конкретной задаче. Оно, конечно, может обладать и большей, чем это необходимо для решения конкретной прикладной задачи, описательной адекватностью и объяснительной силой, но принципиально этого от него не требуется.

Суммируя основные частные отличия прикладных моделей от теоретических и описательных, можно сказать, что прикладные модели в целом ориентированы на конкретные подъязыки, а не весь язык в целом; они часто (но не всегда) требуют большей степени формализации; прикладные модели используют знания о языке выборочно; прикладные модели не делают различий между собственно лингвистическими и экстралингвистическими аспектами семантики языковых выражений; прикладные модели в существенно большей степени огрубляют моделируемый объект, чем теоретические модели и, наконец, прикладные модели не налагают никаких существенных ограничений на инструмент моделирования.

Термин «квантитативная лингвистика» характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В последней доминирующую роль занимает «неколичественный» математический аппарат – теория множеств, математическая логика, теория алгоритмов и т.д. С теоретической точки зрения, использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, т.е. создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. Иными словами, задача построения структурно-вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего фрагментами этой модели, используемыми для лингвистического мониторинга функционирования языка, дешифровки кодированного текста, авторизации/атрибуции текста и т.п.


Языковая политика
Языковая политика— совокупность общефилософских и част-нонаучных принципов и практических мероприятий по решению языко­вых проблем в социуме, государстве.

Реформы русского письма. В данном параграфе необходимо расска­зать о реформах русского письма как одного из фрагментов отноше­ния общества к языку; коллективном выборе языка и соотношении языка и власти с точки зрения Л.Р. Зиндера. Развитие русского письма, его орфографии было постепенным. Его история знала две реформы: петровскую реформу азбуки (1708—1710) и реформу ор­фографии 1917—1918 гг. Петр I вместо церковной кириллицы, ис­ключив из нее некоторые буквы, ввел новый гражданский шрифт, установил начертательное различие строчных и прописных букв (до этого использовались только прописные буквы), отменил обяза­тельность постановки знаков ударения в каждом слове, что строго соблюдалось в печатных текстах. Вторую реформу провело Совет­ское правительство, хотя готовилась она в рамках Академии наук с начала XX в. 23 декабря 1917 г. Народный комиссариат просвеще­ния издал декрет о введении нового правописания. 10 октября 1918 г. Советом народных комиссаров был издан специальный дек­рет, подтвердивший декрет Народного комиссариата просвещения. Советская реформа была вызвана необходимостью расширить сфе­ру применения новой орфографии, утвердить ее во всей советской печати. Реформа изъяла ставшие совершенно чуждыми духу русско­го языка церковно-славянские окончания -аго, -яго у прилагатель­ных, причастий и местоимений (доброго, пятого, которого, синяго и т.п.), заменив их русскими окончаниями -ого, -его (доброго, пято­го, которого, синего). Было устранено разграничение форм одни они, с одной стороны, и однђ, онђ) — с другой (первые употреблялись для слов мужского и среднего рода, вторые — для слов женского ро­да). Формы одни, они теперь предназначались для всех трех родов. Реформа изменила также написание окончаний прилагательных, причастий и местоимений женского и среднего рода в именитель­ном и винительном падежах множественного числа, которые писа­лись с окончаниями -ыя, -ия (большыя старыя липы). Была изъята форма ея (ея сестра) и оставлена только форма её (её сестра). Лик­видировалась буква ђ («ять») и другие дублетные буквы, еще оста­вавшиеся в алфавите, и т.д.

Реформа 1917—1918 гг. была первой и пока единственной ре­формой русской орфографии (петровская реформировала только азбуку).

В 1956 г. было проведено упорядочение орфографии. Это не было реформой правописания, поскольку не затронуло его основ, но уни­фикация колеблющихся написаний коснулась всех его разделов.

Кроме названных реформ и упорядочения 1956 г. были еще два не проведенных в жизнь проекта реформ, подготовленных: 1) Сектором науки Наркомпроса РСФСР в 1930 г.; 2) Комиссией по усовершенст­вованию русской орфографии при Институте русского языка АН СССР и Отделении литературы и языка АН СССР в 1964 г.

Первый из этих проектов, декларировавший равнение на малогра­мотных и неграмотных, узаконивавший малограмотные написания был отвергнут как научно не обоснованный.

Подготовка проекта 1964 г., длившаяся два года, сопровождалась большой и чрезвычайно интенсивной исследовательской работой. Научная его платформа отражала одно из направлений в теории ор­фографии (построенное на концепции Московской фонологической школы). Однако к обсуждению проекта не была подготовлена обще­ственность, что показала развернувшаяся дискуссия. Особенно ост­рой критике проект был подвергнут на страницах «Литературной га­зеты». При этом больше всего возражений вызвали первые четыре его пункта: изъять из алфавита ъ, заменив его на ь: съезд, объявление и т.п.; отменить употребление ь в грамматической функции: ноч, доч, береч, не плач и т.п.; писать огурци, циган и т.п.; писать по произноше­нию чорный, жоны, смягчонный, течот и т.п. В результате реформа была отложена.

Совершенствование русской орфографии продолжается непре­рывно, хотя и не в рамках реформы. Большая роль в упорядочении правописания принадлежит словарям. Новые правописные тенден­ции отражают различные справочники. При этом необходимость координационной работы изданном этапе языковой политики и язы­кового строительства в начале третьего тысячелетия остается актуаль­ной, в связи с чем в 1990 г. при Институте русского языка РАН была образована новая Орфографическая комиссия.
Нормирование языка.
Орфоэпия — совокупность произносительных норм национально­го языка, обеспечивающая сохранение единообразия его звукового оформления; раздел языкознания, изучающий произносительные нормы.

Культура речи — владение нормами устного и письменного ли­тературного языка, а также умение использовать выразительные средства языка в различных условиях общения в соответствии с целя­ми и содержанием речи; раздел языкознания, исследующий пробле­мы нормализации с целью совершенствования языка как орудия культуры.



Норма в языке. Для исследования литературно-языковой нормы вообще и произносительной нормы в частности, как считает Л.А. Вербицкая, необходимо изучение не только внутренних системных, но и социо­лингвистических факторов, а также определенных психологических за­конов, которые управляют речевой деятельностью людей. До сих пор остается нерешенным вопрос, существует ли норма в самом языке или она вносится в язык извне, противопоставляется ли норма кодифика­ции или не отличается от нее.

При рассмотрении одного из частных вопросов общей проблемы нормы — произносительной нормы принято различать два аспекта по­следней — орфоэпию и орфофонию.



Орфоэпия и орфофония. В самом общем виде можно сказать, что орфоэпия — это правила, определяющие нормативный фонемный со­став слов, а орфофония — правила произношения вариантов фонем. Так, вопрос о том. следует ли употреблять в слове тихий твердое [х] или мягкое [х'], регулируется правилами орфоэпии, а требование про­износить согласный [j] в конце слова как сонорный, а не глухой, от­носится к правилам орфофонии.

Орфоэпия для устной речи играет роль, подобную той, которую играет орфография для письменной речи (орфография определяет буквенный состав слова на письме, орфоэпия — фонемный со­став). Сознательной кодификации подвергается именно орфо­эпия, так как фонемный состав слов хорошо осознается носителя­ми языка.

Орфофонические различия носителями языка часто не осознают­ся. Вместе с тем диалектные и просторечные особенности обычно про­являются не в нарушении фонемного состава слова, а в изменении фонетических характеристик фонем, в искажении звуковой их реали­зации (например, недостаточная редукция безударных гласных, недо­статочная мягкость [с']).

Реальные пути развития произносительной нормы определяются фонологической системой языка, прежде всего существующей в ней вариантностью. Произносительная норма также характеризуется из­вестной вариантностью, которую допускает система.

При утверждении того или иного орфоэпического или орфофони-ческого варианта в качестве ведущего варианта нормы большое значе­ние имеет анализ основных тенденций развития фонологической системы. Чаще побеждают варианты, соответствующие этим тенден­циям.

Знание основных направлений развития фонологической системы имеет особое значение для кодификаторов, вынужденных сознательно выбирать один из вариантов в случаях, когда один становится ведущим вариантом нормы, а второй — отживающим. При выборе одного из ва­риантов необходимо учитывать разнообразные фонетические, фоно­логические, морфонологические и экстралингвистические факторы, опираться на экспериментально-фонетические исследования реаль­ной речи носителей языка.


Стилеметрия и атрибуция текстов.
Стилеметрия — прикладная филологическая дисциплина, зани­мающаяся измерением стилевых характеристик с целью систематиза­ции и упорядочения (типологии, атрибуции, датировки, диагностики, реконструкции и т.д.) текстов и их частей.
Стилеметрия. Термин «Стилеметрия» ввел в научный обиход немецкий филолог В. Диттенбергер, решавший в конце XIX в. проблему автор­ства диалогов Платона с помощью частот слов, реализация которых не зависит от тематики текста. В России первым «стилеметром» был Н.А. Морозов, известный писатель и разносторонний ученый. Он ис пользовал частотные распределения служебных слов для отличения плагиата от подлинных произведений.

Объектом стилеметрии является текст, созданный конкретным ав­тором, в конкретное время, в конкретной ситуации. Предметом ис­следования являются элементы стиля, которые понимаются как осо­бенности периферии характеристики объекта. Стиль может быть описан через факультативные, поверхностные признаки текста, кото­рые лишь неявным образом затрагивают его сущностные, глубинные характеристики.

Стилеметрия имеет дело с количественным классифицированием, а эта область классификационных занятий тесно соприкасается с не­сколькими научными направлениями: теорией группировок, теорией оценивания, распознаванием образов, теорией корреляции, количе­ственной таксономией, методами психологического тестирования и др. Границы между этими направлениями стираются, и сегодня мож­но говорить о комплексе подходов и методов, занимающихся теми или иными видами количественной систематизации объектов произ­вольной природы.

К настоящему времени, как показывают исследования Г.Я. Мар-тыненко и С.В. Чебанова, накоплен большой опыт в применении ста­тистического метода для решения проблемы спорного авторства (ат­рибуции) текстов; в сущности, этот метод стал хрестоматийным, причем не только в филологии (текстологии, источниковедении, сти­листике), но и в криминалистике, медицинской диагностике, соци­альной психологии.

В последние годы круг решаемых стилеметрией задач и репертуар применяемых ею методов существенно расширились. Практической повседневностью стала количественная таксономия текстов, стилис­тическое приложение нашли дешифровочные модели, относительно самостоятельное направление образовала квантитативная типология текста, начала формироваться стилистическая диагностика, большое развитие получили методы реконструкции древних текстов.

Атрибуция текстов. При решении таких традиционных филологи­ческих задач, как атрибуция анонимного или псевдонимного текста, определение или уточнение датировки текста, типология жанров и Функциональных стилей, становится очевидно, что, по мнению М.А. Марусенко, во всех вышеперечисленных случаях мы имеем дело только с одной научной задачей — либо с объединением объектов в однородные классы, либо с отнесением объекта (группы объектов) к какому-либо классу, либо с определением меры близости/удаленнос­ти между разными объектами (группами объектов).

При всей актуальности этих проблем и несмотря на то, что работа над ними ведется со времен филологов-классиков, нынешнее состо­яние дел не позволяет однозначно и с фиксированной достовернос­тью производить атрибуцию анонимного или псевдонимного текста как и другие классификационные процедуры. Произведения ано­нимного или спорного авторства существуют в любой литературе. До настоящего времени процедура атрибуции таких текстов сводилась к тому, что филолог-литературовед, хорошо знакомый с периодом, в который был написан спорный текст, и с творчеством писателей, ра­ботавших в то время, пытался найти те или иные доказательства, поз­воляющие приписать данный текст известному ему автору. При этом самым важным являлись свидетельства внешнего характера, такие, как биографические данные предполагаемого автора, его пребыва­ние в данном месте, круг его знакомств, переписка, политические взгляды и т.д. Пользуясь этим методом, разные исследователи зачас­тую приходят к совершенно противоположным выводам относитель­но предполагаемого автора анализируемого текста. Необходимо учи­тывать и субъективный фактор, который оказывает негативное воздействие в двух планах: с одной стороны, исследователи выбира­ют в качестве оснований для атрибуции те критерии, которые лучше «укладываются» в их гипотезу, с другой — проявляется отчетливая тенденция приписывать спорные тексты перу наиболее крупных и значительных писателей.

Новые перспективы в этой области открываются при комплекс­ном подходе к проблеме атрибуции, когда для признания принадлеж­ности анализируемого произведения данному автору необходимо учитывать доводы по меньшей мере трех основных групп: а) биогра­фические; б) идеологические; в) стилистические. Чем большее число разных методов используется в процессе атрибуции, тем выше его точность и надежность, достоверность окончательных выводов.

Совершенствование исследовательских приемов связано с исполь­зованием средств и методов прикладной лингвистики, а также с чет­ким разграничением сферы действия и возможностей традиционных филологических методов, их комплексным сочетанием со статисти-ко-вероятностными методами, разработанными для решения класси­фикационных задач и применяемых для задач атрибуции на основе межнаучного переноса.
Стиховедение.
Стиховедение — отрасль филологии, изучающая стихотворную природу литературного произведения; разделы стиховедения — фони­ка, метрика, ритмика, строфика.

Стихотворный текст в лингвистике. Стиховедение — это дисциплина, находящаяся на стыке лингвистики и литературоведения. Стихо­творный текст интересует лингвистику как особого рода речь. Спе­цифику этой речи определяют прежде всего метрика, ритмика, риф­ма и строфика.

Предметом изучения стиховедения являются: а) принципы орга­низации стихотворного текста, отличающие его от прозаического; б) отражение этих принципов в тексте; в) вытекающие из них другие стороны звуковой организации текста.

Приведем мнение относительно всех этих проблем, принадлежа­щее М.А. Красноперовой.

В XX в. стиховедение активно опиралось на математические мето­ды исследования, связанные в основном со статистической обработ­кой текстовых данных. Используемый аппарат переносился в стихове­дение в готовом виде или разрабатывался специально применительно к его задачам. Такое направление исследований называется матема­тическим стиховедением. Направление стиховедческих исследований, обслуживающее внешние по отношению к стиховедению задачи, на­зывается прикладным стиховедением.

Наиболее развитыми направлениями математического стиховеде­ния в метрике и ритмике являются вероятностно-статистическое мо­делирование и автоматизация.

Прикладное стиховедение. Прикладное стиховедение может обслу­живать литературоведческие, лингвистические и другие задачи. В об­ласти литературоведения значимость стиховедческих исследований обусловлена тем, что они являются частью поэтики — науки о строе­нии литературного произведения. Цели, выдвигаемые поэтикой пе­ред стиховедением, связаны, с одной стороны, с изучением жанровых и стилистических типов, с другой — с изучением свойств отдельных произведений, творчества определенного автора, школы, литератур­ной эпохи и т.д.

Прикладное стиховедение находит применение в поэзии и худо­жественном переводе. Даже близкие разноязычные системы стихо­сложения, например русский и английский ямб, различаются осо­бенностями в деталях. Во многих случаях арсенал стихотворных форм в разных языках настолько различен, что без тщательного изу­чения принципов и практики иноязычного стихосложения становит­ся невозможным качественный перевод. Совмещение переводческой и стиховедческой деятельности вполне обычно. Н.И. Гнедич, созда­тель классического русского перевода «Илиады» Гомера, был одно­временно и создателем классической формы русского гекзаметра. Сам он опирался на гекзаметр, созданный в переводческой работе В.К. Тредиаковского. Переводчиками являются крупные стиховеды нашего времени — М.Л. Гаспаров, А.Л. Жовтис и др.

Задачи стиховедения в области лингвистики определяются тем, что стихотворные тексты представляют собой речь особого рода. В си­лу этого лингвистический интерес имеют любые результаты их стихо­ведческого анализа. Лингвистика дает лишь свое направление в ос­мыслении этих результатов. Один из аспектов данного направления касается взаимоотражения стиховедческих и общелингвистических категорий — грамматики, фонетики, стилистики. Сюда относятся та­кие проблемы, как ритм и синтаксис, ритм и интонация, стилистиче­ские типы ритма и др. Самодовлеющую роль в ритмическом строении стиха играет его слоговая организация. Изучение свойств слоговых структур может быть продуктивным направлением прикладного сти­ховедения.
Дешифровка.
Дешифровка — изучение сообщений или текстов для обнаружения информации, закодированной или представленной способом, неиз­вестным исследователю.

Объекты и задачи дешифровки. Объектами дешифровки, по мнению Е.Д. Савенковой, являются тексты на языках каких-либо народов или записи на иных знаковых системах (ноты, картографические доку­менты, математические формулы и т.д.). Этим определяется различие между лингвистической и нелингвистической дешифровкой. Послед­няя лежит за пределами языковедческих дисциплин, но ее роднят с ними общие семиотические закономерности.

Лингвистическая дешифровка включает в себя исследование исто­рических письмен и чтение тайнописи (криптограмм). В первом слу­чае непонятность текста для исследователя обусловлена разрывом традиции, во втором — специальными усилиями, предпринятыми ав­тором или шифровальщиком, чтобы сузить круг адресатов.

Лингвистическая дешифровка в широком смысле слова предпола­гает решение задач четырех типов.


  1. Неизвестна только письменность, язык известен. Аналог: про­стой шифр, основанный на замене. Решение этой задачи, т.е. установ­ление чтения забытых знаков, есть дешифровка в узком смысле слова.

  2. Неизвестен только язык, письменность известна. Аналог: код, решение этой задачи, т.е. установление значения единиц языка, зву­чание которых известно, называется интерпретацией.

  3. Неизвестный язык записан неизвестным письмом. Аналог: за­шифрованный код. Решение этой задачи, т.е. установление и звуча­ния, и значения языковых единиц, называется раскрытием.

Чтение, перевод и анализ особенностей конкретного текста, за­писанного на неизвестном языке или неизвестной письменностью.

Хотя такая деятельность, опирающаяся на решение приведенных вы­ше задач, относится уже к области филологии, она качественно от­лична от анализа текста на хорошо известном языке, поэтому ее называют дешифровкой текста.


следующая страница >>



Право на фразу (очень старую) о непреодолимых барьерах между людьми имеет лишь тот, кто пытается эти барьеры преодолеть. Кароль Ижиковский
ещё >>