Введение в корпусную лингвистику

Введение в корпусную лингвистику

Учебное пособие для студентов филологических и лингвистических специальностей университетов

Пособие содержит основные сведения о корпусной лингвистике – одном из самых популярных разделов современного языкознания, целью которого является создание и использование языковых корпусов в лингвистических исследованиях. В учебнике на доступном уровне рассматриваются основы данной предметной области, перечисляются основные корпуса разных языков, показываются возможности использования методов корпусной лингвистики, а также описан вклад корпусной лингвистики в лингвистическую теорию. Учебник предназначен для студентов филологических и лингвистических факультетов высших учебных заведений. Может быть использовано аспирантами и преподавателями смежных дисциплин.

Автор благодарит The Pygos Group. A HIT Entertainment company за разрешение использовать изображение Пингу и интернет-проект «ПостНаука» за разрешение использовать видеолекцию В. А. Плунгяна.

Жанры: Языкознание, Русский язык
Цикл: Не является частью цикла
Год публикации: 2014

Читать онлайн Введение в корпусную лингвистику


От автора

Вы читаете электронный учебник, который, скорее всего, никогда не будет издан на бумаге. Вероятно, он никогда не будет издан на бумаге. У такого решения есть два преимущества. Во-первых, корпусная лингвистика тесно связана с компьютером, интернетом и электронной обработкой текстов, поэтому она идеально подходит и для электронного формата обучения. Во-вторых, я надеюсь, что купить электронное издание легче и дешевле, чем бумажное. Цена на учебник символическая, примерно столько же вы бы потратили на поездку в книжный магазин. Тем не менее, эта книга не бесплатна: она стоила определенного труда мне и моим помощникам, и ваша поддержка позволит периодически выпускать обновления. Спасибо за то, что купили!

Я бесконечно благодарен моим друзьям и коллегам, помогавшим мне советом и добрым словом: Э. Клышинскому, С. Крылову, А. Кутузову, О. Невзоровой, Л. Пивоваровой, Е. Маркасовой, А. Теснеру, А. Левиту, С. Шарову, Е. Ягуновой… – сожалею, что не могу перечислить всех! Этот учебник не вышел бы в свет без деятельного участия нескольких людей. Моя безграничная признательность – профессору Хельсинкского университета Арто Мустайоки за его содержательные комментарии, а также за финансовую поддержку издания в рамках гранта «Создание частотной грамматики русского языка». Мой смиренный поклон Ольге Митрениной, доценту кафедры математической лингвистики Санкт-Петербургского университета, согласившейся стать вторым рецензентом и нещадно критиковавшей меня как за незнание предмета, так и за незнание правил русского языка. Моя благодарность Дарье Кормачёвой, моей аспирантке, выпускнице той же петербургской кафедры, за то, что она собрала библиографию, подготовила словарь и убедилась, что все задания выполнимы. Наконец, я благодарен двум людям, превратившим текст в книгу: редактору, сотруднику Института русского языка им. В. В. Виноградова Наталии Занегиной, убравшей все неточности, повторы и ошибки, и художнице Марии Заборовской, лаконично и ясно визуализировавшей мои многословные объяснения. Спасибо вам!

Естественно, все не замеченные ими ошибки остаются на моей совести, с которой можно связаться по адресу: [email protected].

Предисловие

Корпусная лингвистика – это лингвистика корпусов, то есть собраний текстов. Для начала такого «определения» вполне достаточно. Такое направление лингвистики существует чуть более полувека, а в России это, по сути, наука XXI века: ее активное развитие пришлось на самое начало третьего тысячелетия.

О «молодости» этой дисциплины говорит, в частности, неустойчивость ударения и морфологических форм самого термина корпус и его производных: кóрпусы – корпусá, кóрпусная – корпуснáя. По моим наблюдениям, в устной речи специалисты по корпусной лингвистике предпочитают говорить корпусá, корпуснáя. Письменная норма менее стабильна: в пяти русскоязычных сборниках по корпусной лингвистике встретилось 24 формы корпуса и 27 – корпусы.

Говоря о корпусной лингвистике, следует иметь в виду два ее направления:

● создание корпусов,

● корпусные исследования, то есть исследование языка с помощью корпусных методов.


Четкой границы между ними не существует, и практически все создатели корпусов проводят в то же время и собственно лингвистические исследования. В целом, корпусная лингвистика в первом значении более технологична и предполагает совместную работу лингвистов и специалистов по компьютерным технологиям. Это не столько теоретическое направление лингвистики, сколько технология. Корпусная лингвистика во втором значении – дело лингвистов, в том числе и специалистов по статистической обработке языка. Говоря о корпусной лингвистике, часто имеют в виду второе значение (‘корпусные исследования’), но необходимо помнить, что без первого в принципе не существовало бы и второго. В настоящем учебнике речь пойдет обо всех составляющих корпусной работы.


Вам будет интересно
Ирина Левонтина – известный ученый-лингвист, ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН, автор словарей и блестящих статей, популяризатор лингвистики, специалист по судебной лингвистической экспертизе. Автор книги «Русский со словарем», в 2011 году ставшей финалистом премии «Просветитель», колумнист газеты «Троицкий вариант – Наука». «О чем речь» – продолжение «Русского со словарем». Это тоже собранье веселых и ярких эссе о жизни русского языка, об изменениях, к...
Читать онлайн
Книга содержит ценные советы и рекомендации по написанию итогового сочинения в 2015/16 учебном году по пяти тематическим направлениям: «Время», «Дом», «Любовь», «Путь», «Год литературы в России».Примеры разных видов сочинений отражают все особенности и трудности, возникающие перед учащимися при написании творческой работы. Большое внимание уделено поэтапной работе над темой и композицией сочинения. В издание включен словарь изобразительно-выразительных средств языка, а также дан список художеств...
Читать онлайн
Посвящена исследованию синтаксических связей и синтаксических отношений на уровне бессоюзного сложного предложения и сверхфразового единства в современном русском языке. Объектом исследования является особая разновидность неполнозначных слов – скрепа-фраза. Представляет интерес для специалистов в области лингвистики, аспирантов, студентов филологических специальностей, преподавателей русского языка и широкого круга лиц, интересующихся актуальными проблемами современного русского языка....
Читать онлайн
Почему во фразе «первый блин комам» нет ошибки? Связана ли «катавасия» с котом Васей? Когда наступают «собачьи» дни? Почему не стоит спрашивать «кто крайний?» Как перестать путать глаголы «надеть» и «одеть»? Ответы на эти и многие другие нелёгкие вопросы вы найдёте в этой книге. Специально для наших читателей автор популярного в рунете инстаграм-блога «Великий русский» @great_russian Полина Масалыгина переработала и дополнила свои лучшие статьи, в которых раскрывает самые неожиданные подвохи наш...
Читать онлайн
Книга Ерохина С. С. «Поэтическая интерпретация псалмов» – это истолкование библейских текстов в современном переводе языком поэзии. Основой для интерпретации псалмов послужило издание «Библио-Русикум», Библия. Современный перевод библейских текстов Москва, 1998 г. Предлагаемая читателю книга будет интересна не только специалистам-теологам, но и всем верующим людям, которым заповедано Господом Иисусом Христом «исследовать Писания» Ин.5:39....
Читать онлайн
В рассказе «Даша и философ» автор, излагая свои мысли, показывает и доказывает, насколько тонка и изобретательна русская философия, мало того, автор в этом рассказе открывает глаза на многие не понятые наукой вещи, задевая между прочим и частью разоблачая такую область знаний, как теология....
Читать онлайн
The book is about precise typological methods of comparative linguistics: Prefixation Ability Index and Verbal Grammar Correlation Index. These two methods allow us to detect very distant relationship of languages by direct comparison of their structures and without making reconstructions....
Читать онлайн
В монографии исследуется проблема местоименности в тексте. Основное положение о местоименности как лингвистическом феномене состоит в том, что класс местоимений пополняется представителями различных частей речи, которые приобретают местоименную функцию, но не теряют связи со своей исконной частью речи. Автор выявляет основные и специфические функции местоименных слов, которые обслуживают процесс коммуникации. Автором разработана классификация номинативных цепочек в тексте, в основе которых лежит...
Читать онлайн
Демоны мужчины пожирают внешний мир. Демоны женщины пожирают ее саму. В этом сборнике четыре рассказа, четыре не нашедшие покоя и счастья женщины. Одна из них боится призраков прошлого, другая – сама, как призрак, одинокая и неприкаянная. Здесь есть ужас перед собственным дитя и разрушительная ненависть к матери. У каждой своя трагедия, и каждая по-своему дурацкая....
Читать онлайн
К чему стремятся люди в этой бренной жизни? Счастье, какое оно? Конечно, у каждого из нас свои представления о счастье и путях ее достижения. И порой, когда мы уже в шаге от наших целей, оно ускользает от нас и растворяется как мираж. Вот и главные герои пьесы “Осенний романс”, в своих попытках добиться заветного, совершают различные действия и поступки. А добились ли они желаемого результата или нет, судить вам дорогие читатели. Данная пьеса удостоилась Гран-при на Казахстанском литературном ко...
Читать онлайн
Часть 4 Любовь вдохновляет. Любовь прекрасна и упоительна. У любви тысячи ликов и миллионы оттенков. Но можно ли продать ее и какова ей цена? Сколько еще придется выдержать испытаний на пути к счастью, сколько заговоров, сплетен и обмана? Сможет ли Катрина противостоять чувствам Кезона? И что важнее для Кея: любовь или музыка?.. ❀ ❀ ❀...
Читать онлайн
Лондон — восхитительный город, с богатой историей и особыми традициями. Он — знаменитый футболист, любящий муж и заботливый отец. Она — студентка Лондонского института искусств. Он — профессиональный игрок. Но одна игра изменила их жизни. Что их ждет: любовь или боль, страсть или разочарование?...
Читать онлайн