Как Perplexity и HuggingChat помогали мне в написании научной работы
Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография
В магистратуре моего университета студентам разрешено использовать ИИ при написании бакалаврских и магистерских работ. Но про «Чат, напиши мне диплом про…» можно забыть. Разрешено только грамотное и точечное использование ресурсов, которые могут облегчить написание работы на отдельных этапах.
Поначалу к использованию ИИ я отнеслась скептически. Как я могу доверить написание хоть небольшой, но все же части выпускной работы машине, которая не всегда правильно рисует пальцы на руках (да-да, знаю, что уже хорошо с этим справляется)? Однако чем больше я пробовала экспериментировать с ИИ-сервисами на парах по искусственному интеллекту, тем больше понимала: а эти машины могут сослужить мне добрую службу! Но обо всем по порядку.
О чем моя работа
Чтобы было понятно, для чего и как я применяла ИИ, расскажу о своей работе.
Материал моего исследования — тексты книжных обзоров и рецензий британского онлайн-издания «The Economist».
Что я исследую в этих текстах? Оценку и оценочные значения: то, как те или иные оценочные смыслы могут выражаться в англоязычных текстах, в которых обозревается литература.
Какой конечный продукт? Я составляю корпус средств выражения оценки, из которого можно узнать: словарное значение слова, общее оценочное значение (положительное/отрицательное/нейтральное), частное оценочное слова/словосочетания (оттенки смысла; например, лексема может выражать оценку объекта по принципу: интересно/неинтересно) и оценочное значение слова/словосочетания в конкретном контексте (кусочке текста из книжной рецензии).
Итак, мы примерно понимаем, какой теме посвящена работа, и что должно получиться в конечном итоге. Теперь перейдем к конкретным примерам использования ИИ.
Отбор материала
Без использования ИИ сбор материала для корпуса занимал довольно много времени. Каждую статью необходимо внимательно прочитать, выписать всю лексику, которая обладает оценочными значениями, проанализировать первичную выборку и оставить из нее только наиболее подходящие примеры.
ИИ-сервисы помогают упростить первый этап: при написании подходящего запроса они выделяют из загруженного текста оценочную лексику и формируют из нее список лексем. Да, не на 100% верно, но на 85% они с этим справляются. Нам остается только проанализировать отобранные лексемы в контексте и подчистить список, созданный ИИ.
В ходе работы я пользовалась ИИ-платформами Perplexity и Hugging Chat, они обе справляются с данной задачей хорошо. Скрин результата отбора прилагаю.

Создание классификации
Для создания хорошего языкового корпуса необходимо продумать, как можно классифицировать собранный материал. На какие группы разделить отобранные слова, выражающие оценочность. Не всегда изначально понятно, стоит ли брать за основу классификации формальные (например, принадлежность слова к определенной части речи: прилагательное, глагол) или семантические признаки (по смыслу, какое значение выражает слово).
ИИ-сервисы помогают создать канву, основу будущей классификации. После загрузки в них отобранных оценочных единиц можно создавать запросы на их группировку и классификацию. В дальнейшем данную классификацию можно доработать, почистить и использовать в работе. Мне показалось, что с данной задачей лучше всего справляется ИИ-сервис Perplexity.
Предложенную Perplexity классификацию можно увидеть на скрине.

Описание оценочных значений в контексте
Поскольку в создаваемом корпусе я разделяю оценочное значение, присущее лексеме постоянно (вне зависимости от того, как и в каком контексте она употребляется), и значение, которое возникает в определенном языковом окружении, возникает необходимость в описании значения оценочных слов в контексте книжной рецензии.
С данной задачей ИИ-сервисы справляются хуже, чем с описанными ранее. Тем не менее, выдаваемые ими результаты можно использовать как основу для собственных описаний. Как я правила созданные ИИ описания:
- Конкретизировала (вместо использования местоимений «он», «она», «те», наречий по типу «там» прописывала конкретные имена и места, чтобы читателю будущего корпуса было все понятно)
- Сокращала (описания в составе корпуса не должны быть больше 2-3 предложений)
- Заменяла (если использованные ИИ слова не точно передавали смысл, искала более подходящие эквиваленты)
Из двух использованных платформ для этой цели более подходящей показалась Perplexity. Скрин описания прилагаю.

Что в итоге
ИИ-платформы — не всегда зло для научных работ. Особенно если их грамотно использовать. Надеюсь, моя статья будет полезна коллегам-лингвистам (и не только им), ведь при помощи ИИ легче и быстрее делать как минимум подготовительные этапы исследования: отбирать и классифицировать информацию.