ВЕКТОРНЫЙ АНАЛИЗ ЮРИДИЧЕСКИХ ТЕКСТОВ

Byadmin

ВЕКТОРНЫЙ АНАЛИЗ ЮРИДИЧЕСКИХ ТЕКСТОВ

Сборник материалов конференции «Язык и право: актуальные проблемы взаимодействия», 2018

Волков Юрий Викторович,
к.ю.н., доцент, кафедра информационного права, Уральский государственный юридический университет (г. Екатеринбург, Россия).

 

ВЕКТОРНЫЙ АНАЛИЗ ЮРИДИЧЕСКИХ ТЕКСТОВ

 

Актуальность вопроса внедрения информационных технологий во все сферы жизни уже никем не оспаривается. Средства массовой информации периодически информируют о массовом сокращении юристов и замене их роботами (Божко, 2018); либо, публикуют интервью с чиновниками о цифровизации законодательства (Воейков, 2018). Проблема проникновения информационных технологий в сферу государственного управления и права, становится частой, если не сказать постоянной, темой правовых форумов. Искусственный интеллект и юридическая деятельность были предметом профильного семинара в УрГЮУ (04 октября 2017 года г. Екатеринбург). Аналогичным вопросам была посвящена секция XII сессии Евро-Азиатского правового конгресса (13-14 сентября 2018 года г. Екатеринбург). Очередные 3-е Сибирские чтения (1-2 ноября 2018 г. в г. Тюмень) практически полностью были посвящены вопросам внедрения информационных технологий во всех правовых сферах. По мнению многих экспертов, выступавших на форумах: «Машина никогда не сможет заменить Человека». Однако это не убеждает. Целый ряд предстоящих международных конференций (например: 30 ноября 2018 г. в г.  Минске; 4 декабря 2018 г. в г. Лондон) предметом основного внимания вновь обозначили информационные технологии в управлении и электронном правосудии, соответственно.

Современная ситуация сложилась не в один день. Ещё в 60-е годы ХХ века чешский исследователь В. Кнапп отмечал необходимость логико-математического описания волевых процессов для дальнейшего продвижения кибернетики (Кнап, 1965, 68). Аналогичные исследования проводились и в СССР, однако непреодолимыми препятствиями на пути внедрения компьютеров в правовую сферу стали: вопросы «техники» составления программ; необходимость максимальной конкретизации права (Вопросы кибернетики…, 1967, 85-89). Очередная «волна» интереса к использованию компьютерной техники в творческом процессе хронологически соответствует перестройке и развалу СССР. В это время специалист по математической лингвистике А. М. Кондратов констатировал создание музыкальных произведений с помощью ЭВМ «Урал», а также сложных стихов скандинавского типа при помощи программы «Скальд» (Кондратов А. М., 1987, 121, 133). Позднее Ю. М. Батурин практически «по полочкам» разложил проблематику соотношения права и компьютерной техники (Батурин Ю. М., 1991). Что изменилось за прошедшие десятилетия и почему именно сейчас внедрение информационных технологий актуально, как никогда ранее?

В наши дни достижения Искусственного интеллекта в шахматах, в игре Го, в карточном покере, в иных сферах, – свидетельствуют об изменении приоритетов использования вычислительных мощностей. Вычислительные мощности, которые ранее использовались преимущественно для хранения информации постепенно ориентируют на операции, которые в человеческом измерении рассматриваются как операции принятия решения. Примером является длительная работа по составлению корпуса английского языка. Для правоведения и сферы государственного управления основные факторы влияния – незаметны, т. к. они остаются в рамках лингвистики и компьютерной лингвистики. Однако последние достижения лингвистики, а именно сравнительный, векторный анализ позволяют давать текстам формально определённую, математическую оценку. Именно они повлияют, а во многих зарубежных странах уже влияют на правовую сферу. Правоведение также, как лингвистика основным предметом труда имеет текст. Тексты права и лингвистики имеют много общего. Язык, как средство коммуникации, имеет строение и определённые черты, в том числе: нормативность (правила: орфографические, синтаксические и т. д.); логичность; формальность. Право также содержит несколько сходных признаков, в том числе: нормативность; формальную определённость;  объективность (текст). Это делает изоморфным (подобным), если не полностью, то в основной части, процесс работы с текстом (художественным, официальным, новостным, правовым и т. д.). Критерии оценки в каждом случае разные. Они могут быть заданы для конкретного типа  текста: делового; художественного; правового.

На фоне ускоряющихся социальных процессов способы работы с текстами оставались, а во многих местах остаются и по ныне, прежними (чтение, анализ, выводы). Эти традиционные способы работы с юридическими текстами уже не удовлетворяют многих. Любой комментарий, интервью, сообщение, в том числе и о ненадлежащем применении закона, могут стать достоянием социальных сетей в считанные секунды. С другой стороны, анализ, проверка фактов, толкование положений закона требуют значительного времени. Ситуация осложняется постоянным ростом объёмов законодательства и снижением его качества. Решением для некоторых вопросов могут быть разработанные в лингвистике математические методы анализа текстов (Кодухов В. И. 1974, 87, 96). Важную роль в продвижении компьютерной лингвистики сыграли работы Ноама Хомского и Джорджа Миллера. Акцентируя внимание на строение они позволяют перейти от синтагматического к семантическому (а затем и к векторному) анализу. Но особенный интерес  представляет метод векторного анализа, ставший возможным в связи с развитием современных информационных технологий. Он, описан исследователями (Kutuzov a., Kuzmenko E. 2016, 155 – 161) и реализован им на общедоступном сетевом ресурсе (http://rusvectores.org/ru). Следует отметить, что данный метод на фоне иных аналогичных методов корпусной лингвистики является, если не самым, то одним из самых передовых. Он позволяет представить результат литературного анализа термина или текста в числовом формате. Таким образом, любой индивид, который просто знает числа, сможет  наглядно представить общность и/или различие литературных структур и текстов.

Приведём пример анализа юридических терминов на его основе. Два термина распространение и передача являются ключевыми в характеристике движения информации и определяющими в информационной сфере. Законодательной дефиниции передачи нет, а распространение толкуется как разновидность передачи. Конкуренция терминов особенно очевидна в рамках уголовного законодательства, когда распространение, выступает элементом диспозиции многих составов преступлений, а передача, в них же, таких составов не образует. Определённый интерес представляют дела в иных отраслях права, например: дело по жалобе А. И. Сушкова, рассмотренное Конституционным Судом РФ. В сердцевине конфликта разное толкование сторонами терминов передача, разглашение и распространение в случае отправки сообщения электронной почты с «рабочего» на «домашний» адрес. По данному делу  Конституционный Суд РФ принял «соломоново решение». Он не дал ответ на вопрос что имело место распространение (разглашение) или передача, но при этом констатировал факт нарушения (практически приравнял термины друг к другу) и отправил дело на пересмотр (Постановление КС РФ № 25-П). Наш акцент на термины распространение и передача обусловлен тем, что они имею место в качестве прав каждого лица (ст. 29 Конституции РФ). Термин разглашение в данной статье отсутствует. Проведённый векторный анализ терминов (Волков (А), 2018, 29-32) с математической точностью (до третьего знака после запятой) показал безусловное различие терминов распространение и передача, их семантическую «близость» лишь на 18-м из 23-х возможных уровней. Анализ выявил семантическое различие терминов, что обуславливает необходимость повторного анализа как закона, так и принятого судом решения. Это только один пример анализа термина.

Вариантом применением данного метода является анализ юридических тестов (законов, постановлений, решений и т. д.) в целом. Модель данного процесса можно представить следующим образом. Текст закона подвергается анализу на предмет установления всех возможных «векторов», ключевых терминов. Затем текст переводится в векторную модель, обозначим её – корпус закона. Дальнейшее применение закона рассматривается через формирование векторных моделей подзаконных и  правоприменительных актов. Любой акт (подзаконный или акт правоприменения), приведённый в векторный вид, может быть проверен путём сравнения с векторами корпуса закона. Наличие отклонения покажет степень соответствия/несоответствия эталону (корпусу закона). Первым текстом, базовой моделью («точкой отсчёта») может послужить Конституция. Не основе её текста можно сформировать (рассчитать) конституционный корпус. Все последующие, принятые и принимаемые законы могут служить, с одной стороны, дополнением законодательного (конституционного) корпуса, с другой стороны, предметом векторного анализа.

Несомненную пользу данный метод может представлять при отправлении правосудия и иной правоприменительной практики. Точный и быстрый анализ ситуаций изложенных в векторном (изначально в текстовом) формате позволит сэкономить время для судьи и обеспечит более высокую гласность процесса. Естественно, что первое, на чём будут тренироваться, отрабатывать технологию, экспериментаторы – это существующий банк судебных решений. Прогнозируем множество вопросов. Ещё один фактор — возможность в автоматическом режиме работать с актуальной версией юридического документа (закона, постановления, решения и т. д.). Следующим фактором является скорость принятия и объёмы текстов законов разработанных весьма ограниченным составом экспертов. Есть основания полагать, что Британский закон о защите персональных данных (354 страницы), принятый в течение одного года, разработан с применение аналогичной или подобной технологии.

Полагаем, что часть решение данной проблемы будет генерироваться частным сектором, заинтересованным в контроле законотворческих,  управленческих и судебных процессов. Важное значение для анализа имеет также наличие свободных вычислительных мощностей.

 

Список литературы:

  1. Батурин Ю. М. Проблемы компьютерного права.– М.: Юридическая литература, 1991. – 272 с.
  2. Божко Марина. Сбербанк передаст работу 3 тыс. сотрудников роботам-юристам // РБК: 12.01.2017, https://www.rbc.ru/rbcfreenews/5877b2979a79478752358fb9.
  3. Воейков Денис. Минэк рассчитывает оцифровать процесс создания российских законов к 2020 году // Сnews.ru: ИТ в госсекторе. 01.10.2018. http://www.cnews.ru/news/top/2018-10-01_minek_rasschityvaet_otsifrovat_protsess_sozdaniya.
  4. Волков Ю. В. Анализ юридического термина «передача информации» / Преемственность и новации в юридической науке: Сборник статей международной научно-практической конференции (г. Самара, 04 марта 2018 года). – Стерлитамак: АМИ, 2018. – С. 29-32. (А)
  5. Волков Ю. В. Векторный анализ юридических терминов: отчет- презентация / URL:  http://www.telecomlaw.ru/news/12_2018_09_13__.pdf . (В)
  6. Вопросы кибернетики и права. – М.: Наука. 1967. – 312 с.
  7. Кнап В. О возможности использования кибернетических методов в праве / пер. М. П. Лебедева.– М.: Прогресс. 1965. – 288 с.
  8. Кодухов В. И. Общее языкознание: Учеб. – М. Высшая школа, 1974. – 303 с.
  9. Кондратов А. М. Электронный разум. Очерк исследований по проблеме искусственного интеллекта. – М.: Знание. 1987. – 187 с.
  10. Постановление Конституционного Суда РФ от 26.10.2017 № 25-П.
  11. Хомский Н., Миллер Дж. Ведение в формальный анализ естественных языков. Пер.с англ. Изд3-е. – М.: Книжный дом «ЛИБРОКОМ», 2010. – 64 с.
  12. Kutuzov A., Kuzmenko E.: WebVectors: A Toolkit for Building Web Interfaces for Vector Semantic Models. In: Ignatov D. et al. (eds) Analysis of Images, Social. Networks and Texts. AIST 2016. Communications in Computer and Information. Science, vol 661. Springer, Cham, 155 – 161 (2016).

Об авторе

admin administrator