Един български юрист, академик или журналист, който днес се опита да научи какво точно е казвал чл. 5 от Кодекса на труда на 4 март 2019 г., няма прост начин да отговори. Държавен вестник публикува измененията на закони отделно — по броеве, в реда на обнародване. Консолидираният текст към дадена дата трябва да се сглоби наум или с помощта на платена правна база (Сиела, Апис, Лакорда), която е достъпна за около 500 до 2000 лв. на година на работно място.
Текстът на закона е публично достояние — съгласно чл. 4 от Закона за авторското право и сродните му права държавните произведения не са обект на авторско право. Но в практиката достъпът до него е разпределен между държавна институция, която публикува измененията, и частни компании, които произвеждат сглобения и удобен за четене текст. Празнината, която остава, е забележима — и попълването ѝ е въпрос на относително проста инфраструктура.
Идеята
Идеята е една и проста. Целият корпус на българското законодателство — около 250 действащи закона, около 80 кодекса и хилядите наредби и правилници — да живее в публично кодохранилище Git. Един файл за всеки нормативен акт, в машинно-четим формат (Akoma Ntoso — международният стандарт за правни документи). Всяка промяна, обнародвана в Държавен вестник, влиза като отделна заявка за сливане (pull request), с препратка към броя на ДВ, в който е публикувана. Историята на закона е цялата на едно място, дата по дата.
Авторитативността остава непокътната. Държавен вестник продължава да бъде единственият правно обвързващ източник, съгласно чл. 5, ал. 5 от Конституцията. Кодохранилището е „удобна публикация" — модел, заимстван от Великобритания (legislation.gov.uk на The National Archives), който позволява гражданите, юристите и съдиите да четат, цитират и обработват закона свободно, без това да отнема юридическата тежест на оригиналния източник.
Текстът на закона е публичен. Сглобеният, актуален, цитируем текст към дадена дата — днес не е.
Защо точно сега
Три предпоставки се събират по едно и също време.
Първо: технологичните възможности. Машинно-четими стандарти за правни документи (Akoma Ntoso, под крилото на OASIS) са узрели и се използват от Сената на Италия, Европейския парламент и редица държавни институции. Версионираните публични кодохранилища (Git, GitHub, GitLab) са се превърнали в индустриална норма. Езиковите модели намалиха разходите за разбор на стилизирани правни инструкции с порядък в последните три години.
Второ: европейският натиск. Директивата за отворените данни (Директива (ЕС) 2019/1024), целите на „Цифровото десетилетие" и Единният цифров портал създават рамка, в която цифровизирано законодателство не е „жест на прогрес", а очаквана позиция. Същевременно Националният план за възстановяване и устойчивост (НПВУ) има пилон за цифрови публични услуги — финансова рамка, в която подобна инициатива се вписва естествено.
Трето: гражданският и икономическият натиск. Учени по право, журналисти, гражданскоправни организации, малки и средни предприятия с ограничен бюджет за юридически услуги — всички те днес или плащат на търговските бази, или работят с непрецизни копия. ЕС-съседите на България вече решават този въпрос: Естония направи избор по темата преди около 15 години, Великобритания — преди близо 20, Словакия — със Slov-lex по-наскоро.
Какво се печели
Без подреждане в политическа категория, без приоритизация — конкретни ползи за конкретни групи.
- Граждани: безплатен и постоянно актуален достъп до текста на закона, без абонамент.
- Юристи и съдии: коректна версия на закона към произволна минала дата, цитируема с постоянна препратка.
- Академици: машинно-четима база за научни изследвания, без скрейпване на частни сайтове.
- Държавна администрация: одитируемост — всяка промяна е свързана с акта, който я въвежда, и с редактора, който я е приложил.
- Бизнес: по-ниска цена на правен преглед — особено за инвеститори, които оценяват регулаторната среда отвън.
- Журналисти и неправителствени организации: възможност да цитират конкретна редакция на даден член, със стабилен URL към точната версия.
- AI и иновации: чист, цитируем корпус за машинно обучение, който не зависи от съдържание на частен носител.
Процесът на изграждане
Три ясно различими фази, последователни в стартовия период и успоредни в установения режим.
Начален корпус — 12 до 18 месеца
Реконструкция на консолидираните текстове на действащите закони, кодекси и основните наредби. Източник: единствено Държавен вестник от 1990 г. насетне. По-старите броеве са в PDF и изискват OCR; по-новите са в HTML и са пряко обработваеми.
Има и алтернатива — започване от текстовете в съществуваща частна правна база с последваща сверка и оригинална реконструкция. Първият подход е по-чист и предотвратява спорове за интелектуална собственост. Вторият е по-бърз. Изборът е въпрос на консултация с правни и експертни специалисти преди старта.
Парсер на изменения — успоредно с фаза 1
Българският език на измененията е силно стилизиран — изрази като „В чл. 5, ал. 2 числото 1000 се заменя с 1500", „Член 12 се отменя" или „Създава се чл. 5а със следното съдържание…" следват ограничен набор от шаблони. Около 70 до 80 на сто от измененията се обработват с граматически базиран парсер (на технологии като Lark или nearley).
Останалите 20 до 30 на сто се предлагат от езиков модел, винаги с подпис от човек-редактор. Парсерът не замества редактора — превръща един час ръчно сглобяване в трийсет секунди преглед на готова заявка.
Публична инфраструктура
Кодохранилище Git с открита история на промените. Сайт за четене с постоянни URL-и, включващи дата (по модела на естонското Riigi Teataja: /акт/<име>/<дата>). Машинно API за програмен достъп. Дневни пълни снимки на корпуса за изтегляне. Лиценз CC-BY 4.0 за данните, MIT или CC0 за програмния код.
Един от съществените архитектурни избори: версиите се отбелязват към закона като цяло, не към отделните членове. Това е и моделът на Riigi Teataja, и на legislation.gov.uk — улеснява разсъжденията „как е изглеждал този закон на дата X" без да усложнява модела с разклонения на ниво член.
Поддръжката
След пускане в експлоатация дневният ритъм става предвидим.
- 02:00 — автоматично теглене на новите броеве на Държавен вестник.
- 02:30 — класификатор разпознава всяка точка в броя: нов закон, изменение, постановление, международно споразумение.
- 03:00 — за всяко изменение парсерът отваря проектозаявка със своето най-добро предположение за приложението му.
- През работното време — редактор-юрист с правни компетенции преглежда всяка заявка, поправя пропуски, потвърждава датата на влизане в сила, слива в основния клон.
- Постоянно — открит регистър на грешки за обратна връзка от граждани и юристи.
- Ежемесечно — версия с tag, changelog, обновяване на машинно-четимите изтегляния.
Реалистичен щатен капацитет в установен режим: един старши паралегал-редактор на пълно работно време, разработчик на половин ставка, проектов лидер на четвърт ставка. Годишен експлоатационен разход в порядъка на 200 до 300 хил. лева. Първоначалното изграждане е допълнителен ресурс — между 500 хил. и 1 млн. лева за 12-18 месеца, в зависимост от началния обхват.
Тези числа се сравняват с разходите на сродни системи в други държави: естонското Riigi Teataja и британското legislation.gov.uk оперират в порядъка на 1 до 2 млн. евро на година, при по-широк обхват и по-голям щатен състав. Българската цифра е консервативна — отразява по-малкия мащаб и по-ниските заплати в публичния сектор, без да жертва качеството.
Опитът на други държави
Подобни системи съществуват в почти всички съседни и сродни на България държави. Кратък преглед:
bundestag/gesetze, без официална санкция.Българската позиция в момента е между германската и словашката: има публично достъпни броеве на ДВ, но без консолидиран машинно-четим вариант. Опитът на тези държави показва две неща. Първо — проектът работи най-добре, когато домакинът е статутна институция (държавна канцелария, парламентарна администрация, национална архивна служба), а не отделно министерство. Второ — редакционната прозрачност е критичен фактор за доверието. Естония постига първото; британският модел отворен код е още по-явен в проверяемостта.
Какво остава отворен въпрос
Преди подобна инициатива да напусне етапа на концепция, остават няколко принципни въпроса.
- Институционален домакин: Народно събрание (към чиято администрация се публикува Държавен вестник) или Министерство на правосъдието? Естонският модел е по-близо до първото; политически по-видим е вторият.
- Правен статут: удобна публикация (модел на Великобритания, без изменение в закон) или статутна реформа, в която електронното издание става съавторитетно (модел на Естония)? Първият е по-лесен за начало; вторият е дългосрочната цел.
- Финансиране: национален бюджет, цифровият пилон на НПВУ, програмата „Цифрова Европа", „Хоризонт Европа", или комбинация? Експлоатационният разход следва да бъде устойчив без външни средства; първоначалното изграждане е по-естественият кандидат за EU-съфинансиране.
- Връзка със съществуващите търговски бази (Сиела, Апис, Лакорда): конкуренция или съавторство? В Обединеното кралство след пускането на legislation.gov.uk търговските доставчици се преориентираха към добавени услуги — пояснения, кръстосани препратки, тематични анализи. Подобен модел е възможен и в България.
- Покритие: само закони и кодекси за първа версия, или веднага и наредби, постановления, инструкции? Опитът на други държави показва, че по-малкият първоначален обхват се изгражда по-бързо и по-сигурно — разширяването идва на по-късен етап.
Тези въпроси не пречат на концепцията да бъде формулирана. По-скоро очертават кои решения принадлежат на политическо обсъждане и кои са технически.
Бележка от CNTS
Този текст е публикуван от Център за Нови Технологични Системи като принос към обсъждането на темата. CNTS работи с публични и частни институции в България в областта на обратната връзка от граждани и клиенти, обработката на данни и интегрирането на AI инструменти в производствени процеси — kazva.bg, cnts.bg, blitzpoll.com, makeaifriendly.com.
Ако работите по тази тема — академична общност, неправителствена организация, държавна институция, или просто като гражданин с професионален интерес — пишете на [email protected].
Речник
- Akoma Ntoso
- Международен
XMLстандарт за машинно-четими правни документи, под крилото на OASIS. Използва се от Сената на Италия, Европейския парламент и редица държавни институции. - Държавен вестник (ДВ)
- Официалното издание на Народното събрание, единственият правно обвързващ източник за обнародване на закони и подзаконови актове съгласно чл. 5, ал. 5 от Конституцията.
- Git
- Разпределена система за версионен контрол, на която работят почти всички съвременни софтуерни проекти.
- Pull request
- Заявка за сливане — предложена промяна в Git кодохранилище, която преди приемане се преглежда от друг член на екипа.
- Консолидиран текст
- Пълната редакция на закона към дадена дата, със заложени всички предхождащи изменения. Различен от единичния брой на ДВ, който публикува само самото изменение.
- Машинно-четим
- Формат, който компютърна програма може да чете и обработва без отделен разбор — за разлика от свободно форматирания текст в PDF или HTML.
- Riigi Teataja
- Естонското официално издание на законите, в електронен формат, със статут на единствен официален източник от 2010 г. насетне.