student
Krasnoyarsk, Russian Federation
UDC 614.84
This article presents preliminary results of developing a specialized intelligent assistant for fire safety. The study addresses the problem of searching for relevant information in regulatory and technical documentation and databases to simplify workflow. The authors analyzed the capabilities of existing ready-made neural network models for document search (embedding). It was found that their direct application in the narrow professional field of fire safety is limited due to low accuracy caused by a lack of specialized context and terminology. As a solution, an approach to creating a custom neural network adapted to the specifics of this subject area is proposed.
Smart firefighter assistant, fire protection, neural networks, artificial intelligence, natural language processing
В условиях современного оперативно-служебного ландшафта работа с информацией остается одним из наиболее трудоемких и критически важных процессов [1]. Специалисты, в частности в сфере пожарной охраны, ежедневно сталкиваются с колоссальным и непрерывно растущим потоком данных: от постоянно обновляющихся нормативно-правовых актов, причем проблема состоит не только в их массовом количестве, но и в противоречии документов друг другу.
Однако эта задача наталкивается на системные ограничения. Во-первых, в полевых условиях или на объектах с нарушенной инфраструктурой доступ к актуальным базам данных через интернет может быть невозможен или нестабилен. Во-вторых, даже при его наличии, классический поиск в массиве цифровых документов требует времени и определенных навыков. В-третьих, традиционная опора на бумажные носители — копии нормативно-правовых актов, распечатанные инструкции — делает процесс поиска информации неприемлемо медленным для реагирования в режиме реального времени.
Возникает объективная необходимость в качественно новом инструменте — интеллектуальном помощнике, который мог бы радикально сократить когнитивную и временную нагрузку на специалиста [2-3]. Такой ассистент должен не просто хранить документы, а понимать естественно-языковый запрос человека, мгновенно анализировать локальную базу знаний, сформированную из утвержденных нормативно-правовых актов в области пожарной безопасности, и предоставлять точный, обоснованный выдержками из источников ответ. Это позволит перейти от трудоемкого поиска к мгновенному получению решения, обеспечив тем самым новое качество оперативного принятия решений в экстренных ситуациях. Разработка подобной системы и представляет собой цель настоящего исследования.
Проведенный ранее эксперимент по использованию русскоязычной модели Saiga LLM [4] выявил ее ограниченную применимость для решения узкоспециализированных задач. Если на общих вопросах модель показала работоспособность, то тестирование на точных, фактографических запросах из области пожарной безопасности продемонстрировало большое количество аномалий (Аномалия – ошибки искусственного интеллекта) (рис. 1). В ходе апробации лишь 3 из 10 сгенерированных ответов соответствовали запросу, что указывает на высокую вероятность генерации недостоверных данных, также, данная модель имеет слишком большой вес (Веса модели - это фундаментальные, обучаемые параметры в нейронной сети, которые преобразуют входные данные), что делает ответ продолжительно долгим (около 5-7 минут). Таким образом, Saiga LLM не отвечает требованиям исследования.

Рис. 1. Аномалия модели
Для преодоления выявленных ограничений архитектура системы была существенно модернизирована. Первоначальный прототип, реализованный в среде RenPy [4], был заменен на автономное клиент-серверное приложение в формате исполняемого (.exe) файла. Данный переход обеспечил необходимую гибкость и производительность для проведения дальнейших экспериментов.
В новой архитектуре была реализована классическая схема RAG (Retrieval-Augmented Generation) [5]. В ее основе лежат две независимые нейронные сети:
- Модель эмбеддингов (Embedding model), ответственная за семантическое векторное представление текста [6]. Ее задача — преобразовать корпус нормативных документов и пользовательский запрос в числовые векторы (эмбеддинги), что позволяет эффективно находить релевантные фрагменты текста по смысловой близости.
- Языковая модель (LLM model) [7], отвечающая за генерацию итогового ответа. Она получает исходный запрос пользователя и найденные релевантные контексты (chunks) из базы знаний и формирует на их основе связный, фактологически точный текст.
Для обеих ролей была выбрана модель Qwen. Критерием выбора послужил оптимальный баланс между качеством выходных данных (как для создания эмбеддингов, так и для генерации) и вычислительной эффективностью (размером модели), что является важным для потенциального развертывания системы на ограниченных аппаратных ресурсах.
На текущем этапе разработки был выявлен системный недостаток, ограничивающий функциональность системы в целевой русскоязычной среде. Несмотря на заявленную мультиязычность, выбранная модель Qwen продемонстрировала недостаточную компетенцию в обработке русскоязычных текстов.
Данное ограничение проявилось на двух уровнях архитектуры:
- На уровне извлечения информации: Модель эмбеддингов (Embedding model) генерирует векторные представления для русскоязычных документов и запросов с низкой семантической точностью. Это приводит к некорректной работе механизма поиска релевантных контекстов — система часто не находит ключевые документы или извлекает фрагменты, не соответствующие сути запроса.
- На уровне генерации ответа: Языковая модель (LLM model), получая даже корректный контекст, формирует ответы с фактологическими ошибками. Более того, наблюдаются случаи кодового смешения, когда часть ответа генерируется на китайском языке, что является прямым следствием смещения распределения вероятностей модели в сторону основного языка ее предобучения.
Таким образом, языковой барьер модели Qwen приводит к каскадному сбою всей RAG-архитектуры: неточный поиск усугубляется некорректной генерацией.
Опираясь на результаты предыдущих неудачных экспериментов с мультиязычными моделями общего назначения, был сформулирован принципиально иной подход — разработка собственной специализированной нейронной сети. Ключевая гипотеза заключается в том, что узкопредметная область пожарной безопасности, характеризующаяся строго формализованным языком и ограниченным понятийным аппаратом, представляет собой более решаемую задачу для обучения, чем тонкая настройка универсальной модели с ее избыточной сложностью и смещенными распределениями данных.
Для реализации данного подхода была разработана и применена комбинированная двухэтапная методология обучения:
- Контролируемое обучение на размеченных диалоговых данных (Supervised Fine-Tuning, SFT). Был создан специализированный датасет, содержащий 4000 триплетов «вопрос-ответ», отражающих вопросы, касающиеся пожарной охраны. Каждый вопрос был снабжен тремя вариативными, но семантически эквивалентными ответами, что позволяет модели абстрагироваться от конкретной формулировки и усвоить инвариантную семантику запроса, повышая тем самым ее работоспособность. Датасет был разделен на обучающую, валидационную и тестовую выборки в стандартной пропорции для объективной оценки обобщающей способности модели.
Обучение с подкреплением на основе документов (Document-based Reinforcement Learning). Для обработки запросов, выходящих за пределы подготовленных диалоговых пар, был реализован механизм, при котором модель не генерирует ответ напрямую, а выполняет семантический поиск в предоставленном корпусе нормативных документов (рис. 2,3). Важным решением на этом этапе стал отказ от мультиязычных эмбеддинг-моделей в пользу специализированной русскоязычной модели ruBERT [8]. Ее выбор обусловлен глубоким предобучением на русскоязычных текстах, что гарантирует высокое качество создания семантических векторных представлений (эмбеддингов) для терминологически насыщенных документов и запросов, решая тем самым ключевую проблему предыдущих этапов — низкое качество поиска.

Рис. 2. Ответ модели согласно нормативно-правовым документам
Рис. 3. Интерфейс умного помощника
Предложенная архитектура демонстрирует полное соответствие ключевым требованиям, сформулированным в рамках исследования.
Во-первых, система обладает высокой вычислительной эффективностью. В её основе лежит предобученная и дообученная модель (ruBERT для поиска и собственная обученная LLM для генерации), что исключает необходимость ресурсоёмкого обучения с нуля на каждом этапе развёртывания. Основная нагрузка приходится на этап инференса (логического вывода), что позволяет системе функционировать на стандартном аппаратном обеспечении без использования мощных GPU-кластеров. Это необходимо для потенциального внедрения в условиях пожарных частей или на мобильных командных пунктах.
Во-вторых, достигнута приемлемая оперативность работы. Время формирования ответа на типовой запрос составляет от 10 до 30 секунд. Данный интервал является удовлетворительным для большинства сценариев аналитической и подготовительной работы, что подтверждает практическую применимость системы в реальных, хотя и не экстремально срочных, условиях.
В-третьих, система обладает принципиальной способностью к адаптивному дообучению [9]. Это реализуется по двум основным направлениям:
- Коррекция ошибок: При выявлении некорректного ответа у администратора системы появляется возможность предоставить модели корректную пару «вопрос-ответ». Эта пара добавляется в тренировочный набор для последующих циклов дообучения, что позволяет системе эволюционировать и минимизировать повторение аналогичных ошибок в будущем.
- Расширение базы знаний: Система допускает масштабирование как базы документов для семантического поиска, так и диалогового датасета. Загрузка новых массивов вопросов и ответов с последующим дообучением модели позволяет постоянно повышать её охват и точность, адаптируя помощника к изменениям в нормативной базе или появлению новых типовых оперативных задач.
Таким образом, разработанное решение не только решает конкретную проблему языкового барьера, но и удовлетворяет системным критериям эффективности, скорости и способности к непрерывному развитию, заложенным в методологию исследования.
Основным вектором дальнейшего развития данного исследования станет качественное и количественное расширение предметной области интеллектуального помощника.
В краткосрочной перспективе работа будет сосредоточена на горизонтальном масштабировании в рамках сферы пожарной охраны. Планируется систематическое пополнение корпуса документов, на которых обучается и работает модель, за счет включения новых категорий нормативных, справочных и оперативных материалов. Это позволит охватить более широкий спектр специализированных направлений, таких как: профилактические проверки, расследование причин пожаров, тактика тушения специфических объектов (нефтехимические комплексы, высотные здания, объекты транспорта), применение специального оборудования и средства индивидуальной защиты. Целью данного этапа является превращение системы в универсального ассистента для всех основных служебных задач рядового и офицерского состава пожарной охраны.
В долгосрочной перспективе исследование нацелено на вертикальное расширение предметной области до масштабов всей пожарной безопасности.
1. Bakirov I. K., Hafizov F. Sh., Sultanov R. M. Problemy primeneniya normativnyh dokumentov po pozharnoy bezopasnosti // Pozharovzryvobezopasnost'. 2014. №1. URL: https://cyberleninka.ru/article/n/problemy-primeneniya-normativnyh-dokumentov-po-pozharnoy-bezopasnosti (data obrascheniya: 12.01.2026).
2. Yamaltdinova, E. I. Intellektual'nyy virtual'nyy pomoschnik / E. I. Yamaltdinova, A. A. Barsukova // TEORIYa i PRAKTIKA SOVREMENNOY nauki: sbornik statey IV Mezhdunarodnoy nauchno-prakticheskoy konferencii, Penza, 20 yanvarya 2021 goda. – Penza: "Nauka i Prosveschenie" (IP Gulyaev G.Yu.), 2021. – S. 49-51. – EDN XEQVCG.
3. Zaharova, A. V. Intellektual'nyy pomoschnik v obrazovanii / A. V. Zaharova // Tehnologicheskie perspektivy chelovechestva: materialy Vserossiyskoy nauchnoy konferencii studentov i molodyh uchenyh, Yoshkar-Ola, 11–12 maya 2023 goda. – Yoshkar-Ola: Povolzhskiy gosudarstvennyy tehnologicheskiy universitet, 2023. – S. 51-56. – EDN TWTEOK.
4. Shamsudinov, G. Yu. Primer realizacii sistemy normativno-pravovoy podderzhki specialistov pozharnoy bezopasnosti s ispol'zovaniem iskusstvennogo intellekta / G. Yu. Shamsudinov // Servis bezopasnosti v Rossii: opyt, problemy, perspektivy : Materialy Mezhdunarodnoy nauchno-prakticheskoy konferencii, Sankt-Peterburg, 23 oktyabrya 2025 goda. – Sankt-Peterburg: Sankt-Peterburgskiy universitet gosudarstvennoy protivopozharnoy sluzhby MChS Rossii im. Geroya Rossiyskoy Federacii generala armii E.N. Zinicheva, 2025. – S. 130-132. – EDN BEKOSW.
5. Cuconasu F. et al. The power of noise: Redefining retrieval for rag systems //Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval. – 2024. – S. 719-729.
6. Inglesfield J. E. A method of embedding //Journal of Physics C: Solid State Physics. – 1981. – T. 14. – №. 26. – S. 3795.
7. Eremin, I. V. Metody i algoritmy razrabotki intellektual'nyh pomoschnikov na osnove bol'shih yazykovyh modeley / I. V. Eremin, V. A. Hramova // Problemy upravleniya v social'no-ekonomicheskih i tehnicheskih sistemah : Materialy XX Mezhdunarodnoy nauchno-prakticheskoy konferencii. Sbornik nauchnyh statey, Saratov, 17–18 aprelya 2024 goda. – Saratov: Izdatel'skiy centr "Nauka", 2024. – S. 32-36. – EDN MEIVKK.
8. Oliseenko, V. D. Embeddingi yazykovoy modeli RuBERT v zadache mnogoklassovoy klassifikacii postov pol'zovateley v social'noy seti / V. D. Oliseenko, M. V. Abramov // Mezhdunarodnaya konferenciya po myagkim vychisleniyam i izmereniyam. – 2022. – T. 1. – S. 45-48. – EDN ORADTX.
9. Todarenko, V. P. Metod stohasticheskih variacionnyh neravenstv dlya doobucheniya modeley transformerov / V. P. Todarenko, I. V. Sharun // Prikladnaya matematika i fundamental'naya informatika : Materialy XV Mezhdunarodnoy molodezhnoy nauchno-prakticheskoy konferencii s elementami nauchnoy shkoly, Omsk, 19–24 maya 2025 goda. – Omsk: Omskiy gosudarstvennyy tehnicheskiy universitet, 2025. – S. 143-144. – EDN AFBJVL.



