Технология ML для преобразования нормативных документов в машинопонимаемый формат и проверки ИМ(ЦИМ)
Кутузова О.К.,
продакт-менеджер NSR Specification
ООО «Нанософт разработка»
Одним из наиболее перспективных направлений цифровизации строительства является автоматизация поиска нормативных нарушений непосредственно на этапе проектирования, для реализации которой требуется переработать массив действующих норм и стандартов сначала в машиночитаемый, а затем в машинопонимаемый вид. В статье речь идет об опыте, проблемах, текущих результатах применения интеллектуальных методов обработки естественных языков, в частности, методики семантического анализа.
На сегодняшний день существуют две тенденции, определяющие направление развития области проектирования:
- цифровизация строительства, которая в основном выражается во внедрении технологии информационного моделирования;
- применение современных технологий AI (искусственный интеллект) и ML (машинное обучение) для автоматизации обработки информации.
Потенциально эти направления могут существенно оптимизировать работу на всех этапах строительного процесса и привести к повышению качества возводимых объектов и дальнейшей их эксплуатации. Рассмотрим возможность автоматизации процесса экспертизы инженерных решений на соответствие нормативным документам.
Эксперты станут не нужны?
Как только появилась новость о Сhat GPT, тут же на самых разных уровнях заговорили о возможности проверки с его помощью соответствия выпускаемых проектов требованиям стандартов. Дошло до заявлений, что экспертизы будут не нужны не только в будущем, но и в настоящем.
Решение задачи автоматизации экспертизы зависит от ответа на следующие вопросы.
- Какие материалы надо проверить?
Классический чертеж не совсем подходит для этой задачи, так как представляет собой набор линий, значение которых может быть понятно только человеку с инженерным образованием. Рассматривать текстовую часть документации отдельно от графики тоже не совсем корректно, если решается задача экспертизы в комплексе. Остается только трехмерная цифровая информационная модель (ЦИМ), в которой реализуется объектно-ориентированный подход, означающий, что каждый объект модели знает свое имя, характеристики, связи с другими объектами и сведения о местоположении. На текущий момент не существует единого стандарта, описывающего структурные связи и информационное наполнение ЦИМ в том объеме, в котором это нужно для воспроизведения нормативных сценариев. Есть СП 333.1325800.2020, но описанный в нем набор параметров, с одной стороны, не учитывает многие показатели, которыми должны характеризоваться объекты, а с другой – заполнение данных даже по представленному минимальному перечню слишком трудозатратно, поэтому редко выполняется на практике.
В каком же объеме следует описывать структурные связи и информационное наполнение – это и есть первое неизвестное, напрямую зависящее от второго.
- Что необходимо проверить?
Разумеется, соответствие требованиям нормативных документов. Вот только текст их не структурирован (требование, содержащееся в начале документа, может иметь исключение, которое указано в конце), а использованные термины порой не имеют утвержденных определений, кроме того, нередки неоднозначные формулировки, неконкретные условия (вроде требования к размещению объекта «в пределах видимости» или «для обеспечения безопасной эксплуатации»), а также опечатки, противоречия, регулярное внесение изменений и колоссальный объем документов (более 1000 только в области строительства). Конечно, объемом данных искусственный интеллект не напугать, но только если эти данные формализованы.
- Как перевести нормативные тексты, написанные на естественном языке, на язык понятный программному обеспечению?
При поиске ответа на этот вопрос необходимо учитывать еще и третье неизвестное. А именно функциональные особенности программного обеспечения, которое должно будет отработать сценарий проверки нормативного требования в цифровой информационной модели. Минимально должны быть представлены:
- выбор объектов для проверки по информационным свойствам;
- выбор объектов с учетом структурных связей и связей в сборках;
- выбор объектов по местоположению относительно других объектов.
- Выбор языка, с помощью которого можно будет сопоставить информационное описание объектов ЦИМ на соответствие терминам нормативного документа.
Основная сложность заключается в том, что в нормативном документе не всегда указывается имя того, кому предъявляются требования. Иногда речь идет о возможной функциональной группировке объекта или об объекте как о части технической системы, а иногда вместо имени кому предъявляются требования используется имя изделия, материала. Собственно, для решения этой задачи и был разработан Классификатор строительной информации (КСИ). Но с его применением на практике часто возникают трудности: то нужный код отсутствует, то есть несколько дублирующих кодов для описания одного и того же…
А самое главное – это разнообразие трактовок методики его применения.
Подобные проблемы – абсолютная норма для нового, не имеющего аналогов (а аналогов единой системы классификации всех объектов, процессов, ресурсов, из которых состоит строительный процесс, в России по-прежнему нет). Самое главное – продолжать работу над Классификатором, привлекая на помощь авторитетных экспертов в области ТИМ.
Становится понятно, что искусственный интеллект (далее -ИИ) не способен решить задачу экспертизы самостоятельно, получив только запрос от пользователя. Однако, это не означает, что современные технологии, в частности, машинное обучение (ML) не могут помочь в достижении заявленной цели, автоматизируя процесс обработки текста в сценарий для экспертизы инженерных решений, который сможет прочитать программное обеспечение.
Эволюция норм и стандартов
Вопрос о преобразовании нормативных документов в сервис, способный автоматизировать производственные процессы, уже давно исследуется на Западе. Наибольшую популярность получила схема развития стандартизации по классификации ИСО (МЭК), которая впервые ввела термин «SMART-стандарт», «машиночитаемый документ», «машинопонимаемый формат», используемые и в России.
Распоряжением Правительства РФ от 31.10.2022 № 3268-р утверждена «Стратегия развития строительной отрасли и жилищно-коммунального хозяйства Российской Федерации на период до 2030 года с прогнозом до 2035 года». Стратегией намечены направления по:
- совершенствованию системы технического регулирования страны.
В рамках этого направления, в том числе, предусмотрены следующие мероприятия: устранение излишних, противоречивых, дублирующих нормативных технических требований в строительстве, перевод нормативных технических документов в машиночитаемый и машинопонимаемый форматы. Результатами таких мероприятий должна быть: актуализация и перевод в машиночитаемый и машинопонимаемый форматы документов по стандартизации в сфере проектирования и строительства (более 3000 документов). - цифровой трансформации отрасли строительства и жилищно-коммунального хозяйства.
Поставлена задача по формированию методологической, нормативной правовой базы для обеспечения надлежащего уровня «цифровой зрелости» и перевод нормативно-технической документации в машиночитаемый формат.
Иными словами, данная Стратегия предполагает необходимость преобразования текстов нормативных документов, написанных на естественном языке и понятных человеку — в вид исполняемого сценария, которое может прочитать и понять программное обеспечение, функционально реализующее проверку сводной ИМ (ЦИМ) на наличие нормативных нарушений или, САПР, в котором ведется разработка ИМ (ЦИМ).
Комментарии