Комментировать

Технология ML для преобразования нормативных документов в машинопонимаемый формат и проверки ИМ(ЦИМ)

Кутузова О.К.,
продакт-менеджер NSR Specification
ООО «Нанософт разработка»

Одним из наиболее перспективных направлений цифровизации строительства является автоматизация поиска нормативных нарушений непосредственно на этапе проектирования, для реализации которой требуется переработать массив действующих норм и стандартов сначала в машиночитаемый, а затем в машинопонимаемый вид. В статье речь идет об опыте, проблемах, текущих результатах применения интеллектуальных методов обработки естественных языков, в частности, методики семантического анализа.

На сегодняшний день существуют две тенденции, определяющие направление развития области проектирования:

  • цифровизация строительства, которая в основном выражается во внедрении технологии информационного моделирования;
  • применение современных технологий AI (искусственный интеллект) и ML (машинное обучение) для автоматизации обработки информации.

Потенциально эти направления могут существенно оптимизировать работу на всех этапах строительного процесса и привести к повышению качества возводимых объектов и дальнейшей их эксплуатации. Рассмотрим возможность автоматизации процесса экспертизы инженерных решений на соответствие нормативным документам.

Эксперты станут не нужны?

Как только появилась новость о Сhat GPT, тут же на самых разных уровнях заговорили о возможности проверки с его помощью соответствия выпускаемых проектов требованиям стандартов. Дошло до заявлений, что экспертизы будут не нужны не только в будущем, но и в настоящем.

 Решение задачи автоматизации экспертизы зависит от ответа на следующие вопросы.

  1. Какие материалы надо проверить?

Классический чертеж не совсем подходит для этой задачи, так как представляет собой набор линий, значение которых может быть понятно только человеку с инженерным образованием. Рассматривать текстовую часть документации отдельно от графики тоже не совсем корректно, если решается задача экспертизы в комплексе. Остается только трехмерная цифровая информационная модель (ЦИМ), в которой реализуется объектно-ориентированный подход, означающий, что каждый объект модели знает свое имя, характеристики, связи с другими объектами и сведения о местоположении. На текущий момент не существует единого стандарта, описывающего структурные связи и информационное наполнение ЦИМ в том объеме, в котором это нужно для воспроизведения нормативных сценариев. Есть СП 333.1325800.2020, но описанный в нем набор параметров, с одной стороны, не учитывает многие показатели, которыми должны характеризоваться объекты, а с другой – заполнение данных даже по представленному минимальному перечню слишком трудозатратно, поэтому редко выполняется на практике.

В каком же объеме следует описывать структурные связи и информационное наполнение – это и есть первое неизвестное, напрямую зависящее от второго.

  1. Что необходимо проверить?

Разумеется, соответствие требованиям нормативных документов. Вот только текст их не структурирован (требование, содержащееся в начале документа, может иметь исключение, которое указано в конце), а использованные термины порой не имеют утвержденных определений, кроме того, нередки неоднозначные формулировки, неконкретные условия (вроде требования к размещению объекта «в пределах видимости» или «для обеспечения безопасной эксплуатации»), а также опечатки, противоречия, регулярное внесение изменений и колоссальный объем документов (более 1000 только в области строительства). Конечно, объемом данных искусственный интеллект не напугать, но только если эти данные формализованы.

  1. Как перевести нормативные тексты, написанные на естественном языке, на язык понятный программному обеспечению?

При поиске ответа на этот вопрос необходимо учитывать еще и третье неизвестное. А именно функциональные особенности программного обеспечения, которое должно будет отработать сценарий проверки нормативного требования в цифровой информационной модели. Минимально должны быть представлены:

    1. выбор объектов для проверки по информационным свойствам;
    2. выбор объектов с учетом структурных связей и связей в сборках;
    3. выбор объектов по местоположению относительно других объектов.

    1. Выбор языка, с помощью которого можно будет сопоставить информационное описание объектов ЦИМ на соответствие терминам нормативного документа.

    Основная сложность заключается в том, что в нормативном документе не всегда указывается имя того, кому предъявляются требования. Иногда речь идет о возможной функциональной группировке объекта или об объекте как о части технической системы, а иногда вместо имени кому предъявляются требования используется имя изделия, материала. Собственно, для решения этой задачи и был разработан Классификатор строительной информации (КСИ). Но с его применением на практике часто возникают трудности: то нужный код отсутствует, то есть несколько дублирующих кодов для описания одного и того же…
    А самое главное – это разнообразие трактовок методики его применения.

    Подобные проблемы – абсолютная норма для нового, не имеющего аналогов (а аналогов единой системы классификации всех объектов, процессов, ресурсов, из которых состоит строительный процесс, в России по-прежнему нет). Самое главное – продолжать работу над Классификатором, привлекая на помощь авторитетных экспертов в области ТИМ.

    Становится понятно, что искусственный интеллект (далее -ИИ) не способен решить задачу экспертизы самостоятельно, получив только запрос от пользователя. Однако, это не означает, что современные технологии, в частности, машинное обучение (ML) не могут помочь в достижении заявленной цели, автоматизируя процесс обработки текста в сценарий для экспертизы инженерных решений, который сможет прочитать программное обеспечение.

    Эволюция норм и стандартов

    Вопрос о преобразовании нормативных документов в сервис, способный автоматизировать производственные процессы, уже давно исследуется на Западе. Наибольшую популярность получила схема развития стандартизации по классификации ИСО (МЭК), которая впервые ввела термин «SMART-стандарт», «машиночитаемый документ», «машинопонимаемый формат», используемые и в России.

    Распоряжением Правительства РФ от 31.10.2022 № 3268-р утверждена «Стратегия развития строительной отрасли и жилищно-коммунального хозяйства Российской Федерации на период до 2030 года с прогнозом до 2035 года». Стратегией намечены направления по:

    • совершенствованию системы технического регулирования страны.
      В рамках этого направления, в том числе, предусмотрены следующие мероприятия: устранение излишних, противоречивых, дублирующих нормативных технических требований в строительстве, перевод нормативных технических документов в машиночитаемый и машинопонимаемый форматы. Результатами таких мероприятий должна быть: актуализация и перевод в машиночитаемый и машинопонимаемый форматы документов по стандартизации в сфере проектирования и строительства (более 3000 документов).
    • цифровой трансформации отрасли строительства и жилищно-коммунального хозяйства.
      Поставлена задача по формированию методологической, нормативной правовой базы для обеспечения надлежащего уровня «цифровой зрелости» и перевод нормативно-технической документации в машиночитаемый формат.

    Иными словами, данная Стратегия предполагает необходимость преобразования текстов нормативных документов, написанных на естественном языке и понятных человеку — в вид исполняемого сценария, которое может прочитать и понять программное обеспечение, функционально реализующее проверку сводной ИМ (ЦИМ) на наличие нормативных нарушений или, САПР, в котором ведется разработка ИМ (ЦИМ).

    #цифровизация #технологии #ЦИМ
    Комментировать

    Комментарии

    Комментировать

    Вам может быть интересно

    34
    #цифровизация

    «ДОМ.РФ» готов разрабатывать цифровые сервисы для застройщиков 10 стран СНГ

    "ДОМ.РФ" готов разрабатывать цифровые сервисы для застройщиков 10 стран СНГ, анонсировал Директор подразделения "Единая информационная система в жилищной сфере" АО "ДОМ.РФ" Александр Лукьянов
    33
    #цифровизация

    «Мозги» российской нейросети и триллионы рублей от ИИ. О чем говорил Мишустин в Алма-Ате

    Председатель правительства РФ рассказал об экономическом эффекте от внедрения технологий ИИ в России, отличии российской нейросети от западной ChatGPT и российских предложениях для зарубежных партнеров
    19
    #цифровизация

    «Ростелеком» представил технологии для «умного» кампуса в НГУ

    "Ростелеком" представил инновационное комплексное решение по проектированию и строительству "умных" кампусов. Презентация состоялась в рамках рабочего визита министра экономического развития РФ Максима Решетникова в Новосибирский государственный университет (НГУ)