Ученые Новосибирского госуниверситета разработали сервис по автоматическому созданию аудиоверсий научной литературы
В Новосибирском государственном университете запущен сервис по автоматическому созданию аудиоверсий книг из оцифрованной части фонда Научной библиотеки университета. Проект основан на разработках Исследовательского центра искусственного интеллекта (Центра ИИ) НГУ и проходит этап апробации. После успешного выполнения пилотного проекта технологию планируется предложить другим библиотекам.
На данном этапе речь идет о переводе в аудиоформат книг университетского издательства и материалов, размещенных в электронной библиотеке, с разрешения правообладателей — всего около семи тысяч наименований.
Озвучивание выполняет нейросеть: текст извлекается из PDF, проходит предварительную обработку, после чего формируется звуковая версия.
— В перспективе мы планируем перевести в аудиоформат все книги, представленные в электронной библиотеке НГУ. Сейчас это около 7 тысяч изданий, — рассказал ведущий научный сотрудник Центра искусственного интеллекта НГУ, кандидат физико-математических наук Евгений Павловский.
По его словам, сервис не предполагает полной замены традиционного чтения, а создается как альтернативная форма доступа к тексту.
Сервис создан на базе фреймворка «Каппа», разработанного в Центре ИИ НГУ. Он предназначен для управления датасетами и моделями искусственного интеллекта, их тестирования и оценки перед внедрением в рабочие процессы. Фреймворк позволяет проверять корректность работы моделей и снижать риск ошибок или так называемых «галлюцинаций» ИИ. В новом проекте «Каппа» используется для подготовки обучающих данных для озвучки и сбора обратной связи о качестве результата.
Источник: НГУ
Комментарии