04 Июля 2019
Русский язык оцифруют для машинного обучения
Проект реализует Дальневосточный федеральный университет
В школе цифровой экономики ДВФУ создадут цифровой корпус русского языка для обучения машин, нейросетей и разработки синтетической личности на основе искусственного интеллекта.
Как сообщили в вузе, сбор материала будет происходить через сайт и мобильное приложение. Первичный этап накопления языкового материала планируется завершить через год, после чего начнется его оцифровка.
Для реализации проекта будут привлечены профессиональные лингвисты и специалисты по компьютерной лингвистике, которые займутся качественной разметкой аудиоматериала: разобьют его на части речи, проставят ударения, паузы, разделят на диалоги и монологи и др.