04 Июля 2019

Русский язык оцифруют для машинного обучения

Проект реализует Дальневосточный федеральный университет

В школе цифровой экономики ДВФУ создадут цифровой корпус русского языка для обучения машин, нейросетей и разработки синтетической личности на основе искусственного интеллекта.

Как сообщили в вузе, сбор материала будет происходить через сайт и мобильное приложение. Первичный этап накопления языкового материала планируется завершить через год, после чего начнется его оцифровка.

Для реализации проекта будут привлечены профессиональные лингвисты и специалисты по компьютерной лингвистике, которые займутся качественной разметкой аудиоматериала: разобьют его на части речи, проставят ударения, паузы, разделят на диалоги и монологи и др.

 

Аналитика