You are here

Создан конвертор речи в текст

Системы синтеза речи уже существуют, равно как и дисплеи дополненной реальности. Теперь группа юных умельцев из Нью-Йорка под руководством Дэниила Франца (Daniil Frants) объединила эти две технологии, чтобы создать систему ввода субтитров в настоящем времени (LTCCS — Live Time Closed Captioning System). Если система будет запущена в массовое производство, она сможет стать революцией в сфере вспомогательных устройств для людей с нарушениями слуха.

Система состоит из трех компонентов: компактного микрофона, который крепится на одежду пользователя, компактного карманного микрокомпьютера, работающего от Raspberry Pi/Adafruit, и дисплея наподобие очков Google Glass. Микрофон откалиброван таким образом, что он улавливает человеческую речь даже в достаточно шумной обстановке. Звук обрабатывается компьютером, который конвертирует его в текст и беспроводным путем передает эту информацию на дисплей. Прикрепленный к существующей паре обычных очков, этот дисплей в свою очередь отображает пользователю текст, наложенный на силуэт собеседника.

Как уверяют студенты, интервал между сказанным и отображением текста на дисплее совсем невелик, что весьма важно. Ребята создали одну работающую модель, ну а для серьезного выпуска им необходимо собрать 400 тысяч долларов на сайте Indiegogo. Взнос в сумме 650 долларов позволит получить LTCCS сразу же после того, как начнется выпуск устройств.

Сергей Липченко