admin / 12.01.2018

Speech API 5.1 — Официальная версия

Хорошо, в основном я делаю Jarvis AI на С# и много делаю. Но в последнее время мне стало известно, что вы можете распознать Google Speech в программе С# WPF. Поэтому я решил перейти от Windows Speech API (SAPI) к Google, главным образом из-за крайней точности.

Тестирование: http://slides.html5rocks.com/#speech-input

Люди сумели получить свои программы, чтобы иметь возможность сделать это в клиентской версии программы (не в браузере веб-сайта), но по какой-то причине я не могу найти документацию об этом. Поэтому я призываю вас, ребята, помочь мне получить участие в этом запуске или, по крайней мере, получить ответ от речевого репортажа Google. в программе С#.

Этот парень: http://social.msdn.microsoft.com/Forums/vstudio/en-US/9e5bd36d-0916-4f92-8c4e-01f35b94d5d1/google-chrome-speech-api-help?forum=vbgeneral

Он смог заставить это работать в VB, и сказал что-то о преобразовании из VB в С#, но им только некоторые, что свободно говорит на С#.

Теперь я знаю, что он в основном дает ответ Google, когда клиентская программа отправляет им файл .Flac. Затем они декодируют его на слова (речь на текст), затем слова будут взяты и в основном совпадают со строковым выражением в клиентской программе. Зачем следует команда.

Теперь я планирую использовать часть Windows API, чтобы он говорил вам и, по сути, зачитывал вещи. Но для этого мне нужно распознавание речи Google.

Спасибо, Джо.

c#wpf

задан Joe Meyer 11 февр. '14 в 2:21

источникподелиться

Google speech api v2 для чайников

Microsoft Speech Application Programming Interface (Speech API, SAPI) — библиотека программ для Windows, позволяющая распознавать и синтезировать голос в приложениях для этой операционной системы.

Speech API активно используется в программах по преобразованию текста в голос (читалках), а также для голосового управления операционной системой и отдельными программами.

SAPI 4.0 вышел в 1998 году. Он входил в состав пакета SDK, содержащего инструменты для распознавания и синтеза речи. Также он входил в операционную систему Windows 2000 (только с возможностью синтеза речи).

Версия SAPI 5.1 вышла в 2001 году как составная часть Speech SDK 5.1. Эта версия входила в состав ОС Windows XP.

В операционной системе Windows Vista установлена версия SAPI 5.3, а в Windows 7 — SAPI 5.4.

Внимание:

Поскольку большинство современных операционных систем Windows уже содержат SAPI4 или SAPI5, то устанавливать их не нужно. Однако возможны случаи, когда такая необходимость возникает. Будьте особенно внимательны при установке библиотеки SAPI 5.1 — установка этой версии на компьютеры, где уже установлена высшая версия SAPI (5.3 или 5.4), может привести к ухудшению работы программ, его использующих.

Дополнительные материалы

Изменения в последней версии (история изменений)

— В SAPI 5.1 есть возможность использования Win32 Speech API (SAPI) для сторонних приложений написанных на Visual Basic®, ECMAScript и других языках.
— SDK также содержит свободно распространяемые движки text-to-speech (TTS) (американский английский и упрощенный китайский) и движки распознавания речи (американский английский, упрощенный китайский и японский.

Последние комментарии читать все (6)

Инструкция:   Нажмите иконку микрофона и затем говорите.

Распознавание речи на RPI2 с помощью Google Speech API

Рекомендуем диктовать по одному предложению. Когда программа распознает вашу речь, текст появится на экране, выделенный красным цветом.

Если текст был распознан неправильно, нажмите на кнопку «Варианты» и просмотрите другие варианты распознавания, отредактируйте текст или просто продиктуйте снова. Если текст был распознан без ошибок, нажмите кнопку со стрелкой вниз , и ваш текст будет перенесен в текстовое поле внизу.

Повторяя эти действия, надиктуйте ваш текст до конца.

Когда вы закончили диктовать, нажмите кнопку «Копировать» и вставьте скопированный текст в документ, письмо, блог или твит! (Если вы не можете воспользоваться кнопкой «Копировать», используйте сочетание клавиш Ctrl-C.)

Более того, вы также можете диктовать некоторые основные знаки препинания.

Click on the microphone icon and begin speaking for as long as you like.

Speak now.

No speech was detected. You may need to adjust your microphone settings.

No microphone was found.

API сервиса Google для распознавания речи — существует ли, и как до него добраться?

Ensure that a microphone is installed and that microphone settings are configured correctly.

Click the «Allow» button above to enable your microphone.

Permission to use microphone was denied.

Permission to use microphone is blocked. To change, go to chrome://settings/contentExceptions#media-stream

Web Speech API is not supported by this browser. Upgrade to Chrome version 25 or later.

Press Control-C to copy text.

(Command-C on Mac.)

Text sent to default email application.

(See chrome://settings/handlers to change.)

  

Google Chrome начиная с 11 версии поддерживает распознавание речи средствами HTML 5 без каких либо дополнительных плагинов. Если у вас установлен Хром нужной версии, то обратите внимание на поисковую строку нашего сайта в правом верхнем углу. Там появился значок микрофона, по нажатию на который можно ввести текст голосом, а не руками. Работает не идеально, но многие русские слова понимает без проблем.

Сделать текстовые поля пригодными для ввода голосом может любой вебмастер без каких либо проблем. Для этого достаточно добавить x-webkit-speech в тег input.

Распознавание речи онлайн. Google Web Speech API.

К примеру так:

<input type=text x-webkit-speech />

Возможно когда нибудь комментарии и статьи станет проще писать сразу голосом…

UPD. Каким-то странным алгоритмом определяется язык говорящего. На нашем сайте это почему то почти всегда русский, а вот на некоторых других принудительно выдает английские варианты. И это не есть хорошо… У кого то есть идеи? Язык браузера тут точно не при чем.

Друзья, я знаю что наверняка я не первый уже это спрашиваю, но может кто использовал в своих работах распознаватель от гугла ? Смотрел статьи на хабре, но без примеров я не могу понять как оно работает. Поделитесь своими знаниями по распознаванию.

Преобразование речи в текст с помощью онлайн-сервисов

Или скиньте какой-нибудь пример рабочий, самый простетский. Мне только нужно чтобы речь (команда — 1-3 слова) выводилась в textBox. Для чего мне это нужно ? Вот, хочу заставить свою железяку ездить по команде =] Буду очень благодарен ! Сразу скажу, делаю для себя и для общего развития, не для комерческих целей — для участия в соревнованиях и только.

Код к задаче: «Распознавание речи в текст, Google — C#»

textualvoid waveIn_DataAvailable(object sender, WaveInEventArgs e)         {             byte[] buffer = e.Buffer;             int k = buffer.Length;             int bytesRecorded = e.BytesRecorded;                           for (int index = 0; index < e.BytesRecorded; index += 2)             {                 short sample = (short)((buffer[index + 1] << 8) |                                         buffer[index + 0]);                 float sample32 = sample / 32768f;                 list.Add(sample32);             }         }

Вы всегда можете заказать любую учебную работу у наших авторов от 20 руб.

FILED UNDER : IT

Submit a Comment

Must be required * marked fields.

:*
:*