Распознавание речи на 37 языках

SOFTWARE COMPLEX FOR PROCESSING MULTIMEDIA DATA

ASM_STT.

Version 1
FEATURES

Идентификация языков

Диаризация (разделение дикторов в моно-канале)

Детектор голосовой активности (VAD)

Голосовая биометрия

Speech sithesis

Адаптация моделей распознавания речи конечным пользователем

Speech recognition for 37 languages

Определение технических характеристик

постобработка результатов распознавания (преобразование слов в цифры, капитализация)

phrases confidence

words confidence

n-best list
время начала и конца произнесения каждого слова

punctuations

расстановка ударений исходя из контекста (снятие омографов)

изменение скорости воспроизведения без изменения тембра

чтение сокращений, дат, валют и другое

изменение тембра произнесения

пунктуационная паузация

SSML-support

точность идентификации в телефонном канале выше 97%

от 3 секунд речи
65 языков

создание моделей по нескольким образцам речи

от 3 секунд речи

anti-spoofing (определение подделки голоса)

разделение на фиксированное или произвольное количество дикторов

поддержка различных аудиоканалов (телефон, ближний микрофон)

длительность речи в сигнале

пол диктора

возрастная категория (взрослый, ребенок)

качество речевого сигнала

наличие в сигнале специфических шумов (гудки, автоинформатор, шум и другие)

автоматизированное расширение словаря и перестроение лингвистической модели по текстам

модификация языковых вероятностей отдельных слов

ручное добавление новых слов

просмотр и модификация списка слов и транскрипций

50 SPEECH RECOGNITION LANGUAGES

1. Azerbaijan language
2. English language
3. Arabic, Levantine dialect
4. Arabic, a dialect of the regions of Palestine and Tunisia
5. Arabic, Iraqi dialect
6. Arabic, Modern Standard Arabic (msa)
7. Arabic, Egyptian dialect
8. Arabic, Moroccan dialect
9. Arabic, Algerian dialect
10. Arabic, Libyan dialect
11. Arabic, Sudanese dialect
12. Armenian language
13. Afrikaans
14. Bulgarian language
15. Vietnamese language
16. Georgian language
17. Dari
18. Hebrew
19. Spanish
20. Italian language
21. Kazakh language
22. Kyrgyz language
23. Chinese language
24. Korean language
25. Kurdish language (Kurmanji dialect)
26. Kurdish (Sorani dialect)
27. Latvian language
28. Lithuanian language
29. Mongolian language
30. German language
31. Polish language
32. Portuguese language
33. Pashto
34. Romanian language
35. Russian language
36. Tajik language
37. Turkish language
38. Turkmen language
39. Uzbek language
40. Ukrainian language
41. Ukrainian language, surzhik
42. Urdu
43. Czech language
44. Persian Language (Farsi)
45. Finnish language
46. French language
47. Hindi
48. Croatian language
49. Estonian language
50. Japanese language
ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ

Большой объем и разнообразие обучающих выборок (тысячи часов речи)

Обработка звуковых- и видеофайлов различных форматов, любого объема и качества

Обработка больших объемов речевой информации

Поддержка протоколов REST API, MRCP, GRPC, XML RPC

Высокоскоростной декодер для CPU и GPU

Облако и on-premise (работает в периметре заказчика и в облаке)

Кроссплатформенность (Ubuntu, Centos, RHEL, Astra Linux, Windows и другие)

Горизонтальное и вертикальное масштабирование
Вся функциональность доступна через API
ПОЧЕМУ МЫ?

Адаптируем модели распознавания под конкретные тематики

Поддержка на всех уровнях от интеграции до использования
Прямая связь с разработчиками
Качественное выполнение работ в сжатые сроки

Быстрая интеграция API

СРЕДА ПРИМЕНЕНИЯ

Единая Биометрическая Система

Контакт-центры различного масштаба: банки и сотовые операторы, автодилеры и салоны красоты

Ритейл - распознавание записей с диктофонов-бейджей и микрофонов, переговоры диспетчеров и производственных сотрудников, монтажников по рации

Системы мониторинга и анализа СМИ и социальных сетей

ТВ каналы, блогеры, авторы видео-курсов

РЕШАЕМЫЕ ЗАДАЧИ
- 2 -
Заполнение электронных форм и документов
Автоматизация IVR
- 9 -
- 10 -
Аутентификация по голосу в контакт-центрах и в мобильных приложениях
- 9 -

Речевая аналитика

- 3 -
- 8 -
Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

Голосовой канал для чат-ботов

- 4 -
Стенографирование телефонных переговоров
Стенографирование телефонных переговоров
- 1 -

Отекстовка сюжетов новостей, интернет-вещания СМИ, аудио и видео сюжетов различных тематик

Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

- 8 -
- 3 -

Стенографирование телефонных переговоров

- 4 -
Речевая аналитика
- 5 -

Протоколирование аудио/ видео мероприятий

- 7 -

Антифрод системы в банках

Антифрод системы в банках
- 5 -

Автоматизация IVR

- 6 -
Протоколирование аудио/ видео мероприятий
- 7 -

Аутентификация по голосу в контакт-центрах и в мобильных приложениях

- 10 -
Для предварительного определения стоимости клиент заполняет опросный лист и направляет его для уточнения исходных данных и составления проекта договора или коммерческого предложения на поставку.
Стоимость ASM_STT определяется функциональными возможностями, необходимостью использования различных языков распознавания речи в текст, количества обрабатываемых каналов, а также объемом работ по возможной доработке, установке и пусконаладке.
СТОИМОСТЬ
Стоимость в облаке не более 16 коп. за минуту
ДОКУМЕНТАЦИЯ
ХОТИТЕ УЗНАТЬ ПОДРОБНЕЕ?
Заполните заявку и мы подберем для вас оптимальное решение
КОНТАКТЫ
E-mail: sales@asmsolutions.ru
г. Москва, Новая площадь,
д. 10, этаж 5, офис 52
ООО «АСМ Решения»