I am ready for a long road flight for work with a week- or months-long projects.

SOFTWARE COMPLEX FOR PROCESSING MULTIMEDIA DATA

ASM_STT.

Version 1

от 3 секунд речи

создание моделей по нескольким образцам речи

anti-spoofing (определение подделки голоса)

разделение на фиксированное или произвольное количество дикторов

поддержка различных аудиоканалов (телефон, ближний микрофон)

наличие в сигнале специфических шумов (гудки, автоинформатор, шум и другие)

качество речевого сигнала

возрастная категория (взрослый, ребенок)

пол диктора

длительность речи в сигнале

просмотр и модификация списка слов и транскрипций

ручное добавление новых слов

модификация языковых вероятностей отдельных слов

автоматизированное расширение словаря и перестроение лингвистической модели по текстам

FEATURES

Speech recognition for 37 languages

Speech sithesis

Голосовая биометрия

Идентификация языков

Диаризация (разделение дикторов в моно-канале)

Детектор голосовой активности (VAD)

Адаптация моделей распознавания речи конечным пользователем

SSML-support

пунктуационная паузация

изменение тембра произнесения

чтение сокращений, дат, валют и другое

изменение скорости воспроизведения без изменения тембра

расстановка ударений исходя из контекста (снятие омографов)

Определение технических характеристик

punctuations

время начала и конца произнесения каждого слова

n-best list

words confidence

phrases confidence

постобработка результатов распознавания (преобразование слов в цифры, капитализация)

65 языков

от 3 секунд речи

точность идентификации в телефонном канале выше 97%

50 SPEECH RECOGNITION LANGUAGES

1. Azerbaijan language
2. English language
3. Arabic, Levantine dialect
4. Arabic, a dialect of the regions of Palestine and Tunisia
5. Arabic, Iraqi dialect
6. Arabic, Modern Standard Arabic (msa)
7. Arabic, Egyptian dialect
8. Arabic, Moroccan dialect
9. Arabic, Algerian dialect
10. Arabic, Libyan dialect
11. Arabic, Sudanese dialect
12. Armenian language
13. Afrikaans
14. Bulgarian language
15. Vietnamese language
16. Georgian language
17. Dari
18. Hebrew
19. Spanish
20. Italian language
21. Kazakh language
22. Kyrgyz language
23. Chinese language
24. Korean language
25. Kurdish language (Kurmanji dialect)

26. Kurdish (Sorani dialect)
27. Latvian language
28. Lithuanian language
29. Mongolian language
30. German language
31. Polish language
32. Portuguese language
33. Pashto
34. Romanian language
35. Russian language
36. Tajik language
37. Turkish language
38. Turkmen language
39. Uzbek language
40. Ukrainian language
41. Ukrainian language, surzhik
42. Urdu
43. Czech language
44. Persian Language (Farsi)
45. Finnish language
46. French language
47. Hindi
48. Croatian language
49. Estonian language
50. Japanese language

Большой объем и разнообразие обучающих выборок (тысячи часов речи)

Обработка звуковых- и видеофайлов различных форматов, любого объема и качества

Обработка больших объемов речевой информации

Поддержка протоколов REST API, MRCP, GRPC, XML RPC

Высокоскоростной декодер для CPU и GPU

Облако и on-premise (работает в периметре заказчика и в облаке)

Кроссплатформенность (Ubuntu, Centos, RHEL, Astra Linux, Windows и другие)

Горизонтальное и вертикальное масштабирование

Вся функциональность доступна через API

ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ

Быстрая интеграция API

Качественное выполнение работ в сжатые сроки

Прямая связь с разработчиками

Поддержка на всех уровнях от интеграции до использования

Адаптируем модели распознавания под конкретные тематики

ПОЧЕМУ МЫ?

Контакт-центры различного масштаба: банки и сотовые операторы, автодилеры и салоны красоты

Ритейл - распознавание записей с диктофонов-бейджей и микрофонов, переговоры диспетчеров и производственных сотрудников, монтажников по рации

Системы мониторинга и анализа СМИ и социальных сетей

ТВ каналы, блогеры, авторы видео-курсов

СРЕДА ПРИМЕНЕНИЯ

Единая Биометрическая Система

Отекстовка сюжетов новостей, интернет-вещания СМИ, аудио и видео сюжетов различных тематик

- 1 -

- 8 -

Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

Стенографирование телефонных переговоров

- 3 -

Речевая аналитика

- 4 -

Протоколирование аудио/ видео мероприятий

- 5 -

Антифрод системы в банках

- 7 -

- 5 -

Антифрод системы в банках

- 6 -

Автоматизация IVR

- 7 -

Протоколирование аудио/ видео мероприятий

- 10 -

Аутентификация по голосу в контакт-центрах и в мобильных приложениях

РЕШАЕМЫЕ ЗАДАЧИ

Заполнение электронных форм и документов

- 2 -

Стенографирование телефонных переговоров

- 4 -

Голосовой канал для чат-ботов

- 9 -

Стенографирование телефонных переговоров

- 3 -

Речевая аналитика

- 9 -

Автоматизация IVR

Аутентификация по голосу в контакт-центрах и в мобильных приложениях

- 10 -

Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

- 8 -

СТОИМОСТЬ

Стоимость ASM_STT определяется функциональными возможностями, необходимостью использования различных языков распознавания речи в текст, количества обрабатываемых каналов, а также объемом работ по возможной доработке, установке и пусконаладке.

Для предварительного определения стоимости клиент заполняет опросный лист и направляет его для уточнения исходных данных и составления проекта договора или коммерческого предложения на поставку.

Стоимость в облаке не более 16 коп. за минуту

ДОКУМЕНТАЦИЯ

Описание применения ASM_STT

ХОТИТЕ УЗНАТЬ ПОДРОБНЕЕ?

Заполните заявку и мы подберем для вас оптимальное решение

КОНТАКТЫ

г. Москва

E-mail: sales@asmsolutions.ru