ПРОГРАММНЫЙ КОМПЛЕКС ОБРАБОТКИ МУЛЬТИМЕДИЙНЫХ ДАННЫХ
Версия 1

ASM_STT.

ВОЗМОЖНОСТИ
Идентификация языков
Диаризация (разделение дикторов в моно-канале)
Детектор голосовой активности (VAD)
Голосовая биометрия
Синтез речи
Адаптация моделей распознавания речи конечным пользователем
Транскрибирование (распознавание) речи на 37 языках
Определение технических характеристик
постобработка результатов распознавания (преобразование слов в цифры, капитализация)
уровень уверенности распознавания фразы
уровень уверенности распознавания каждого слова
несколько возможных гипотез распознавания фраз
время начала и конца произнесения каждого слова
расстановка знаков препинания
расстановка ударений исходя из контекста (снятие омографов)
изменение скорости воспроизведения без изменения тембра
чтение сокращений, дат, валют и другое
изменение тембра произнесения
пунктуационная паузация
поддержка SSML
точность идентификации в телефонном канале выше 97%
от 3 секунд речи
65 языков
создание моделей по нескольким образцам речи
от 3 секунд речи
разделение на фиксированное или произвольное количество дикторов
поддержка различных аудиоканалов (телефон, ближний микрофон)
длительность речи в сигнале
пол диктора
возрастная категория (взрослый, ребенок)
качество речевого сигнала
наличие в сигнале специфических шумов (гудки, автоинформатор, шум и другие)
автоматизированное расширение словаря и перестроение лингвистической модели по текстам
модификация языковых вероятностей отдельных слов
ручное добавление новых слов
просмотр и модификация списка слов и транскрипций
37 ЯЗЫКОВ РАСПОЗНАВАНИЯ РЕЧИ
20. Немецкий язык
21. Польский язык
22. Португальский язык
23. Пушту
24. Румынский язык
25. Русский язык
26. Таджикский язык
27. Турецкий язык
28. Узбекский язык
29. Украинский язык
30. Украинский язык, суржик
31. Урду
32. Чешский язык
33. Фарси
34. Финский язык
35. Французский язык
36. Эстонский язык
37. Японский язык
1. Азербайджанский язык
2. Английский язык
3. Арабский язык, левантийский диалект
4. Арабский язык, диалект регионов Палестины и Туниса
5. Арабский язык, иракский диалект
6. Арабский язык, современный стандартный арабский (msa)
7. Армянский язык
8. Болгарский язык
9. Вьетнамский язык
10. Грузинский язык
11. Иврит
12. Испанский язык
13. Итальянский язык
14. Казахский язык
15. Киргизский язык
16. Китайский язык
17. Корейский язык
18. Латышский язык
19. Литовский язык
1. Азербайджанский язык
2. Английский язык
3. Арабский язык, левантийский диалект
4. Арабский язык, диалект регионов Палестины и Туниса
5. Арабский язык, иракский диалект
6. Арабский язык, современный стандартный арабский (msa)
7. Армянский язык
8. Болгарский язык
9. Вьетнамский язык
10. Грузинский язык
11. Иврит
12. Испанский язык
13. Итальянский язык
14. Казахский язык
15. Киргизский язык
16. Китайский язык
17. Корейский язык
18. Латышский язык
19. Литовский язык
20. Немецкий язык
21. Польский язык
22. Португальский язык
23. Пушту
24. Румынский язык
25. Русский язык
26. Таджикский язык
27. Турецкий язык
28. Узбекский язык
29. Украинский язык
30. Украинский язык, суржик
31. Урду
32. Чешский язык
33. Фарси
34. Финский язык
35. Французский язык
36. Эстонский язык
37. Японский язык
ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ
Большой объем и разнообразие обучающих выборок (тысячи часов речи)
Обработка звуковых- и видеофайлов различных форматов, любого объема и качества
Обработка больших объемов речевой информации
Поддержка протоколов REST API, MRCP, GRPC, XML RPC
Высокоскоростной декодер для CPU и GPU
Облако и on-premise (работает в периметре заказчика и в облаке)
Кроссплатформенность (Ubuntu, Centos, RHEL, Astra Linux, Windows и другие)
Горизонтальное и вертикальное масштабирование
Вся функциональность доступна через API
ПОЧЕМУ МЫ?
Адаптируем модели распознавания под конкретные тематики
Поддержка на всех уровнях от интеграции до использования
Прямая связь с разработчиками
Качественное выполнение работ в сжатые сроки
Быстрая интеграция API
СРЕДА ПРИМЕНЕНИЯ
Единая Биометрическая Система
Контакт-центры различного масштаба: банки и сотовые операторы, автодилеры и салоны красоты
Ритейл - распознавание записей с диктофонов-бейджей и микрофонов, переговоры диспетчеров и производственных сотрудников, монтажников по рации
Системы мониторинга и анализа СМИ и социальных сетей
ТВ каналы, блогеры, авторы видео-курсов
РЕШАЕМЫЕ ЗАДАЧИ
- 2 -
Заполнение электронных форм и документов
Автоматизация IVR
- 9 -
- 10 -
Аутентификация по голосу в контакт-центрах и в мобильных приложениях
- 9 -
Речевая аналитика
- 3 -
- 8 -
Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)
Голосовой канал для чат-ботов
- 4 -
Стенографирование телефонных переговоров
Стенографирование телефонных переговоров
- 1 -
Отекстовка сюжетов новостей, интернет-вещания СМИ, аудио и видео сюжетов различных тематик
Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)
- 8 -
- 3 -
Стенографирование телефонных переговоров
- 4 -
Речевая аналитика
- 5 -
Протоколирование аудио/ видео мероприятий
- 7 -
Антифрод системы в банках
Антифрод системы в банках
- 5 -
Автоматизация IVR
- 6 -
Протоколирование аудио/ видео мероприятий
- 7 -
Аутентификация по голосу в контакт-центрах и в мобильных приложениях
- 10 -
Для предварительного определения стоимости клиент заполняет опросный лист и направляет его для уточнения исходных данных и составления проекта договора или коммерческого предложения на поставку.
Стоимость ASM_STT определяется функциональными возможностями, необходимостью использования различных языков распознавания речи в текст, количества обрабатываемых каналов, а также объемом работ по возможной доработке, установке и пусконаладке.
СТОИМОСТЬ
Стоимость в облаке не более 16 коп. за минуту
ХОТИТЕ УЗНАТЬ ПОДРОБНЕЕ?
Заполните заявку и мы подберем для вас оптимальное решение
КОНТАКТЫ
E-mail: sales@asmsolutions.ru
г. Москва, Новая площадь,
д. 10, этаж 5, офис 52
ООО «АСМ Решения»