I am ready for a long road flight for work with a week- or months-long projects.

ПРОГРАММНЫЙ КОМПЛЕКС ОБРАБОТКИ МУЛЬТИМЕДИЙНЫХ ДАННЫХ

ASM_STT.

Версия 1

включен в Единый реестр российских программ для ЭВМ и БД

от 3 секунд речи

создание моделей по нескольким образцам речи

anti-spoofing (определение подделки голоса)

разделение на фиксированное или произвольное количество дикторов

поддержка различных аудиоканалов (телефон, ближний микрофон)

наличие в сигнале специфических шумов (гудки, автоинформатор, шум и другие)

качество речевого сигнала

возрастная категория (взрослый, ребенок)

пол диктора

длительность речи в сигнале

просмотр и модификация списка слов и транскрипций

ручное добавление новых слов

модификация языковых вероятностей отдельных слов

автоматизированное расширение словаря и перестроение лингвистической модели по текстам

ВОЗМОЖНОСТИ

Транскрибирование (распознавание) речи на 55 языках

Синтез речи

Голосовая биометрия

Идентификация языков

Диаризация (разделение дикторов в моно-канале)

Детектор голосовой активности (VAD)

Адаптация моделей распознавания речи конечным пользователем

поддержка SSML

пунктуационная паузация

изменение тембра произнесения

чтение сокращений, дат, валют и другое

изменение скорости воспроизведения без изменения тембра

расстановка ударений исходя из контекста (снятие омографов)

Определение технических характеристик

расстановка знаков препинания

время начала и конца произнесения каждого слова

несколько возможных гипотез распознавания фраз

уровень уверенности распознавания каждого слова и фразы

перевод распознанного текста на русский язык

постобработка результатов распознавания (преобразование слов в цифры, капитализация)

более 115 языков

от 3 секунд речи

точность идентификации в телефонном канале выше 98%

55 ЯЗЫКОВ РАСПОЗНАВАНИЯ РЕЧИ

1. Абхазский язык
2. Азербайджанский язык
3. Английский язык
4. Арабский язык, левантийский диалект
5. Арабский язык, диалект регионов Палестины и Туниса
6. Арабский язык, иракский диалект
7. Арабский язык, современный стандартный арабский (msa)
8. Арабский язык, египетский диалект
9. Арабский язык, марокканский диалект
10. Арабский язык, алжирский диалект
11. Арабский язык, ливийский диалект
12. Арабский язык, суданский диалект
13. Армянский язык
14. Африкаанс
15. Болгарский язык
16. Вьетнамский язык
17. Голландский язык
18. Грузинский язык
19. Дари
20. Иврит
21. Индонезийский язык
22. Испанский язык
23. Итальянский язык
24. Казахский язык
25. Киргизский язык
26. Китайский язык
27. Корейский язык
28. Курдский язык (диалект Курманджи)

29. Курдский язык (диалект Сорани)
30. Латышский язык
31. Литовский язык
32. Монгольский язык
33. Немецкий язык
34. Польский язык
35. Португальский язык
36. Пушту
37. Румынский язык
38. Русский язык
39. Таджикский язык
40. Турецкий язык
41. Туркменский язык
42. Узбекский язык
43. Украинский язык
44. Украинский язык, суржик
45. Урду
46. Чешский язык
47. Персидский язык (Фарси)
48. Финский язык
49. Французский язык
50. Хинди
51. Хорватский язык
52. Шведский язык
53. Эстонский язык
54. Японский язык
55. Тайский язык
56. Суахили
57. Малайский язык

1. Абхазский язык
2. Азербайджанский язык
3. Английский язык
4. Арабский язык, левантийский диалект
5. Арабский язык, диалект регионов Палестины и Туниса
6. Арабский язык, иракский диалект
7. Арабский язык, современный стандартный арабский (msa)
8. Арабский язык, египетский диалект
9. Арабский язык, марокканский диалект
10. Арабский язык, алжирский диалект
11. Арабский язык, ливийский диалект
12. Арабский язык, суданский диалект
13. Армянский язык
14. Африкаанс
15. Болгарский язык
16. Вьетнамский язык
17. Голландский язык
18. Грузинский язык
19. Дари
20. Иврит
21. Испанский язык
22. Итальянский язык
23. Казахский язык
24. Киргизский язык
25. Китайский язык
26. Корейский язык
27. Курдский язык (диалект Курманджи)
28. Курдский язык (диалект Сорани)
29. Латышский язык
30. Литовский язык
31. Монгольский язык
32. Немецкий язык
33. Польский язык
34. Португальский язык
35. Пушту
36. Румынский язык
37. Русский язык
38. Таджикский язык
39. Турецкий язык
40. Туркменский язык
41. Узбекский язык
42. Украинский язык
43. Украинский язык, суржик
44. Урду
45. Чешский язык
46. Персидский язык (Фарси)
47. Финский язык
48. Французский язык
49. Хинди
50. Хорватский язык
51. Шведский язык
52. Эстонский язык
53. Японский язык
54. Индонезийский язык
55. Тайский язык

ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ

Облако и on-premise (работает в периметре заказчика и в облаке)

Кроссплатформенность (Ubuntu, Centos, RHEL, Astra Linux, Windows и другие)

Горизонтальное и вертикальное масштабирование

Высокоскоростной декодер для CPU и GPU

Обработка больших объемов речевой информации

Поддержка протоколов REST API, MRCP, GRPC, XML RPC

Вся функциональность доступна через API

Большой объем и разнообразие обучающих выборок (тысячи часов речи)

Обработка звуковых- и видеофайлов различных форматов, любого объема и качества

ПОЧЕМУ МЫ?

Быстрая интеграция API

Качественное выполнение работ в сжатые сроки

Прямая связь с разработчиками

Поддержка на всех уровнях от интеграции до использования

Адаптируем модели распознавания под конкретные тематики

Контакт-центры различного масштаба: банки и сотовые операторы, автодилеры и салоны красоты

Ритейл - распознавание записей с диктофонов-бейджей и микрофонов, переговоры диспетчеров и производственных сотрудников, монтажников по рации

Системы мониторинга и анализа СМИ и социальных сетей

ТВ каналы, блогеры, авторы видео-курсов

СРЕДА ПРИМЕНЕНИЯ

Единая Биометрическая Система

Отекстовка сюжетов новостей, интернет-вещания СМИ, аудио и видео сюжетов различных тематик

- 1 -

- 8 -

Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

Стенографирование телефонных переговоров

- 3 -

Речевая аналитика

- 4 -

Протоколирование аудио/ видео мероприятий

- 5 -

Антифрод системы в банках

- 7 -

- 5 -

Антифрод системы в банках

- 6 -

Автоматизация IVR

- 7 -

Протоколирование аудио/ видео мероприятий

- 10 -

Аутентификация по голосу в контакт-центрах и в мобильных приложениях

РЕШАЕМЫЕ ЗАДАЧИ

Заполнение электронных форм и документов

- 2 -

Стенографирование телефонных переговоров

- 4 -

Голосовой канал для чат-ботов

- 9 -

Стенографирование телефонных переговоров

- 3 -

Речевая аналитика

- 9 -

Автоматизация IVR

Аутентификация по голосу в контакт-центрах и в мобильных приложениях

- 10 -

Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

- 8 -

СТОИМОСТЬ

Стоимость ASM_STT определяется функциональными возможностями, необходимостью использования различных языков распознавания речи в текст, количества обрабатываемых каналов, а также объемом работ по возможной доработке, установке и пусконаладке.

Для предварительного определения стоимости клиент заполняет опросный лист и направляет его для уточнения исходных данных и составления проекта договора или коммерческого предложения на поставку.

Стоимость в облаке не более 70 коп. за минуту

ДОКУМЕНТАЦИЯ

Описание применения ASM_STT

ХОТИТЕ УЗНАТЬ ПОДРОБНЕЕ?

Заполните заявку и мы подберем для вас оптимальное решение

КОНТАКТЫ

г. Москва

E-mail: sales@asmsolutions.ru