Програмне забезпечення для генерації природної мови Amazon Polly використовує рішення глибокого навчання, щоб дозволити додаткам говорити людським голосом доступним на декількох мовах.

Огляд

Програмне забезпечення для генерації природної мови Amazon Polly фокусується на наданні технологій глибокого навчання для творців контенту, агентів підтримки клієнтів, розробників та власників бізнесу. Ця платформа SaaS дозволяє користувачам створювати програми та продукти з підтримкою мовлення. Підприємства будь-якого розміру можуть використовувати це програмне забезпечення для генерації природної мови, щоб створити власний голос для представлення свого бренду.

Amazon Polly синтезує реалістичну людську мову, використовуючи передові рішення для глибокого навчання. Це програмне забезпечення пропонує широкий спектр реалістичних голосів на декількох мовах для користувачів для розробки програм з підтримкою мовлення, які працюють у різних країнах. Крім того, ця послуга синтезу мовлення використовує методи машинного навчання, щоб забезпечити підвищення якості мовлення.

Програмне забезпечення пропонує два різних стилі мовлення, щоб користувачі могли вибрати той, який відповідає їх програмі або продукту. Стиль першого читання є розмовним, який ідеально підходить для комунікаційних додатків, а інший більше підходить для розповіді новин. Крім того, організації можуть об’єднатися з командою Amazon Polly, щоб розробити власний голос, ексклюзивний для своєї компанії.

Amazon Polly пропонує користувачам широкий вибір реалістичних чоловічих і жіночих голосів, а його вимова текучого тексту дозволяє організаціям забезпечити чудовий голосовий вихід для своєї аудиторії. Користувачі можуть легко зберігати та поширювати свою згенеровану мову без додаткових витрат. Компанії можуть розробляти мовні файли в різних форматах, таких як OGG і MP3. Крім того, вони можуть поширювати їх із хмари, пристроїв або програм.

Агенти служби підтримки клієнтів можуть отримувати мову, отриману з їх тексту, в режимі реального часу, щоб сприяти швидкому часу відгуку клієнтів. API Amazon Polly доставляє аудіо в додаток користувача як потік. Це програмне забезпечення дозволяє організаціям змінювати голоси відповідно до їхніх потреб. Крім того, він підтримує SSML та лексикони, що дозволяє користувачам контролювати їх обсяг, швидкість, вимову та висоту.

Відомості про продукт

  1. Програмне забезпечення для генерації природної мови Amazon Polly надає організаціям API, який дозволяє їм інтегрувати синтез мовлення у свої програми. Користувачі можуть вибирати з різних реалістичних голосів, доступних на декількох мовах. Це програмне забезпечення для генерації природної мови пропонує користувачам нейронні функції, які підвищують якість мови, що виголошується, щоб звучати більш людським і природним. Компанії можуть зберігати формати аудіофайлів звуку у форматі MP3 для подальшого використання. Крім того, Amazon Polly пропонує цю послугу такими мовами, як арабська, австралійська англійська, гінді, бразильська португальська, німецька, канадська французька, нідерландська, італійська, польська та валлійська.

2. Amazon Polly дозволяє користувачам синхронізувати мову для створення додатків з поліпшеним візуальним досвідом. Компанії можуть отримати додаткову інформацію метаданих про вимову слів, звуків і речень за запитом. Це програмне забезпечення дозволяє користувачам використовувати потік метаданих з синтезованим аудіопотоком для розробки своїх додатків і продуктів. За допомогою цього програмного забезпечення для генерації природної мови компанії можуть передавати різні види інформації через свою програму для користувачів швидко та майже в режимі реального часу. Існують різні показники вибірки для користувачів на вибір, щоб оптимізувати якість звуку та пропускну здатність своїх програм.

3. Програмне забезпечення для генерації природної мови дозволяє користувачам регулювати висоту, швидкість мовлення, гучність та стиль свого аудіопотоку. Це програмне забезпечення підтримує загальні теги для акценту, інтонації та виразів, мови розмітки синтезу мовлення, розмітки на основі XML та стандарту W3C для синтезу мовлення. Компанії можуть використовувати власні теги, щоб мати унікальні варіанти для своїх програм і продуктів. Крім того, це програмне забезпечення для генерації природної мови створює реалістичну мову, щоб залучити клієнтів до організацій.

4. Amazon Polly підтримує різні стилі мовлення. Організації можуть використовувати це програмне забезпечення для синтезу мовлення, щоб звучати як диктор новин. Цей стиль розмовного диктора доступний лише англійською та американською іспанською мовами. Розмовна форма імітує дружній розмовний тон бізнесу у випадках використання телефонії. Крім того, цей розмовний стиль розмови доступний лише англійською мовою США.

5. Програмне забезпечення дозволяє користувачам автоматично регулювати максимальну тривалість мовлення. Компанії можуть обслуговувати клієнтів у різних місцях, гарантуючи, що їх аудіоконтент має однакові часові рамки по всій дошці. Amazon Polly дозволяє користувачам легко полегшити процедуру дубляжу. Крім того, це програмне забезпечення підтримує Java, Node.js, PHP, .NET, Python, C++, Go, Ruby, iOS, Android та HTTP API.

6. Amazon Polly дозволяє користувачам виконувати синтез мовлення через командний рядок, API або консоль. Організації мають повний контроль над усіма функціональними можливостями цього програмного забезпечення незалежно від способу доступу. Крім того, користувачі можуть отримати доступ до Amazon Polly, використовуючи різні специфічні для мови SDK.

7. Програмне забезпечення Amazon Polly пропонує компаніям власні лексикони для зміни своєї мови. Користувачі можуть використовувати користувацькі словники для покращення вимови унікальних слів, таких як неологізми, абревіатури, назви компаній та іноземні слова. Крім того, це програмне забезпечення дозволяє компаніям налаштувати вимову, завантаживши XML-файл з лексичними записами.

8. Програмне забезпечення дозволяє компаніям співпрацювати з командою Amazon Polly, щоб створити незалежний нейронний голос для свого бренду. Коли організації мають голос бренду, він відрізняє їх програми та продукти від інших. Команда Amazon Polly працює з компаніями протягом усього процесу створення, щоб визначити особу бренду, вибрати голосового актора та записати промову. Крім того, команда Amazon Polly допомагає компаніям розробляти та навчати модель для виробництва голосу бренду, який потім стає доступним для компаній.

9. Amazon Polly пропонує користувачам ціни на оплату по мірі використання. Компанії отримують необмежену кількість повторів своїх аудіофайлів у своїх додатках. Творці вмісту можуть використовувати це програмне забезпечення для озвучування вмісту з RSS-каналів, а веб-сайти для своєї аудиторії споживати інформацію альтернативним способом. Крім того, Amazon Polly дозволяє користувачам оживляти аватари та підкреслювати текст, коли звук відтворюється у їхньому додатку.

Підсумок

Amazon Polly фокусується на наданні користувачам текстових мовних послуг для своїх додатків і продуктів з використанням технологій глибокого навчання. Компанії можуть використовувати API цього програмного забезпечення, щоб пропонувати клієнтам автоматизовану інформацію в режимі реального часу. Це покоління природної мови дозволяє організаціям налаштовувати сервіс у своїх додатках відповідно до іміджу свого бренду.