Модель expressive умеет играть эмоциями. Это тот же голос, что и у flash, но живее: можно смеяться, шептать, вздыхать, делать паузы и менять настроение прямо по ходу фразы. Управление — простыми пометками в квадратных скобках [...] прямо внутри текста.
Эмоции работают только с моделью expressive ("model": "expressive"). С моделью flash пометки будут просто прочитаны как обычный текст.

Как это работает

Пишите пометки по-русски и ставьте их перед словом или фразой, к которой они относятся. Пометку можно поставить где угодно — в начале, середине или конце предложения.
{
  "model": "expressive",
  "voice": "axolotl",
  "text": "[радостно] Мы только что запустились! [смеётся] Это невероятно."
}

Названия тегов — любые

Жёсткого списка нет. Тег — это просто короткое описание подачи своими словами, и модель его поймёт. Можно как одним словом, так и целой фразой:
[вздохнула в конце] Ну наконец-то всё получилось.
[говорит быстро и испуганно] Нам нужно уходить, прямо сейчас.
[с лёгкой иронией] О, какой приятный сюрприз.
[шепчет на ухо] У меня есть секрет.
Пишите естественно и коротко — чем понятнее описание, тем точнее результат.

Частые теги

ТегЧто делает
[смеётся]Смех
[пауза]Короткая пауза
[вздох], [вздыхает]Вздох
[шёпотом]Шёпот
[кричит]Громко, с криком
[радостно]Радостно, тепло
[грустно]Грустно, подавленно
[зло]Жёстко, раздражённо
[удивлённо]Удивление
[взволнованно]Энергично, на подъёме
[спокойно]Мягко, ровно
[смеётся нервно]Нервный смешок

Комбинируйте

Физические пометки ([тяжело дышит], [шёпотом], [кричит]) звучат естественнее в паре с эмоцией:
[тяжело дышит] [устало] Я бежала двадцать минут.
[шёпотом] [испуганно] Не двигайся. Тихо.
[кричит] [зло] Я же говорила, что так и будет!

Советы

  • Эмоцию всего предложения ставьте в начале; точечные пометки — там, где эффект должен начаться.
  • Держите описание коротким: [мягко и ласково] лучше длинного абзаца.
  • Не перебарщивайте — одной-двух пометок на фразу обычно достаточно.
Пометки — это часть поля text, поэтому их символы тоже идут в тарификацию.
Поля previous_text и next_text (контекст для плавных стыков) с моделью expressive не поддерживаются — они работают только с flash. Сшивка длинных текстов без швов для expressive появится позже, через WebSocket-режим (скоро добавим). Пока для expressive озвучивайте каждый фрагмент самостоятельно.