Skip to main content
Skip table of contents

Uso de TTS na URA cVortex: Guia de Otimização e Boas Práticas

Sumário

  1. Introdução

  2. O que é TTS?

  3. Como o TTS funciona no Workflow Studio

  4. Como a cobrança é feita

  5. Texto fixo x Binding: entendendo a diferença

  6. Como otimizar o uso de TTS

  7. Exemplo prático de otimização

  8. Resumo de boas práticas


1. Introdução

Este documento tem como objetivo orientar usuários da plataforma cVortex sobre o uso correto e otimizado do recurso de TTS (Text-to-Speech) dentro da URA. Aqui você vai entender como o sistema converte textos em áudio, como essa conversão é cobrada e o que fazer para reduzir custos sem perder qualidade no atendimento.


2. O que é TTS?

TTS é a sigla para Text-to-Speech, ou em português, "texto para fala". Trata-se de uma tecnologia que transforma um texto escrito em um áudio falado, com voz sintetizada. Na cVortex, esse recurso é utilizado dentro da URA para que mensagens configuradas em texto sejam reproduzidas como áudio para o cliente que está em ligação.

Em vez de gravar arquivos de áudio manualmente, você escreve o texto que deseja que seja falado, e a plataforma se encarrega de gerar a voz automaticamente.


3. Como o TTS funciona no Workflow Studio

Dentro do Workflow Studio, todas as funções que possuem o componente de mensagem permitem que o usuário escolha entre duas formas de configurar o conteúdo que será falado:

image-20260525-204102.png

  • Texto fixo: um conteúdo escrito diretamente na caixa de mensagem, que não muda entre as execuções.

  • Binding: um conteúdo dinâmico, que vem de uma variável do fluxo e pode ter um valor diferente a cada execução (por exemplo, o nome do cliente, o saldo da conta ou o número de um pedido).

Essa distinção é o ponto mais importante deste guia, porque ela impacta diretamente o custo e a performance do TTS.


4. Como a cobrança é feita

A cobrança do TTS na cVortex é baseada na quantidade de conversões de texto em áudio que o sistema precisa realizar. Ou seja, cada vez que a plataforma precisa gerar um novo áudio a partir de um texto, essa operação é contabilizada.

A boa notícia é que a cVortex foi projetada para evitar conversões desnecessárias. Sempre que possível, o sistema reaproveita áudios já gerados anteriormente, o que reduz o custo total da sua operação. Para entender quando isso acontece, vamos comparar os dois cenários a seguir.


5. Texto fixo x Binding: entendendo a diferença

5.1. Texto fixo

Quando você utiliza um texto fixo em uma função do Workflow Studio, o áudio é gerado apenas uma vez, na primeira execução do fluxo. A partir desse momento, o sistema entende que o texto não foi alterado e reaproveita o áudio já gerado em todas as execuções seguintes.

Vantagens:

  • Custo reduzido de TTS, pois a conversão acontece somente uma vez.

  • Maior velocidade de execução, já que o áudio é entregue imediatamente do cache.

  • Performance superior na URA como um todo.

Quando usar: sempre que o conteúdo da mensagem for o mesmo para todos os clientes.

5.2. Binding

Quando você utiliza um binding em funções como Pergunta ou Mensagem, o sistema entende que o conteúdo do texto pode mudar a cada execução. Por causa disso, ele gera um novo áudio toda vez que o fluxo passa por aquele nó, mesmo que o valor do binding seja o mesmo.

Características:

  • O custo de TTS é um pouco maior, pois há uma nova conversão a cada execução.

  • A geração do áudio acontece em tempo real, o que pode adicionar uma pequena latência.

  • É o comportamento esperado, já que o conteúdo é dinâmico e personalizado.

Quando usar: apenas quando o conteúdo realmente precisa ser personalizado a cada atendimento.


6. Como otimizar o uso de TTS

A principal estratégia para otimizar o uso de TTS na cVortex é separar o conteúdo fixo do conteúdo variável em caixas de mensagem diferentes.

Se grande parte da frase que será reproduzida é fixa, e apenas uma pequena parte dela vem de um binding, você deve:

  1. Criar uma caixa de mensagem com o texto fixo (que será convertida apenas uma vez e reaproveitada).

  2. Criar uma segunda caixa de mensagem apenas com o binding (que será convertida a cada execução, mas como o conteúdo é curto, o custo será menor).

Dessa forma, o sistema gera o áudio da parte fixa uma única vez e só converte em tempo real a parte variável, que é menor. O resultado é uma redução significativa no consumo de TTS sem qualquer prejuízo na experiência do cliente.


7. Exemplo prático de otimização

Vamos imaginar uma URA do banco fictício Space Bank que dá boas-vindas ao cliente chamando-o pelo nome. A mensagem desejada é:

"Olá, seja bem-vindo ao Space Bank, Bruno."

Nesse exemplo, "Bruno" é um binding com o nome do cliente. Ou seja, o nome muda conforme quem está ligando.

7.1. Forma não otimizada (não recomendada)

Configurar uma única caixa de mensagem com o conteúdo:

Olá, seja bem-vindo ao Space Bank, @{case.person.nome_cliente}}.

O que acontece: como existe um binding dentro da frase, o sistema considera o texto inteiro como dinâmico e gera toda a frase como um novo áudio em cada execução. Isso aumenta o custo de TTS de forma desnecessária.

7.2. Forma otimizada (recomendada)

Configurar duas caixas de mensagem em sequência:

  • Caixa 1 (texto fixo): Olá, seja bem-vindo ao Space Bank,

  • Caixa 2 (binding): @{case.person.nome_cliente}}.

O que acontece: a Caixa 1 é convertida em áudio apenas uma vez e reaproveitada em todas as execuções futuras. A Caixa 2 gera um áudio novo a cada execução, mas como o conteúdo é apenas o nome (uma palavra curta), o custo é muito menor do que converter a frase inteira.

Resultado: mesma experiência para o cliente, com economia significativa no consumo de TTS.


8. Resumo de boas práticas

Para garantir o melhor aproveitamento do TTS na URA cVortex, mantenha em mente as seguintes orientações:

  • Use texto fixo sempre que possível. Ele é convertido uma única vez e reaproveitado, reduzindo custo e ganhando performance.

  • Use binding apenas quando realmente precisar de conteúdo dinâmico, como nome do cliente, saldo, número de protocolo, etc.

  • Separe partes fixas e partes variáveis em caixas de mensagem diferentes. Essa é a forma mais eficiente de equilibrar personalização e custo.

  • Mantenha os bindings o mais curtos possível. Quanto menor o conteúdo dinâmico convertido, menor o custo de TTS por execução.

  • Revise periodicamente seus fluxos. Identifique caixas de mensagem que contenham trechos fixos misturados com bindings e reorganize-as conforme as recomendações deste guia.

Seguindo essas orientações, você garante uma URA com menor custo de operação, melhor tempo de resposta e qualidade preservada para o cliente final.

JavaScript errors detected

Please note, these errors can depend on your browser setup.

If this problem persists, please contact our support.