阿里云智能语音交互语音合成SSML标记语言使用高频介绍

作者阿里云代理 文章分类 分类:linux图文教程 阅读次数 已被围观 1550
将带标签的文本作为text参数值,上传至语音组成服务,以Java SDK为例:
SpeechSynthesizer synthesizer = new SpeechSynthesizer(client, getSynthesizerListener());
String text = "请闭上眼睛歇息一下好了,请睁开眼睛。";
synthesizer.setText(text);
发送给语音组成服务的请求内容如下:
{ "payload": { "volume": 50, "sample_rate": 16000, "format": "wav", "text": "请闭上眼睛歇息一下好了,请睁开眼睛。" }, "context": { "sdk": { "name": "nls-sdk-java", "version": "2.0.4" }
    }, "header": { "namespace": "SpeechSynthesizer", "name": "StartSynthesis", "message_id": "5fdf78c0dd574b6897f3cb204dd0****", "appkey": "fd4er4aa****", "task_id": "6e1be78ef5804c50a2c5a8b92de1****" }
}
标签
  • 描绘
    标签是所有待支撑SSML标签的根节点。一切需求调用SSML标签的文本都要包括在中。
  • 语法
需求调用SSML标签的文本
  • 标签关系
    标签可以包括文本和以下标签:

    1. break
    2. s
    3. w
    4. phoneme
    5. say-as
  • 示例
    1.空特点

    <speak> 需求调用SSML标签的文本 speak>

    2.voice特点

    <speak voice="xiaogang"> 我是男声。 speak> 

    3.rate特点

    <speak rate="200"> 我的语速比正常人快。 speak>

    4.volume特点

    <speak volume="80"> 我的音量也很大。 speak>

    5.effect特点

    <speak effect="robot"> 你喜爱机器人瓦力吗? speak>

    6.标签
    用于在文本中刺进停顿,该标签是可选标签

    # 空特点 <break/> # 带time特点 <break time="string"/> # 示例 <speak> 请闭上眼睛歇息一下<break time="500ms"/>好了,请睁开眼睛。 speak>

    7.
    用于表示文本的句子结构,该标签是可选标签。
    标签可以包括文本和以下标签

    • break
    • w
    • phoneme
    • say-as

      <s>文本s> # 示例 <speak><s>这是第一句话s><s>这是第二句话s>speak>

    8.
    用于控制标签内文本的读音,该标签是可选标签。英文文本不支撑该标签。

    <phoneme alphabet="string" ph="string">文本phoneme> # 示例 <speak><phoneme alphabet="py" ph="dian3 dang4 hang2">典当行phoneme>把这个玩意<phoneme alphabet="py" ph="dang4 diao4">当掉phoneme> speak>

参阅文档:阿里云智能语音交互SSML符号言语介绍


本公司销售:阿里云新/老客户,只要购买阿里云,即可享受折上折优惠!>

我有话说: