微软AI配音音色大全:全部音色列表和使用场景推荐
简单说:微软AI配音(Azure TTS)有400+种音色,中文相关音色20+种。最常用中文音色:云希(男声科普)、晓晓(女声情感)、云扬(男声新闻)、晓萱(女声活泼)。FlowPix整理全部中文音色列表和场景推荐。
微软AI配音音色大全:全部音色列表和使用场景推荐
微软Azure的语音合成服务(TTS)是全球使用量最大的AI配音引擎之一。剪映、腾讯智影等国内工具的底层配音技术,很多都接入了Azure的API。微软ai配音音色到底有哪些?我整理了完整的中文音色列表,并按使用场景做了推荐。
微软AI配音中文音色完整列表
微软AI配音中文音色共20+种,涵盖普通话、粤语、四川话、东北话、闽南语、台湾国语、客家话等。
以下是常用中文普通话音色列表:
| 音色名称 | 性别 | 风格特点 | 推荐场景 |
|---|---|---|---|
| 云希(Yunxi) | 男 | 沉稳、专业、清晰 | 知识科普、商业宣传 |
| 晓晓(Xiaoxiao) | 女 | 温柔、亲切、自然 | 情感内容、有声书 |
| 云扬(Yunyang) | 男 | 新闻播报、正式 | 新闻资讯、企业宣传 |
| 晓萱(Xiaoxuan) | 女 | 活泼、年轻、有活力 | 社交媒体、电商直播 |
| 云健(Yunjian) | 男 | 浑厚、有力 | 纪录片、品牌故事 |
| 晓梦(Xiaomeng) | 女 | 甜美、温柔 | 儿童内容、情感电台 |
| 晓睿(Xiaorui) | 男 | 知性、沉稳 | 科技内容、产品评测 |
| 晓悠(Xiaoyou) | 女 | 舒缓、治愈 | 冥想引导、睡前故事 |
| 云夏(Yunxia) | 女 | 清脆、明快 | 天气预报、资讯播报 |
| 晓北(Xiaobei) | 女 | 东北话 | 搞笑内容、地域特色 |
除了普通话,微软还支持以下中文方言和变体:
- 粤语(Cantonese):晓敏(女)、云鹏(男)
- 四川话:晓蓉(女)
- 台湾国语:晓臻(女)、云哲(男)
- 闽南语:晓文(女)
- 客家话:晓云(女)
- 吴语(上海话):晓萍(女)
不同场景的微软AI配音音色推荐
不同场景微软AI配音音色推荐:知识科普选云希、情感内容选晓晓、新闻播报选云扬、电商直播选晓萱、品牌故事选云健。
知识科普类视频:云希是最受欢迎的选择。他的声音沉稳但不沉闷,语速适中,听久了不会疲劳。B站上很多知识类UP主用的就是云希。
情感类内容:晓晓的声音温柔自然,特别适合情感电台、心理类内容、有声书。她的情感表达能力在AI音色里算顶级的,能听出"关心"和"共情"的语气。
新闻资讯:云扬是标准的新闻播报音色,正式、权威、清晰。企业宣传片、政府项目介绍用这个音色很合适。
电商直播:晓萱活泼有活力,语速偏快,适合电商直播切片、产品推荐视频。她的声音能带动购买欲,很多电商团队指定用她。
品牌故事:云健的声音浑厚有力,适合品牌故事、纪录片旁白。如果你的品牌调性偏高端、厚重,选他没错。
微软AI配音音色的技术参数
微软AI配音音色支持Neural TTS技术,采样率最高48kHz,支持SSML标记语言自定义语速、音调、停顿。
微软的Neural TTS技术基于深度神经网络,比传统的拼接式TTS自然度高很多。以下是关键技术参数:
| 参数 | 数值 |
|---|---|
| 采样率 | 16kHz / 24kHz / 48kHz |
| 输出格式 | WAV、MP3、OGG |
| SSML支持 | 是(支持语速、音调、音量、停顿自定义) |
| 自定义发音 | 支持(通过lexicon自定义专业术语发音) |
| 情感风格 | 部分音色支持(如晓晓支持5种情感风格) |
SSML(语音合成标记语言)是微软AI配音的一大优势。通过SSML,你可以精确控制每个词的语速、音调、音量和停顿。比如让AI在某个关键词前停顿0.5秒,或者把某个词的声音提高10%,这些都能实现。
微软AI配音音色免费额度和使用方法
微软Azure TTS免费额度为每月50万字符(Neural音色),超出后按15美元/百万字符计费。
注册Azure账号后,创建语音服务资源即可获得免费额度。50万字符大约相当于50万汉字,对个人用户来说一个月根本用不完。以1分钟配音约200字计算,50万字符可以生成2500分钟配音。
使用方法有三种:
第一,Azure门户在线测试。直接在Azure控制台输入文字,选择音色,试听和下载音频。适合偶尔使用的用户。
第二,API调用。通过REST API或SDK集成到自己的应用中。适合开发者和企业用户。
第三,第三方工具。很多AI配音工具底层接入了Azure TTS,比如FlowPix就支持Azure音色。这种方式不需要懂技术,直接在界面上操作就行。
根据微软Azure官方定价页面,Neural TTS的付费价格为15美元/百万字符,Standard TTS为4美元/百万字符。Neural音色更自然,推荐使用。
更多音色信息,可以看看我们的厉害的AI配音工具排行和真人录制AI配音方案。