粤语AI配音怎么做?3款工具实测发音准确度 - FlowPix
简单说:粤语AI配音目前做得最好的是讯飞,发音准确度约90%,是唯一把粤语当核心语种做的平台。Azure其次约85%,剪映约75%。做粤语内容首选讯飞,日常用语基本没问题,专有名词和年轻人口语容易出错需要人工检查。
粤语AI配音怎么做?3款工具实测发音准确度
有个做粤港澳大湾区美食号的朋友找我——他想用粤语配音AI给视频加旁白,但试了好几个工具,发音不是像机器人在念就是直接把粤语读成普通话。
粤语配音确实比普通话难做。粤语有9个声调(普通话只有4个),还有大量普通话没有的韵母和入声。很多AI平台嘴上说"支持粤语",实际上发音拉胯。
我花了一天时间测试了三个平台,让一个会说粤语的朋友帮忙打分。结果如下。
三款粤语AI配音工具对比
做粤语AI配音目前只有三个靠谱的选择:讯飞(最准确)、Azure(也可用)、剪映(勉强)。
| 平台 | 粤语音色数 | 发音准确度 | 声调自然度 | 免费额度 |
|---|---|---|---|---|
| 讯飞 | 10+ | 90% | 8.5 | 500次/天 |
| 微软Azure | 3-5 | 85% | 8.0 | 50万字符/月 |
| 剪映 | 2-3 | 75% | 6.5 | 免费 |
讯飞的粤语确实比其他平台强不少。它有专门的粤语研发团队,在粤语声调建模上投入了很大精力。根据 科大讯飞TTS服务页,讯飞的粤语语音合成支持广州话和香港话两种口音。
讯飞粤语配音实测
讯飞的粤语AI配音是三款里最准确的,日常用语准确度约90%。但专有名词和年轻人口语容易出错。
我让粤语朋友用100个常见句子做测试,结果如下:
- 日常对话(如"你好""食咗饭未""几多钱"):准确率95%
- 食物名称(如"虾饺""肠粉""叉烧包"):准确率90%
- 地名(如"旺角""中环""尖沙咀"):准确率85%
- 网络用语/潮语(如"好好味""打卡""出pool"):准确率65%
讯飞的粤语音色推荐"小云"(女声,标准广州话)和"小恒"(男声,略带港味)。语速建议0.88-0.92x,太快容易吞字。
Azure粤语配音实测
Azure的粤语音色选择不多(只有3-5个),但质量还不错,发音准确度约85%。
Azure推荐两个粤语音色:
- "HiuGaai"(晓佳):女声,标准粤语,语速建议0.9x
- "WanLung"(云龙):男声,沉稳大气,适合正式内容
根据 Azure语音服务语言支持页,Azure的中文支持包括粤语(zh-HK),但粤语音色数量远少于普通话。
Azure的优势是支持SSML精细调教——如果你对某个粤语词的发音不满意,可以用phoneme标签强制指定读音。讯飞目前没有这么精细的控制。
粤语配音最容易出错的十个词
粤语AI配音最容易翻车的十个词(我实测汇总):
| 词语 | 正确读音 | AI常见错误 |
|---|---|---|
| 靓女 | leng3 neoi5 | 读成"亮女" |
| 咁 | gam3 | 读成"甘" |
| 唔该 | m4 goi1 | m音发不好 |
| 饮茶 | jam2 caa4 | 读成普通话"饮茶" |
| 虾饺 | haa1 gaau2 | "虾"发音不准 |
| 九龙 | gau2 lung4 | 声调不对 |
| 巴士 | baa1 si2 | 读成英语bus |
| 士多 | si6 do1 | 读成"士兵"的士 |
| 贴士 | tip1 si2 | tip发音不准 |
| 香港 | hoeng1 gong2 | "香"的韵母读成普通话 |
解决方法:生成完一定要让会说粤语的人听一遍。遇到读错的地方,Azure用SSML纠正,讯飞用拼音标注纠正,剪映只能换个说法规避。
常见问题
粤语AI配音发音准吗?
讯飞的粤语AI配音发音准确度约90%,日常用语基本没问题。Azure约85%。剪映约75%。专有名词、网络用语、年轻人口语是三个最常出错的领域。生成完一定要听一遍检查。
粤语AI配音用什么工具最好?
做粤语内容首选讯飞——它是唯一把粤语当核心语种做的平台,音色最多、发音最准。Azure的粤语也可以但音色选择少。剪映勉强能用但发音准确度不够。
粤语AI配音免费吗?
讯飞每日有500次免费调用额度,够做几条短视频。Azure每月50万字符免费。剪映免费。做几条短视频粤语配音基本都可以不花钱。
觉得这篇粤语配音实测有用的话,分享给也在做粤语内容的朋友吧。