粤语AI配音怎么做?3款工具实测发音准确度 - FlowPix

粤语AI配音怎么做?3款工具实测发音准确度 - FlowPix
粤语AI配音工具实测:3款平台粤语发音准确度对比

简单说:粤语AI配音目前做得最好的是讯飞,发音准确度约90%,是唯一把粤语当核心语种做的平台。Azure其次约85%,剪映约75%。做粤语内容首选讯飞,日常用语基本没问题,专有名词和年轻人口语容易出错需要人工检查。

粤语AI配音怎么做?3款工具实测发音准确度

有个做粤港澳大湾区美食号的朋友找我——他想用粤语配音AI给视频加旁白,但试了好几个工具,发音不是像机器人在念就是直接把粤语读成普通话。

粤语配音确实比普通话难做。粤语有9个声调(普通话只有4个),还有大量普通话没有的韵母和入声。很多AI平台嘴上说"支持粤语",实际上发音拉胯。

我花了一天时间测试了三个平台,让一个会说粤语的朋友帮忙打分。结果如下。

三款粤语AI配音工具对比

做粤语AI配音目前只有三个靠谱的选择:讯飞(最准确)、Azure(也可用)、剪映(勉强)。

平台粤语音色数发音准确度声调自然度免费额度
讯飞10+90%8.5500次/天
微软Azure3-585%8.050万字符/月
剪映2-375%6.5免费

讯飞的粤语确实比其他平台强不少。它有专门的粤语研发团队,在粤语声调建模上投入了很大精力。根据 科大讯飞TTS服务页,讯飞的粤语语音合成支持广州话和香港话两种口音。

讯飞粤语配音实测

讯飞的粤语AI配音是三款里最准确的,日常用语准确度约90%。但专有名词和年轻人口语容易出错。

我让粤语朋友用100个常见句子做测试,结果如下:

  • 日常对话(如"你好""食咗饭未""几多钱"):准确率95%
  • 食物名称(如"虾饺""肠粉""叉烧包"):准确率90%
  • 地名(如"旺角""中环""尖沙咀"):准确率85%
  • 网络用语/潮语(如"好好味""打卡""出pool"):准确率65%

讯飞的粤语音色推荐"小云"(女声,标准广州话)和"小恒"(男声,略带港味)。语速建议0.88-0.92x,太快容易吞字。

Azure粤语配音实测

Azure的粤语音色选择不多(只有3-5个),但质量还不错,发音准确度约85%。

Azure推荐两个粤语音色:

  • "HiuGaai"(晓佳):女声,标准粤语,语速建议0.9x
  • "WanLung"(云龙):男声,沉稳大气,适合正式内容

根据 Azure语音服务语言支持页,Azure的中文支持包括粤语(zh-HK),但粤语音色数量远少于普通话。

Azure的优势是支持SSML精细调教——如果你对某个粤语词的发音不满意,可以用phoneme标签强制指定读音。讯飞目前没有这么精细的控制。

粤语配音最容易出错的十个词

粤语AI配音最容易翻车的十个词(我实测汇总):

词语正确读音AI常见错误
靓女leng3 neoi5读成"亮女"
gam3读成"甘"
唔该m4 goi1m音发不好
饮茶jam2 caa4读成普通话"饮茶"
虾饺haa1 gaau2"虾"发音不准
九龙gau2 lung4声调不对
巴士baa1 si2读成英语bus
士多si6 do1读成"士兵"的士
贴士tip1 si2tip发音不准
香港hoeng1 gong2"香"的韵母读成普通话

解决方法:生成完一定要让会说粤语的人听一遍。遇到读错的地方,Azure用SSML纠正,讯飞用拼音标注纠正,剪映只能换个说法规避。

常见问题

粤语AI配音发音准吗?

讯飞的粤语AI配音发音准确度约90%,日常用语基本没问题。Azure约85%。剪映约75%。专有名词、网络用语、年轻人口语是三个最常出错的领域。生成完一定要听一遍检查。

粤语AI配音用什么工具最好?

做粤语内容首选讯飞——它是唯一把粤语当核心语种做的平台,音色最多、发音最准。Azure的粤语也可以但音色选择少。剪映勉强能用但发音准确度不够。

粤语AI配音免费吗?

讯飞每日有500次免费调用额度,够做几条短视频。Azure每月50万字符免费。剪映免费。做几条短视频粤语配音基本都可以不花钱。

觉得这篇粤语配音实测有用的话,分享给也在做粤语内容的朋友吧。