AI 工具

微软AI配音怎么录下来？2026年Edge大声朗读和Azure Speech实录教程

FlowPix Team 发布于 2026-06-17 更新于 2026-06-18 2,543 字

简单说：微软AI配音想录下来有两条路——Edge浏览器内置"大声朗读"（零门槛，直接录屏就行，推荐用OBS或Windows自带录屏）和Azure Speech API（需要注册Azure账号，但每月免费50万字符，音质更好）。前者适合临时用，后者适合做号批量产。

微软AI配音怎么录下来？2026年Edge大声朗读和Azure Speech实录教程

很多人不知道，Windows电脑里其实藏了一套AI配音系统。

就是微软AI配音——Edge浏览器的"大声朗读"功能。2026年的版本内置了十几种中文音色，普通话、粤语都有。关键是，完全不要钱。

更深度的是Azure认知服务的语音合成，那个要注册账号但免费额度够一个人用到天荒地老。我今天把两个方法都走一遍，你挑着用。

方法一：Edge浏览器"大声朗读"——全家同款

Edge大声朗读是微软Edge浏览器内置的TTS功能，支持20+种中文音色。使用方法：打开任意网页或PDF→右键"大声朗读"→选音色→用OBS或Windows录屏工具录下来即可。

操作真的简单得离谱。随便打开一个网页（甚至建个txt文件拖进Edge都行），粘贴你的文案，右键点"大声朗读"——它就开始读了。

然后开个OBS（免费录屏软件，官网obsproject.com可下载），把系统声音录进去。Windows自带的Xbox Game Bar（Win+G快捷键）也能录，更省事。

我自己试了Edge的"晓晓"（女声）和"云扬"（男声），说实话比预期好。特别是2026年4月更新之后的版本，"晓晓"的连读比去年自然多了，总算不一个字一个字往外蹦了。

方法二：Azure Speech——专业选手的免费工具

Azure语音合成每月免费50万字符，音质是当前中文TTS领域的顶级水平。注册步骤：Azure门户→创建"语音服务"资源→选F0免费层→获取密钥→用Python或在线demo调用。

Azure这个方法的入门门槛比Edge高不少。得先注册Azure账号（需要一张信用卡验证，但不扣费），然后创建语音服务。步骤不复杂但界面是英文的，第一次用容易懵。

FlowPix编辑部目前每月用Azure生成大概30万字的配音素材。免费额度完全够。根据微软Azure官方文档，F0免费层每月50万字符，超过后按每百万字符约100元计费——正常个人用户根本用不到收费档。

Azure比Edge好在哪？一是音色更多（300+种），二是支持SSML标签——你可以精确控制停顿、语速、音调、音量。比如""就是暂停半秒。这对做高质量内容的差别很大。

Azure Speech的Python调用代码

Azure配音可写个简单的Python脚本批量调用。核心就三样：Azure Key、地区（如eastasia）、音色名（如zh-CN-XiaoxiaoNeural）。一次请求能转2000字符，想批量就跑循环。

import requests
import time

KEY = "你的Azure语音服务密钥"
REGION = "eastasia"

def text_to_speech(text, output_file, voice="zh-CN-XiaoxiaoNeural"):
    url = f"https://{REGION}.tts.speech.microsoft.com/cognitiveservices/v1"
    headers = {
        "Ocp-Apim-Subscription-Key": KEY,
        "Content-Type": "application/ssml+xml",
        "X-Microsoft-OutputFormat": "audio-16khz-128kbitrate-mono-mp3"
    }
    ssml = f"""<speak version='1.0' xmlns='http://www.w3.org/2001/10/synthesis' xml:lang='zh-CN'>
        <voice name='{voice}'>{text}</voice>
    </speak>"""
    
    resp = requests.post(url, headers=headers, data=ssml.encode('utf-8'))
    with open(output_file, 'wb') as f:
        f.write(resp.content)
    print(f"已生成: {output_file}")

# 使用
text_to_speech("你好，这是微软AI配音的测试。", "output.mp3")

写代码不是必须的。Azure门户里有个"语音工作室"——网页版可视化界面，直接粘贴文本点播放就能预览和下载。对于不会代码的人来说够用了。

两种方法的录音效果对比

对比项	Edge大声朗读	Azure Speech
费用	完全免费	每月50万字符免费
中文音色数	约15种	300+种
自然度	中等偏上	顶级
操作门槛	极低	中等
批量能力	不能	API支持
情感控制	无	SSML标签可调
适合场景	临时配几条	做号/批量生产

常见问题

微软Edge大声朗读是免费的吗？

完全免费，不需要任何账号或订阅。Edge浏览器内置的大声朗读功能不收费、不限次数，只要安装了Edge就能用。

Azure语音合成免费额度怎么申请？

登录Azure门户（portal.azure.com），搜索"语音服务"创建资源，选择免费定价层F0即可。每月免费50万字符，超过才收费。

微软AI配音和剪映配音哪个好？

微软Azure的神经网络语音效果优于剪映免费音色，但操作门槛高。剪映的付费会员音色日常使用已经足够。批量生产推荐Azure，偶尔用推荐Edge或剪映。

觉得有用的话分享给朋友吧。你平时用什么工具做配音？