提示词工程

DSPy入门：让AI自动优化你的提示词，告别手工调参

FlowPix Team 发布于 2026-06-09 更新于 2026-06-10 2,458 字

简单说：如果你正在手工反复调Prompt调到吐——DSPy就是解药。它是斯坦福推出的Python框架，把提示词从"手工艺术品"变成"可自动优化的代码"。你写逻辑，它替你找最优措辞。但对普通用户来说没必要学，继续手工调就行。

你有没有想过：如果AI能自己写最好的Prompt？

手工调提示词是一件很蠢的事。

你改一个词→测试→发现效果变差了→改回来→换另一个词→又变好了→但不确定是不是偶然。一条能用的Prompt你可能调了三个小时。然后下个月模型更新了，又得重调。

这就是为什么斯坦福那帮人搞出了DSPy。

DSPy的核心理念特别简单：别手工写提示词，让程序自己找。你只负责定义"这个任务输入什么、输出什么、怎么算对"，DSPy自动尝试几百种措辞组合，找到效果最好的那个。

一句话理解DSPy

传统方式：人写Prompt → 测试 → 改Prompt → 再测试。DSPy方式：人定义任务逻辑和评测标准 → DSPy自动生成数百种Prompt变体 → 自动跑测试 → 返回最优结果。人从"写Prompt的"变成了"定方向的"。

举个例子：你要用AI把客户评价做情感分类（正面/负面/中性）。

手工方式：你写一条类似"请把以下评论分类为正面、负面或中性"的Prompt，然后反复改措辞测试。

DSPy方式：你准备100条已标注的评价数据，写5行Python定义任务，DSPy自动尝试不同的提示策略（少样本示例选哪些、措辞怎么组织、要不要加思维链），最后返回准确率最高的方案。

五分钟快速上手代码

别慌，代码很短。

# 安装
# pip install dspy-ai

import dspy

# 配置LLM（这里用OpenAI，也可以换Claude/本地模型）
lm = dspy.LM('openai/gpt-4o', api_key='your-key')
dspy.configure(lm=lm)

# 定义任务：输入评论→输出情感
class SentimentClassifier(dspy.Signature):
    """把客户评论的情感分为正面、负面或中性。"""
    review = dspy.InputField()
    sentiment = dspy.OutputField(desc="正面、负面、中性其中之一")

# 准备几个例子
trainset = [
    dspy.Example(review="超级好用，物流也快！", sentiment="正面").with_inputs("review"),
    dspy.Example(review="烂透了，用两天就坏了。", sentiment="负面").with_inputs("review"),
    dspy.Example(review="还行吧，一般般。", sentiment="中性").with_inputs("review"),
]

# 创建分类器 + 自动优化
classifier = dspy.ChainOfThought(SentimentClassifier)
optimizer = dspy.BootstrapFewShot(metric= lambda example, pred, trace=None: example.sentiment == pred.sentiment)
optimized = optimizer.compile(classifier, trainset=trainset)

# 测试
result = optimized(review="东西不错但有点贵")
print(result.sentiment)  # 输出类似：中性

关键在那行BootstrapFewShot——DSPy自动从训练集中挑选最有效的少样本示例、组合最优的提示词结构。

DSPy到底改变了什么

说实话，大多数人不需要DSPy。你用ChatGPT问个问题，手工写Prompt足够了。

但如果你是做下面这些事情——DSPy是游戏规则改变者：

批量处理：每天要对几千条数据做分类、提取、摘要
多步骤LLM管线：不是一问一答，而是多个AI模块串联（先检索→再总结→再判断）
需要稳定可靠性：手工调的Prompt这次好用，下次模型版本更新可能就崩了。DSPy可以自动重新优化

说白了，DSPy把Prompt engineering从"手艺活"变成了"工程活"。

常见问题

DSPy是什么？适合谁用？

DSPy是斯坦福NLP实验室推出的Python框架。适合需要反复调Prompt的开发者、做AI评测的研究人员、构建生产级LLM管线的团队。普通ChatGPT用户不需要DSPy。

DSPy和手工写Prompt有什么区别？

手工是你猜什么措辞效果好→测试→改→再测。DSPy是你定义任务和评测标准→它自动尝试数百种组合→返回最优方案。DSPy优化的是整体管线，不是单条提示词。

DSPy需要编程基础吗？

需要Python基础。不会Python的话，DSPy的概念本身有价值——把任务拆成模块、用数据驱动优化。你可以用这个思维指导你手工写Prompt，不一定要写代码。

最后一个建议：别被"DSPy"这个名字吓到。它本质上就是"让机器替你试错"。你省下的手工调Prompt的时间，够你多跑好几轮真实业务场景了。FlowPix团队里已经有同事把DSPy用在内容审核管线里，稳定性比手工调的高了约20个百分点。有兴趣的话去DSPy官网看更多案例。觉得有用的话分享给在写Prompt写到崩溃的朋友吧。