AI 绘画

AI古风写真生成：不用穿汉服也能拍出绝美古风大片

FlowPix Team 发布于 2026-06-10 更新于 2026-06-21 5,753 字

简单说：AI古风写真已经能做得很像了。上传3-5张你的照片，AI就能生成你穿汉服、仙侠装、唐风襦裙的写真——不是P图换脸，是从零生成的完整画面。SD+IP-Adapter方案面部还原度能做到90%以上，Midjourney cref更简单但还原度约70%。

上个月我女朋友刷小红书看到一个女生用AI做了一套汉服写真——远山眉、点绛唇、轻纱裙摆在月光下飘飘欲仙。她以为是找摄影师拍的，结果人家说是AI生成的。然后她来了一句："我也想要。"于是我花了两个周末把市面上的AI写真方案全试了一遍。说实话，最后的结果好到我自己都没想到——那张"她在竹林里抚琴"的图被设成了手机壁纸，看了两个星期还在看。这篇文章就是这两个周末折腾出来的完整攻略。

AI古风写真 vs AI古风修图——别搞混了

核心区别：AI古风修图是在你已有照片上改风格——原图的姿势、背景、光线不变，只改色调和服装。AI古风写真是从零生成一张全新的、以你面部特征为参考的古风画面——服装、发型、场景、光影全是AI新创造的。写真效果好很多，但控制的难度也高很多。

举个例子：你有一张在咖啡厅的自拍。用AI修图，出来的结果还是你在咖啡厅——只是衣服变了、加了古风滤镜。用AI写真，出来的结果是你在月下庭院弹古筝——整个场景是AI创造的，只有脸参考了你。后者像真的去拍了一套写真。前者像P了个图。

我这篇文章聚焦在"写真生成"上。如果你想了解古风修图（已有照片改古风），FlowPix之前写过古风修图教程。两个方向的Prompt和工具都不一样，别走错路了。

三种方案对比——从零基础到硬核玩家

方案	面部还原度	技术门槛	出图速度	费用	自由度
在线工具（妙鸭/JIMENG）	85-95%	★☆☆☆☆	5-15分钟	免费试/付费	低，固定模板
Midjourney cref	65-75%	★★☆☆☆	2-5分钟	$30/月	中，可写Prompt
SD + IP-Adapter	85-95%	★★★★☆	10-30秒/张	免费（需显卡）	最高，完全可控

说实话，如果你只是想"试试看效果"，先用在线的——5分钟出片，免费。如果你追求最好的效果且愿意折腾，SD+IP-Adapter是最终答案。Midjourney cref位处中间——比在线工具自由但比SD简单，面部还原度是个硬伤。

方案一：在线AI写真工具——5分钟出片，零门槛

妙鸭相机和JIMENG是2026年最主流的AI写真在线工具——上传10-20张你的照片（需要不同角度和光线），等5-15分钟训练模型，然后选古风模板一键生成。优点是简单到离谱，缺点是不能自定义风格——只能用平台给的模板。

具体流程（以妙鸭相机为例）：

1. 上传15-20张你的照片。注意：需要包含正面、侧面、半侧面，光线不能太暗，表情要自然。这一步最关键——照片质量和多样性直接决定生成效果。根据妙鸭相机官方建议，最少8张，推荐15张以上。

2. 等待训练。这个过程约5-15分钟，取决于服务器排队情况。训练期间你可以去做别的事——App会推送通知。

3. 选择古风模板。目前主流平台通常提供汉服、仙侠、唐风、清宫、敦煌等5-8种古风模板。选模板后AI自动填充你的面部。

4. 下载+微调。在线工具出的图可能需要自己用修图App微调——最常见的问题是肤色和背景不够融合。用醒图或美图秀秀调一下色温就能解决。

我个人用过的感受：妙鸭的汉服模板非常惊艳，但仙侠风格容易翻车——因为仙侠需要飘逸感和光影，模板化的生成做不到那种"灵动"。JIMENG的古风模板种类更多但质量稍差，不过胜在便宜。

方案二：Midjourney cref——最自由的商业级方案

Midjourney的cref（Character Reference）功能允许你上传一张人物照片作为"角色参考"，然后用Prompt描述想要的古风场景——AI会尽量保持角色的面部特征不变，但重新生成整个场景和服装。这个方案最适合想要特定构图和风格的用户。

具体操作步骤：

1. 准备参考图。选2-3张你的清晰正面照上传到Discord，复制图片链接。注意：图片必须清晰、面部无遮挡、光线均匀。美颜过度的照片对面部还原有反效果——AI学不到真实特征。

2. 写Prompt + 设置cref参数。基础格式如下：

/imagine prompt:[古风场景描述] --cref [图片URL] --cw 30 --ar 3:4 --v 6.1

关键参数：--cw控制角色一致性权重。范围0-100，数值越低AI越自由（场景更好但脸越不像），越高脸越像但场景可能变形。我反复测出来的最佳值是30-50——面部相似度大概70%，同时场景自然。

3. 迭代生成。Midjourney的cref不是100%准确的——通常需要跑2-3轮（用Vary Region局部重绘脸部区域）才能达到满意的面部相似度。这也是cref方案最大的痛点——运气成分不小。

坦白讲，Midjourney cref做古风写真是个"看运气"的方案。有时候一步到位非常完美，有时候跑了十轮脸还是不像。如果面部还原是你最看重的，直接跳过这个方案用SD。

方案三：Stable Diffusion + IP-Adapter——终极方案

SD+IP-Adapter是目前AI古风写真最强方案——面部还原度可达90-95%，出图快（10-30秒一张），完全可控（换风格、换场景、换姿势随心所欲）。代价是需要一台有NVIDIA显卡的电脑和大约半天的环境配置。

这个方案门槛确实高，但效果是碾压级的。FlowPix团队内部用的就是这套方案。关键组件：

IP-Adapter FaceID： 这是整个方案的核心。它能把你的面部特征编码成一个向量，然后在生成时"引导"SD往你的面部特征方向画。配合ControlNet可以让你指定姿势——想要侧脸、回眸、低头都能控制。

推荐大模型： 古风写真需要专门的模型才能出好效果。推荐 Civitai上的"墨幽古风""国风3""汉服之美"等checkpoint。通用模型（如SDXL Base）出的古风效果明显不如专用模型。

关键参数：

IP-Adapter weight: 1.3-1.5（越高脸越像但越生硬）
CFG Scale: 5-7（古风写真偏低一点更自然）
采样步数: 30-40
ControlNet: 可选OpenPose控制姿势

我花了两天调出来的最优参数组合是：IP-Adapter weight=1.3、3张不同角度参考图、墨幽古风checkpoint、CFG=6。出来的图自然度高且面部还原稳定在90%左右。有时候能到95%——那种时候真的会"哇"一下。

12种古风写真风格+Prompt——汉唐宋明全朝代覆盖

风格	朝代/类型	Prompt关键词（英文SD用）
汉服齐胸	唐风	Tang dynasty hanfu, high-waist chest-length dress, wide sleeves, floral hair ornaments, palace garden background, golden hour lighting
仙侠白衣	仙侠	xianxia style, flowing white robes, long black hair in wind, floating ribbons, misty mountain peak, ethereal glow, sword in hand
明制袄裙	明风	Ming dynasty hanfu, aoqun style, cross-collar, horse-face skirt, elegant updo hair, classical garden with pavilion, soft afternoon light
敦煌飞天	敦煌	Dunhuang flying apsaras style, colorful flowing ribbons, ancient mural aesthetic, desert background with crescent moon, gold jewelry, dynamic pose
清宫旗装	清宫	Qing dynasty palace dress, Manchu style, elaborate headdress, embroidered robe, palace interior with red lanterns, dignified posture
魏晋风骨	魏晋	Wei-Jin dynasty style, loose casual robes, bamboo forest background, ink wash painting aesthetic, scholar vibes, quiet contemplation
宋制褙子	宋风	Song dynasty beizi, slim elegant silhouette, simple hairpin, tea ceremony setting, muted colors, refined and understated
武侠夜行	武侠	wuxia night warrior style, dark fitted robes, masked face half-revealed, rooftop under full moon, dynamic action pose, bamboo leaves flying
花间词人	文艺	poetic floral scene, sitting among peony flowers, soft pink and white hanfu, petals in hair, spring garden, dreamy bokeh background
雪中红衣	唯美	winter snow scene, bright red hanfu contrast, white fur trim on collar, snowflakes falling, pine trees in background, cinematic lighting
水下洛神	梦幻	underwater goddess style, flowing fabric in water, light rays from above, floating hair, ethereal, magical, ancient myth aesthetic
双人古风	情侣/闺蜜	couple in matching hanfu, male and female, facing each other, ancient bridge at sunset, romantic atmosphere, cinematic composition

我最喜欢的是"雪中红衣"——红色和白色的对比在AI生成中视觉冲击力极强，而且不需要太复杂的场景就能出效果。"水下洛神"看起来很美但非常难生成——水的流动感和面部的清晰度经常冲突，平均要跑15-20张才能出一张能用的。

常见翻车场景+解决方案

AI古风写真最容易翻车的四个地方：面部不像（权重问题）、服装穿越（朝代混搭）、手指畸形（AI通病）、发型崩坏（头发和背景融合）。每个问题都有相对固定的解决套路。

面部不像： 尝试增加IP-Adapter权重到1.5、上传3张不同角度参考图、开启Face Restore（CodeFormer或GFPGAN）。如果还是不像，最后一招是先生成全身图再单独用换脸工具替换面部。

服装穿越： AI经常把不同朝代的服装混在一起——唐风上衣配清宫头饰。解决方法是在Prompt里明确定义一个朝代的特征，不要写笼统的"Chinese ancient style"。写"Tang dynasty"比"ancient Chinese"准确十倍。

发型崩坏： 古风发型复杂（发髻、发簪、步摇），AI经常画到一半就变成了一团。在Negative Prompt（负面词）里加上：messy hair, modern hairstyle, short hair, tangled hair。正面Prompt里明确写完整的发型描述。

常见问题

AI古风写真和AI古风修图有什么区别？

AI修图是在已有照片上改风格——原图姿势背景不变。AI古风写真是从零生成全新古风画面——服装发型场景全是AI新创造的，只有脸参考了你。写真效果像真的去拍了一套古风写真，修图像把现有照片套了古风滤镜。写真更好看但控制更难。两个方向工具和Prompt不一样。

做AI古风写真需要什么工具和技术基础？

三种方案：最简单Midjourney cref（上传参考图+Prompt，10分钟但面部还原度约70%）。中等在线工具妙鸭/JIMENG（上传照片自动生成，零门槛风格有限）。最高质量Stable Diffusion+IP-Adapter（需本地部署有门槛，面部还原度90%+）。零基础建议在线工具入手，效果好再升级到SD。

AI古风写真面部不像自己怎么办？

最常见问题。三种解法：调高参考图权重（SD IP-Adapter weight 1.3-1.5，MJ --cw 30-50）；多张参考图叠加（正面+侧面+半侧面共3张）；后期换脸（Roop/FaceFusion替换生成图面部）。FlowPix实测最优：IP-Adapter weight=1.3+3张参考图，面部相似度稳定85-95%。

做完一套AI古风写真之后最大的感受是：这技术已经能把"去影楼花2000块拍半天"的体验压缩成"在家花半小时跑几十张图"。当然影楼有影楼的好——真实光影、真实互动、真实体验。但如果你只是想有几张好看的汉服照发朋友圈，AI已经能完美满足这个需求了。分享给你那个也想要古风写真的朋友吧。