AI古风写真生成:不用穿汉服也能拍出绝美古风大片
简单说:AI古风写真已经能做得很像了。上传3-5张你的照片,AI就能生成你穿汉服、仙侠装、唐风襦裙的写真——不是P图换脸,是从零生成的完整画面。SD+IP-Adapter方案面部还原度能做到90%以上,Midjourney cref更简单但还原度约70%。
AI古风写真生成:不用穿汉服也能拍出绝美古风大片
上个月我女朋友刷小红书看到一个女生用AI做了一套汉服写真——远山眉、点绛唇、轻纱裙摆在月光下飘飘欲仙。她以为是找摄影师拍的,结果人家说是AI生成的。然后她来了一句:"我也想要。"于是我花了两个周末把市面上的AI写真方案全试了一遍。说实话,最后的结果好到我自己都没想到——那张"她在竹林里抚琴"的图被设成了手机壁纸,看了两个星期还在看。这篇文章就是这两个周末折腾出来的完整攻略。
AI古风写真 vs AI古风修图——别搞混了
核心区别:AI古风修图是在你已有照片上改风格——原图的姿势、背景、光线不变,只改色调和服装。AI古风写真是从零生成一张全新的、以你面部特征为参考的古风画面——服装、发型、场景、光影全是AI新创造的。写真效果好很多,但控制的难度也高很多。
举个例子:你有一张在咖啡厅的自拍。用AI修图,出来的结果还是你在咖啡厅——只是衣服变了、加了古风滤镜。用AI写真,出来的结果是你在月下庭院弹古筝——整个场景是AI创造的,只有脸参考了你。后者像真的去拍了一套写真。前者像P了个图。
我这篇文章聚焦在"写真生成"上。如果你想了解古风修图(已有照片改古风),FlowPix之前写过 古风修图教程。两个方向的Prompt和工具都不一样,别走错路了。
三种方案对比——从零基础到硬核玩家
| 方案 | 面部还原度 | 技术门槛 | 出图速度 | 费用 | 自由度 |
|---|---|---|---|---|---|
| 在线工具(妙鸭/JIMENG) | 85-95% | ★☆☆☆☆ | 5-15分钟 | 免费试/付费 | 低,固定模板 |
| Midjourney cref | 65-75% | ★★☆☆☆ | 2-5分钟 | $30/月 | 中,可写Prompt |
| SD + IP-Adapter | 85-95% | ★★★★☆ | 10-30秒/张 | 免费(需显卡) | 最高,完全可控 |
说实话,如果你只是想"试试看效果",先用在线的——5分钟出片,免费。如果你追求最好的效果且愿意折腾,SD+IP-Adapter是最终答案。Midjourney cref位处中间——比在线工具自由但比SD简单,面部还原度是个硬伤。
方案一:在线AI写真工具——5分钟出片,零门槛
妙鸭相机和JIMENG是2026年最主流的AI写真在线工具——上传10-20张你的照片(需要不同角度和光线),等5-15分钟训练模型,然后选古风模板一键生成。优点是简单到离谱,缺点是不能自定义风格——只能用平台给的模板。
具体流程(以妙鸭相机为例):
1. 上传15-20张你的照片。注意:需要包含正面、侧面、半侧面,光线不能太暗,表情要自然。这一步最关键——照片质量和多样性直接决定生成效果。根据 妙鸭相机官方建议,最少8张,推荐15张以上。
2. 等待训练。这个过程约5-15分钟,取决于服务器排队情况。训练期间你可以去做别的事——App会推送通知。
3. 选择古风模板。目前主流平台通常提供汉服、仙侠、唐风、清宫、敦煌等5-8种古风模板。选模板后AI自动填充你的面部。
4. 下载+微调。在线工具出的图可能需要自己用修图App微调——最常见的问题是肤色和背景不够融合。用醒图或美图秀秀调一下色温就能解决。
我个人用过的感受:妙鸭的汉服模板非常惊艳,但仙侠风格容易翻车——因为仙侠需要飘逸感和光影,模板化的生成做不到那种"灵动"。JIMENG的古风模板种类更多但质量稍差,不过胜在便宜。
方案二:Midjourney cref——最自由的商业级方案
Midjourney的cref(Character Reference)功能允许你上传一张人物照片作为"角色参考",然后用Prompt描述想要的古风场景——AI会尽量保持角色的面部特征不变,但重新生成整个场景和服装。这个方案最适合想要特定构图和风格的用户。
具体操作步骤:
1. 准备参考图。选2-3张你的清晰正面照上传到Discord,复制图片链接。注意:图片必须清晰、面部无遮挡、光线均匀。美颜过度的照片对面部还原有反效果——AI学不到真实特征。
2. 写Prompt + 设置cref参数。基础格式如下:
/imagine prompt:[古风场景描述] --cref [图片URL] --cw 30 --ar 3:4 --v 6.1
关键参数:--cw控制角色一致性权重。范围0-100,数值越低AI越自由(场景更好但脸越不像),越高脸越像但场景可能变形。我反复测出来的最佳值是30-50——面部相似度大概70%,同时场景自然。
3. 迭代生成。Midjourney的cref不是100%准确的——通常需要跑2-3轮(用Vary Region局部重绘脸部区域)才能达到满意的面部相似度。这也是cref方案最大的痛点——运气成分不小。
坦白讲,Midjourney cref做古风写真是个"看运气"的方案。有时候一步到位非常完美,有时候跑了十轮脸还是不像。如果面部还原是你最看重的,直接跳过这个方案用SD。
方案三:Stable Diffusion + IP-Adapter——终极方案
SD+IP-Adapter是目前AI古风写真最强方案——面部还原度可达90-95%,出图快(10-30秒一张),完全可控(换风格、换场景、换姿势随心所欲)。代价是需要一台有NVIDIA显卡的电脑和大约半天的环境配置。
这个方案门槛确实高,但效果是碾压级的。FlowPix团队内部用的就是这套方案。关键组件:
IP-Adapter FaceID: 这是整个方案的核心。它能把你的面部特征编码成一个向量,然后在生成时"引导"SD往你的面部特征方向画。配合ControlNet可以让你指定姿势——想要侧脸、回眸、低头都能控制。
推荐大模型: 古风写真需要专门的模型才能出好效果。推荐 Civitai上的"墨幽古风""国风3""汉服之美"等checkpoint。通用模型(如SDXL Base)出的古风效果明显不如专用模型。
关键参数:
IP-Adapter weight: 1.3-1.5(越高脸越像但越生硬)
CFG Scale: 5-7(古风写真偏低一点更自然)
采样步数: 30-40
ControlNet: 可选OpenPose控制姿势
我花了两天调出来的最优参数组合是:IP-Adapter weight=1.3、3张不同角度参考图、墨幽古风checkpoint、CFG=6。出来的图自然度高且面部还原稳定在90%左右。有时候能到95%——那种时候真的会"哇"一下。
12种古风写真风格+Prompt——汉唐宋明全朝代覆盖
| 风格 | 朝代/类型 | Prompt关键词(英文SD用) |
|---|---|---|
| 汉服齐胸 | 唐风 | Tang dynasty hanfu, high-waist chest-length dress, wide sleeves, floral hair ornaments, palace garden background, golden hour lighting |
| 仙侠白衣 | 仙侠 | xianxia style, flowing white robes, long black hair in wind, floating ribbons, misty mountain peak, ethereal glow, sword in hand |
| 明制袄裙 | 明风 | Ming dynasty hanfu, aoqun style, cross-collar, horse-face skirt, elegant updo hair, classical garden with pavilion, soft afternoon light |
| 敦煌飞天 | 敦煌 | Dunhuang flying apsaras style, colorful flowing ribbons, ancient mural aesthetic, desert background with crescent moon, gold jewelry, dynamic pose |
| 清宫旗装 | 清宫 | Qing dynasty palace dress, Manchu style, elaborate headdress, embroidered robe, palace interior with red lanterns, dignified posture |
| 魏晋风骨 | 魏晋 | Wei-Jin dynasty style, loose casual robes, bamboo forest background, ink wash painting aesthetic, scholar vibes, quiet contemplation |
| 宋制褙子 | 宋风 | Song dynasty beizi, slim elegant silhouette, simple hairpin, tea ceremony setting, muted colors, refined and understated |
| 武侠夜行 | 武侠 | wuxia night warrior style, dark fitted robes, masked face half-revealed, rooftop under full moon, dynamic action pose, bamboo leaves flying |
| 花间词人 | 文艺 | poetic floral scene, sitting among peony flowers, soft pink and white hanfu, petals in hair, spring garden, dreamy bokeh background |
| 雪中红衣 | 唯美 | winter snow scene, bright red hanfu contrast, white fur trim on collar, snowflakes falling, pine trees in background, cinematic lighting |
| 水下洛神 | 梦幻 | underwater goddess style, flowing fabric in water, light rays from above, floating hair, ethereal, magical, ancient myth aesthetic |
| 双人古风 | 情侣/闺蜜 | couple in matching hanfu, male and female, facing each other, ancient bridge at sunset, romantic atmosphere, cinematic composition |
我最喜欢的是"雪中红衣"——红色和白色的对比在AI生成中视觉冲击力极强,而且不需要太复杂的场景就能出效果。"水下洛神"看起来很美但非常难生成——水的流动感和面部的清晰度经常冲突,平均要跑15-20张才能出一张能用的。
常见翻车场景+解决方案
AI古风写真最容易翻车的四个地方:面部不像(权重问题)、服装穿越(朝代混搭)、手指畸形(AI通病)、发型崩坏(头发和背景融合)。每个问题都有相对固定的解决套路。
面部不像: 尝试增加IP-Adapter权重到1.5、上传3张不同角度参考图、开启Face Restore(CodeFormer或GFPGAN)。如果还是不像,最后一招是先生成全身图再单独用换脸工具替换面部。
服装穿越: AI经常把不同朝代的服装混在一起——唐风上衣配清宫头饰。解决方法是在Prompt里明确定义一个朝代的特征,不要写笼统的"Chinese ancient style"。写"Tang dynasty"比"ancient Chinese"准确十倍。
发型崩坏: 古风发型复杂(发髻、发簪、步摇),AI经常画到一半就变成了一团。在Negative Prompt(负面词)里加上:messy hair, modern hairstyle, short hair, tangled hair。正面Prompt里明确写完整的发型描述。
常见问题
AI古风写真和AI古风修图有什么区别?
AI修图是在已有照片上改风格——原图姿势背景不变。AI古风写真是从零生成全新古风画面——服装发型场景全是AI新创造的,只有脸参考了你。写真效果像真的去拍了一套古风写真,修图像把现有照片套了古风滤镜。写真更好看但控制更难。两个方向工具和Prompt不一样。
做AI古风写真需要什么工具和技术基础?
三种方案:最简单Midjourney cref(上传参考图+Prompt,10分钟但面部还原度约70%)。中等在线工具妙鸭/JIMENG(上传照片自动生成,零门槛风格有限)。最高质量Stable Diffusion+IP-Adapter(需本地部署有门槛,面部还原度90%+)。零基础建议在线工具入手,效果好再升级到SD。
AI古风写真面部不像自己怎么办?
最常见问题。三种解法:调高参考图权重(SD IP-Adapter weight 1.3-1.5,MJ --cw 30-50);多张参考图叠加(正面+侧面+半侧面共3张);后期换脸(Roop/FaceFusion替换生成图面部)。FlowPix实测最优:IP-Adapter weight=1.3+3张参考图,面部相似度稳定85-95%。
做完一套AI古风写真之后最大的感受是:这技术已经能把"去影楼花2000块拍半天"的体验压缩成"在家花半小时跑几十张图"。当然影楼有影楼的好——真实光影、真实互动、真实体验。但如果你只是想有几张好看的汉服照发朋友圈,AI已经能完美满足这个需求了。分享给你那个也想要古风写真的朋友吧。