AI修图开源项目盘点:GitHub上星标最高的10个 - FlowPix
简单说:想玩ai修图开源项目,GitHub上选择多到眼花。星标最高的是Stable Diffusion WebUI(16万+星)和ComfyUI(10万+星),专项修图推荐GFPGAN、Real-ESRGAN和rembg。本文挑了10个最值得折腾的,附上手难度评级。
你有没有过这种体验——看到某个AI修图效果图惊为天人,点进去发现是个开源项目,兴冲冲clone下来,结果环境装了三天还没跑起来?
我有。不止一次。
GitHub上的ai修图开源项目多得离谱,随便搜能出来几百个。但真正值得花时间折腾的,其实也就那么十来个。剩下的要么文档稀烂,要么半年没更新,要么跑起来效果跟demo差了十万八千里。FlowPix编辑部花了两周,把星标高、社区活跃、实际能用的项目筛了一遍,最后留下这10个。
先看排名——按星标数排序的完整列表
截至2026年2月,GitHub上AI修图相关的开源项目中,星标最高的10个涵盖了从全能型UI到单功能工具的完整链条。下面这个表直接看:
| 排名 | 项目名 | 星标(约) | 核心功能 | 上手难度 |
|---|---|---|---|---|
| 1 | Stable Diffusion WebUI | 160k+ | 全能AI绘画/修图界面 | ⭐⭐⭐ |
| 2 | ComfyUI | 103k+ | 节点式AI图像工作流 | ⭐⭐⭐⭐ |
| 3 | Fooocus | 42k+ | 简化版SD,一键出图 | ⭐⭐ |
| 4 | GFPGAN | 36k+ | 人脸修复增强 | ⭐⭐ |
| 5 | Real-ESRGAN | 34k+ | 图片超分辨率放大 | ⭐ |
| 6 | rembg | 18k+ | AI抠图去背景 | ⭐ |
| 7 | CodeFormer | 16k+ | 人脸修复(比GFPGAN更新) | ⭐⭐ |
| 8 | InvokeAI | 24k+ | 专业级AI图像生成/编辑 | ⭐⭐⭐ |
| 9 | Upscayl | 32k+ | 桌面端AI放大(有GUI) | ⭐ |
| 10 | Step1X-Edit | 2k+ | 指令式图像编辑(新秀) | ⭐⭐⭐ |
星标数每天都在变,但大的排序格局基本稳定。根据GitHub image-editing话题页的统计,AI图像处理类项目在2025年全年新增星标总量超过50万,是增长最快的开源领域之一。
第一梯队:Stable Diffusion WebUI和ComfyUI
这两个是ai修图开源领域的绝对王者,星标加起来超过26万,基本上所有AI修图玩家都绕不开它们。
Stable Diffusion WebUI——AUTOMATIC1111搞的——是绝大多数人接触AI修图的入口。装好之后打开浏览器就能用。文生图、图生图、局部重绘、ControlNet控制……功能多到界面都快放不下了。说实话,这个项目的UI不好看,按钮密密麻麻的,但架不住功能全啊。你想实现的AI修图效果,八成能在这里找到对应的插件。
ComfyUI走的是另一条路。节点式操作,像连线路图一样搭工作流。上手门槛比WebUI高不少——第一次打开那个界面我是有点懵的。但一旦搞懂了,自由度远超WebUI。复杂的修图流程可以保存成工作流模板,下次一键复用。做商业项目的团队很多在用这个。
两个怎么选?简单粗暴的答案:新手先WebUI,进阶了再考虑ComfyUI。不过话说回来,现在也有人直接从ComfyUI入手——因为社区分享的工作流太多了,直接导入就能用,反而比自己在WebUI里调参数简单。
Fooocus——给嫌SD太复杂的人
Fooocus是lllyasviel做的,主打"Midjourney级别的简单,Stable Diffusion级别的灵活",下载解压就能跑,不用装Python环境。
42k+星标。这个数字能说明问题。
很多人——包括我身边好几个设计师朋友——试过WebUI之后就放弃了。原因很简单:太复杂。采样器选哪个?CFG Scale调多少?步数设多少?这些参数对非技术用户来说就是天书。Fooocus把这些全藏起来了,你只管打字描述想要什么,它帮你调。
修图方面,Fooocus的Inpaint和Outpaint做得相当不错。选中区域、描述想改成什么、点生成,完事。我上个月帮朋友修一组产品图,用Fooocus的Inpaint换了背景,效果出乎意料的好。速度也快——8G显存的显卡跑起来很流畅。
如果你想了解更多开源修图工具的使用方法,可以看看开源AI修图工具合集这篇。
GFPGAN和CodeFormer——人脸修复双雄
老照片糊了、视频截图人脸马赛克、证件照像素低——这类"脸部修复"需求,GFPGAN和CodeFormer是目前开源方案里效果最好的两个。
GFPGAN是腾讯ARC实验室的,36k+星标,老牌项目了。修复效果稳定,特别是对严重模糊的人脸,能"凭空"补出五官细节。听起来有点玄乎?其实原理是用了大量人脸数据训练的生成模型,根据模糊轮廓推测最可能的清晰样子。
CodeFormer更新一些,同样来自腾讯ARC团队。16k+星标,数字不如GFPGAN,但并不代表效果差——相反,在很多场景下CodeFormer的修复质量更高。它有一个"保真度"参数可以调,往左偏质量、往右偏还原度,这个设计非常实用。
两个我都用过。老实讲,大多数情况下差别不大。但如果照片本身还能看清基本轮廓,CodeFormer通常更好;如果糊到几乎认不出,GFPGAN更"敢猜"。
Real-ESRGAN——图片放大的扛把子
Real-ESRGAN专门干一件事:把低分辨率图片放大到2倍、4倍甚至8倍,同时保持甚至提升清晰度。34k+星标,是最主流的AI超分辨率开源方案。
这玩意儿有多好用?给你说个真事。有次我找到一张很老的家庭合照,扫描出来只有400×300像素,打印出来全是锯齿。丢给Real-ESRGAN跑了一遍4倍放大,出来1600×1200,而且清晰度肉眼可见地提升了。不是那种简单拉伸的模糊,是真的"看起来本来就是这个分辨率"。
安装超简单。官方提供了编译好的可执行文件(GitHub仓库有下载链接),Windows用户双击就能用,不需要Python、不需要显卡驱动。这一点比上面那些项目友好太多了。
它跟Upscayl的关系后面会说到——剧透一下,Upscayl的核心引擎之一就是Real-ESRGAN。
rembg——一行命令抠图
rembg是Python写的AI去背景工具,18k+星标。一行pip install、一行命令,图片背景就没了。就这么简单。
做电商的人应该对这类工具不陌生。产品图需要白底?人物照需要透明背景?以前要用PS慢慢抠,现在rembg i input.jpg output.png搞定。
效果怎么样?说实话,简单背景(纯色、单一场景)的抠图效果已经非常好了,毛发边缘处理也算过得去。复杂背景偶尔会有瑕疵——比如透明玻璃杯、头发丝很细的情况——但总体来说,够用。比在线抠图网站那些带水印、限制分辨率的强多了。
它还支持批量处理,给一个文件夹的图一次性全部去背景。做电商产品图的同学,这个功能值回票价(虽然本来就免费)。想看更多AI抠图方案的对比,推荐GitHub上的开源AI修图项目汇总。
InvokeAI——被低估的专业选手
InvokeAI是一个面向专业用户的AI图像生成和编辑平台,24k+星标,有完善的Web界面和统一画布(Unified Canvas)功能。
为什么说被低估?因为很多人只知道WebUI和ComfyUI,但InvokeAI在某些方面其实做得更好。它的安装器比WebUI简单——有个一键安装脚本,基本上跟着提示点就行。统一画布功能让你像用PS一样在一块大画布上做AI修图——局部擦除、局部生成、扩展画布,操作逻辑非常直觉。
它的节点编辑器也在快速迭代,功能上开始接近ComfyUI了,但界面更现代、更好看。
如果你对Stable Diffusion在修图方面的应用感兴趣,Stable Diffusion修图实战指南写得比较详细。
Upscayl——不会命令行也能用的放大工具
Upscayl是一个开源的桌面端AI图片放大应用,32k+星标,支持Windows、Mac和Linux,有图形界面,拖进去就能放大。
这个项目解决了一个痛点:很多人知道Real-ESRGAN效果好,但不会用命令行。Upscayl就是给Real-ESRGAN套了一个好看的壳——当然不仅仅是Real-ESRGAN,它还集成了其他几个AI放大模型,可以切换。
界面很干净。左边原图,右边结果,中间一个滑块对比。选个模型、选个倍数、点开始,等一会儿就好了。
有个小坑要提一下:Upscayl对显卡有要求,用Vulkan后端,AMD和NVIDIA都支持,但集成显卡可能很慢甚至跑不了。没有独显的话,还是老老实实用Real-ESRGAN的CPU版本吧。
Step1X-Edit——2026年的新黑马
Step1X-Edit是阶跃星辰(StepFun)发布的开源图像编辑模型,2k+星标虽然不高,但它的能力对标GPT-4o和Gemini 2 Flash的图像编辑功能。这是2026年最值得关注的新项目,没有之一。
为什么特别提它?因为它做的事情跟前面那些不一样。前面的项目大多是"单项冠军"——抠图的只管抠图、放大的只管放大。Step1X-Edit走的是"指令编辑"路线:你用自然语言告诉它"把天空换成星空"、"让这个人穿红色衣服"、"去掉画面右边那个路人",它直接改。
v1.2版本还加入了推理编辑能力,效果在多个benchmark上超过了不少闭源方案。FlowPix编辑部测试过,在简单指令上的执行准确率确实惊喜。复杂指令偶尔会翻车,但考虑到这是开源的、免费的,已经很了不起了。
想了解更多免费方案,可以看免费AI修图工具推荐。
新手入门路线建议
项目太多不知道从哪个开始?根据你的需求选一个就好,别贪多。
说真的,上面10个项目全部装一遍既没必要也很浪费时间。不同需求对应不同工具:
- 就想放大模糊照片 → Upscayl(有GUI)或Real-ESRGAN(命令行)
- 想抠图去背景 → rembg
- 想修复老照片的人脸 → CodeFormer或GFPGAN
- 想做AI绘画+修图全套 → 先WebUI,再ComfyUI
- 就想简单出图不折腾 → Fooocus
- 想体验最新的指令式编辑 → Step1X-Edit
对了,关于环境配置——这是大多数人卡住的地方。Python版本不对、CUDA不匹配、依赖冲突……这些坑我都踩过。最省心的方案是用conda创建独立环境,每个项目一个环境,互不干扰。虽然会多占一些硬盘空间,但能省下大量debug的时间。
如果你是完全的新手,推荐先看AI修图完整入门指南,里面有环境配置的详细步骤。
硬件要求汇总
跑这些AI修图开源项目,显卡是最关键的硬件。NVIDIA显卡是主流选择,6G显存是入门线,8G够用,12G以上才算舒服。
| 项目 | 最低显存 | 推荐显存 | CPU能跑吗 |
|---|---|---|---|
| WebUI | 4G | 8G+ | 能,很慢 |
| ComfyUI | 4G | 8G+ | 能,很慢 |
| Fooocus | 4G | 8G | 不建议 |
| GFPGAN | 2G | 4G | 能 |
| Real-ESRGAN | 2G | 4G | 能,有专用版 |
| rembg | 不需要 | 不需要 | 默认CPU |
| CodeFormer | 2G | 4G | 能 |
| Upscayl | 2G | 4G | 很慢 |
| Step1X-Edit | 4G | 8G+ | 不建议 |
AMD显卡用户不要灰心——ComfyUI和WebUI都在改善AMD支持,ROCm驱动虽然还没CUDA那么丝滑,但日常出图已经没问题。Mac用户的话,Apple Silicon的MPS加速也在逐步完善中,M1以上芯片跑这些项目基本都能跑。
最后说几句掏心窝的话。开源的魅力就在于这些项目是全世界的开发者一起在推进的,每周都有新功能、新优化冒出来。但也正因为迭代太快,很多教程几个月就过时了。最靠谱的信息源永远是项目的GitHub页面和GitHub官方的image-processing话题页。
这篇盘点不一定能覆盖所有好项目——比如ICEdit、ImgEdit这些2025年新出的论文项目也很有潜力,只是星标还太少、社区还不成熟,等它们再长长再单独聊。觉得这篇有用的话,分享给身边也在折腾AI修图的朋友吧,一起少踩坑。