AI 工具

AI修图开源项目盘点：GitHub上星标最高的10个 - FlowPix

Q: 什么是修图开源项目GitHub上星标最高的10？

，涉及相关技术和应用场景的快速发展。

FlowPix Team 发布于 2026-02-22 更新于 2026-06-21 5,304 字

简单说：想玩ai修图开源项目，GitHub上选择多到眼花。星标最高的是Stable Diffusion WebUI（16万+星）和ComfyUI（10万+星），专项修图推荐GFPGAN、Real-ESRGAN和rembg。本文挑了10个最值得折腾的，附上手难度评级。

你有没有过这种体验——看到某个AI修图效果图惊为天人，点进去发现是个开源项目，兴冲冲clone下来，结果环境装了三天还没跑起来？

我有。不止一次。

GitHub上的ai修图开源项目多得离谱，随便搜能出来几百个。但真正值得花时间折腾的，其实也就那么十来个。剩下的要么文档稀烂，要么半年没更新，要么跑起来效果跟demo差了十万八千里。FlowPix编辑部花了两周，把星标高、社区活跃、实际能用的项目筛了一遍，最后留下这10个。

先看排名——按星标数排序的完整列表

截至2026年2月，GitHub上AI修图相关的开源项目中，星标最高的10个涵盖了从全能型UI到单功能工具的完整链条。下面这个表直接看：

排名	项目名	星标（约）	核心功能	上手难度
1	Stable Diffusion WebUI	160k+	全能AI绘画/修图界面	⭐⭐⭐
2	ComfyUI	103k+	节点式AI图像工作流	⭐⭐⭐⭐
3	Fooocus	42k+	简化版SD，一键出图	⭐⭐
4	GFPGAN	36k+	人脸修复增强	⭐⭐
5	Real-ESRGAN	34k+	图片超分辨率放大	⭐
6	rembg	18k+	AI抠图去背景	⭐
7	CodeFormer	16k+	人脸修复（比GFPGAN更新）	⭐⭐
8	InvokeAI	24k+	专业级AI图像生成/编辑	⭐⭐⭐
9	Upscayl	32k+	桌面端AI放大（有GUI）	⭐
10	Step1X-Edit	2k+	指令式图像编辑（新秀）	⭐⭐⭐

星标数每天都在变，但大的排序格局基本稳定。根据GitHub image-editing话题页的统计，AI图像处理类项目在2025年全年新增星标总量超过50万，是增长最快的开源领域之一。

第一梯队：Stable Diffusion WebUI和ComfyUI

这两个是ai修图开源领域的绝对王者，星标加起来超过26万，基本上所有AI修图玩家都绕不开它们。

Stable Diffusion WebUI——AUTOMATIC1111搞的——是绝大多数人接触AI修图的入口。装好之后打开浏览器就能用。文生图、图生图、局部重绘、ControlNet控制……功能多到界面都快放不下了。说实话，这个项目的UI不好看，按钮密密麻麻的，但架不住功能全啊。你想实现的AI修图效果，八成能在这里找到对应的插件。

ComfyUI走的是另一条路。节点式操作，像连线路图一样搭工作流。上手门槛比WebUI高不少——第一次打开那个界面我是有点懵的。但一旦搞懂了，自由度远超WebUI。复杂的修图流程可以保存成工作流模板，下次一键复用。做商业项目的团队很多在用这个。

两个怎么选？简单粗暴的答案：新手先WebUI，进阶了再考虑ComfyUI。不过话说回来，现在也有人直接从ComfyUI入手——因为社区分享的工作流太多了，直接导入就能用，反而比自己在WebUI里调参数简单。

Fooocus——给嫌SD太复杂的人

Fooocus是lllyasviel做的，主打"Midjourney级别的简单，Stable Diffusion级别的灵活"，下载解压就能跑，不用装Python环境。

42k+星标。这个数字能说明问题。

很多人——包括我身边好几个设计师朋友——试过WebUI之后就放弃了。原因很简单：太复杂。采样器选哪个？CFG Scale调多少？步数设多少？这些参数对非技术用户来说就是天书。Fooocus把这些全藏起来了，你只管打字描述想要什么，它帮你调。

修图方面，Fooocus的Inpaint和Outpaint做得相当不错。选中区域、描述想改成什么、点生成，完事。我上个月帮朋友修一组产品图，用Fooocus的Inpaint换了背景，效果出乎意料的好。速度也快——8G显存的显卡跑起来很流畅。

如果你想了解更多开源修图工具的使用方法，可以看看开源AI修图工具合集这篇。

GFPGAN和CodeFormer——人脸修复双雄

老照片糊了、视频截图人脸马赛克、证件照像素低——这类"脸部修复"需求，GFPGAN和CodeFormer是目前开源方案里效果最好的两个。

GFPGAN是腾讯ARC实验室的，36k+星标，老牌项目了。修复效果稳定，特别是对严重模糊的人脸，能"凭空"补出五官细节。听起来有点玄乎？其实原理是用了大量人脸数据训练的生成模型，根据模糊轮廓推测最可能的清晰样子。

CodeFormer更新一些，同样来自腾讯ARC团队。16k+星标，数字不如GFPGAN，但并不代表效果差——相反，在很多场景下CodeFormer的修复质量更高。它有一个"保真度"参数可以调，往左偏质量、往右偏还原度，这个设计非常实用。

两个我都用过。老实讲，大多数情况下差别不大。但如果照片本身还能看清基本轮廓，CodeFormer通常更好；如果糊到几乎认不出，GFPGAN更"敢猜"。

Real-ESRGAN——图片放大的扛把子

Real-ESRGAN专门干一件事：把低分辨率图片放大到2倍、4倍甚至8倍，同时保持甚至提升清晰度。34k+星标，是最主流的AI超分辨率开源方案。

这玩意儿有多好用？给你说个真事。有次我找到一张很老的家庭合照，扫描出来只有400×300像素，打印出来全是锯齿。丢给Real-ESRGAN跑了一遍4倍放大，出来1600×1200，而且清晰度肉眼可见地提升了。不是那种简单拉伸的模糊，是真的"看起来本来就是这个分辨率"。

安装超简单。官方提供了编译好的可执行文件（GitHub仓库有下载链接），Windows用户双击就能用，不需要Python、不需要显卡驱动。这一点比上面那些项目友好太多了。

它跟Upscayl的关系后面会说到——剧透一下，Upscayl的核心引擎之一就是Real-ESRGAN。

rembg——一行命令抠图

rembg是Python写的AI去背景工具，18k+星标。一行pip install、一行命令，图片背景就没了。就这么简单。

做电商的人应该对这类工具不陌生。产品图需要白底？人物照需要透明背景？以前要用PS慢慢抠，现在rembg i input.jpg output.png搞定。

效果怎么样？说实话，简单背景（纯色、单一场景）的抠图效果已经非常好了，毛发边缘处理也算过得去。复杂背景偶尔会有瑕疵——比如透明玻璃杯、头发丝很细的情况——但总体来说，够用。比在线抠图网站那些带水印、限制分辨率的强多了。

它还支持批量处理，给一个文件夹的图一次性全部去背景。做电商产品图的同学，这个功能值回票价（虽然本来就免费）。想看更多AI抠图方案的对比，推荐GitHub上的开源AI修图项目汇总。

InvokeAI——被低估的专业选手

InvokeAI是一个面向专业用户的AI图像生成和编辑平台，24k+星标，有完善的Web界面和统一画布（Unified Canvas）功能。

为什么说被低估？因为很多人只知道WebUI和ComfyUI，但InvokeAI在某些方面其实做得更好。它的安装器比WebUI简单——有个一键安装脚本，基本上跟着提示点就行。统一画布功能让你像用PS一样在一块大画布上做AI修图——局部擦除、局部生成、扩展画布，操作逻辑非常直觉。

它的节点编辑器也在快速迭代，功能上开始接近ComfyUI了，但界面更现代、更好看。

如果你对Stable Diffusion在修图方面的应用感兴趣，Stable Diffusion修图实战指南写得比较详细。

Upscayl——不会命令行也能用的放大工具

Upscayl是一个开源的桌面端AI图片放大应用，32k+星标，支持Windows、Mac和Linux，有图形界面，拖进去就能放大。

这个项目解决了一个痛点：很多人知道Real-ESRGAN效果好，但不会用命令行。Upscayl就是给Real-ESRGAN套了一个好看的壳——当然不仅仅是Real-ESRGAN，它还集成了其他几个AI放大模型，可以切换。

界面很干净。左边原图，右边结果，中间一个滑块对比。选个模型、选个倍数、点开始，等一会儿就好了。

有个小坑要提一下：Upscayl对显卡有要求，用Vulkan后端，AMD和NVIDIA都支持，但集成显卡可能很慢甚至跑不了。没有独显的话，还是老老实实用Real-ESRGAN的CPU版本吧。

Step1X-Edit——2026年的新黑马

Step1X-Edit是阶跃星辰（StepFun）发布的开源图像编辑模型，2k+星标虽然不高，但它的能力对标GPT-4o和Gemini 2 Flash的图像编辑功能。这是2026年最值得关注的新项目，没有之一。

为什么特别提它？因为它做的事情跟前面那些不一样。前面的项目大多是"单项冠军"——抠图的只管抠图、放大的只管放大。Step1X-Edit走的是"指令编辑"路线：你用自然语言告诉它"把天空换成星空"、"让这个人穿红色衣服"、"去掉画面右边那个路人"，它直接改。

v1.2版本还加入了推理编辑能力，效果在多个benchmark上超过了不少闭源方案。FlowPix编辑部测试过，在简单指令上的执行准确率确实惊喜。复杂指令偶尔会翻车，但考虑到这是开源的、免费的，已经很了不起了。

想了解更多免费方案，可以看免费AI修图工具推荐。

新手入门路线建议

项目太多不知道从哪个开始？根据你的需求选一个就好，别贪多。

说真的，上面10个项目全部装一遍既没必要也很浪费时间。不同需求对应不同工具：

就想放大模糊照片 → Upscayl（有GUI）或Real-ESRGAN（命令行）
想抠图去背景 → rembg
想修复老照片的人脸 → CodeFormer或GFPGAN
想做AI绘画+修图全套 → 先WebUI，再ComfyUI
就想简单出图不折腾 → Fooocus
想体验最新的指令式编辑 → Step1X-Edit

对了，关于环境配置——这是大多数人卡住的地方。Python版本不对、CUDA不匹配、依赖冲突……这些坑我都踩过。最省心的方案是用conda创建独立环境，每个项目一个环境，互不干扰。虽然会多占一些硬盘空间，但能省下大量debug的时间。

如果你是完全的新手，推荐先看AI修图完整入门指南，里面有环境配置的详细步骤。

硬件要求汇总

跑这些AI修图开源项目，显卡是最关键的硬件。NVIDIA显卡是主流选择，6G显存是入门线，8G够用，12G以上才算舒服。

项目	最低显存	推荐显存	CPU能跑吗
WebUI	4G	8G+	能，很慢
ComfyUI	4G	8G+	能，很慢
Fooocus	4G	8G	不建议
GFPGAN	2G	4G	能
Real-ESRGAN	2G	4G	能，有专用版
rembg	不需要	不需要	默认CPU
CodeFormer	2G	4G	能
Upscayl	2G	4G	很慢
Step1X-Edit	4G	8G+	不建议

AMD显卡用户不要灰心——ComfyUI和WebUI都在改善AMD支持，ROCm驱动虽然还没CUDA那么丝滑，但日常出图已经没问题。Mac用户的话，Apple Silicon的MPS加速也在逐步完善中，M1以上芯片跑这些项目基本都能跑。

最后说几句掏心窝的话。开源的魅力就在于这些项目是全世界的开发者一起在推进的，每周都有新功能、新优化冒出来。但也正因为迭代太快，很多教程几个月就过时了。最靠谱的信息源永远是项目的GitHub页面和GitHub官方的image-processing话题页。

这篇盘点不一定能覆盖所有好项目——比如ICEdit、ImgEdit这些2025年新出的论文项目也很有潜力，只是星标还太少、社区还不成熟，等它们再长长再单独聊。觉得这篇有用的话，分享给身边也在折腾AI修图的朋友吧，一起少踩坑。

常见问题

什么是修图开源项目GitHub上星标最高的10？

，涉及相关技术和应用场景的快速发展。

AI在？

目前在短视频制作、内容创作、效率工具等领域已有不少实际落地的应用案例，能帮用户节省大量时间和精力。

修图开源项目GitHub上星标最高的10和传统方法比有什么优势？

相比传统方法，AI方案在速度、成本和可扩展性上有明显优势，但精细度和创意方面仍需人工把关。