AI修图开源工具GitHub精选:免费又能自己部署的方案 - FlowPix
简单说:ai修图github上最香的几类项目——抠图用U2-Net/SAM、超分用Real-ESRGAN、人脸修复用GFPGAN、全能编辑上Stable Diffusion。能自己搭服务器的话,零月费、无限用,数据还全在自己手里。
AI修图开源工具GitHub精选:免费又能自己部署的方案
你有没有这种纠结——想用AI修图,但不想把照片往别人服务器传,也不想每月交订阅费?我去年折腾了一圈,发现ai修图github上其实有不少好东西,能自己部署、完全免费、效果也不输那些收费的在线工具。
说实话,开源项目门槛确实比"打开网页点一下"高,要装环境、配显卡。但一旦搭好,你就彻底自由了。FlowPix编辑部整理了一份GitHub上最值得收藏的AI修图开源项目清单,从抠图、超分、人脸修复到全能编辑,按需求分好了。
抠图去背景:U2-Net 和 SAM
抠图这块,U2-Net 和 Meta 的 SAM 是 GitHub 上最稳的两个方案,自部署后不限次数、效果也够专业。
U2-Net 是老牌选手了,模型小、跑得快,一块普通显卡甚至 CPU 都能跑。发丝边缘处理得比很多在线工具还干净。项目在 GitHub 上搜 "U2-Net" 或 "rembg" 就能找到,rembg 是个封装好的 Python 库,几行代码就能用。
SAM(Segment Anything Model)是 Meta 2023 年开源的,抠图精度直接拉满。你点一下图里的任意物体,它就给你精确抠出来。缺点是对显存要求高一点,8G 起步。但你要是做产品图、需要批量抠图,Segment Anything 的 GitHub 仓库值得折腾一下。
不想自己折腾环境的话,可以看看免费AI修图工具排名,里面有几款在线抠图也很能打。
画质超分:Real-ESRGAN 是真神
把小图变清晰,Real-ESRGAN 在 GitHub 上 3 万多次 star,几乎是超分领域的标配。
根据 GitHub 官方数据,Real-ESRGAN 项目已有超过 3 万星标,社区活跃度很高。我拿一堆糊掉的老照片试过,放大 2 倍、4 倍都能保持纹理自然,不会出现那种 AI 惯有的塑料感涂抹。动漫图、真人照都适配,还有专门的人脸增强版本。
部署也很简单,有官方预编译的 Windows 可执行文件,下下来就能用,不一定要会 Python。电商主图、旧照片修复、视频截图放大——这个工具救命。
人脸修复:GFPGAN 和 CodeFormer
人脸模糊、有噪点、老照片褪色,GFPGAN 和 CodeFormer 都能救,而且都是开源、可本地跑的。
GFPGAN 专注人脸修复,针对低分辨率、模糊的人脸做增强,效果非常自然。很多 Stable Diffusion 的 WebUI 都把 GFPGAN 集成进去了,说明社区认可度够高。CodeFormer 是另一条路线,除了修复还能做轻微美颜,可控性更强。
两个项目都能在Stable Diffusion WebUI 里一键安装插件,不用单独配环境。如果你已经在用 SD 画图,顺便把这两个装上,修人像照片会顺手很多。
全能编辑:Stable Diffusion 全家桶
想玩风格转换、局部重绘、换背景换衣服,Stable Diffusion 系的项目是 GitHub 上最强的通用方案。
Stable Diffusion 不用多介绍了,72k+ star 的顶流项目。配合 ControlNet、Inpaint 这些扩展,你可以做到:圈一块区域告诉 AI「把这里换成蓝天」、上传参考图做风格迁移、甚至用文字描述整张图怎么改。功能上已经接近 Midjourney 那种「你说我改」的体验,区别是全部跑在你自己的机器上。
门槛主要在显存——至少 6G 起步,8G 以上比较舒服。但一旦搭好,你就没有「本月额度已用完」这种烦恼了。想系统了解各类工具可以看我们的AI修图软件选购指南,开源和商业工具都覆盖了。
自部署到底值不值得搞?
适合自部署的人:有显卡、在意隐私、用量大或者想完全零月费。否则在线工具更省心。
我自己的判断:你要是偶尔修几张图发朋友圈,在线AI修图工具够用了,不用折腾。但如果你做电商、做自媒体,每天要处理几十上百张图,或者修的图涉及商业机密、隐私,自己搭一套开源方案就很划算。一次性搞定环境,后面就是电费的问题。
另外开源项目的另一个好处是:你可以魔改。比如把 Real-ESRGAN 接到自己的工作流里做批量处理,或者训练自己的 LoRA 做特定风格。在线工具做不到这种自由度。
快速上手建议
新手先从 rembg(抠图)或 Real-ESRGAN 的可执行版开始,不写代码也能用;有经验的直接上 Stable Diffusion WebUI 一站式搞定。
rembg 安装就一条命令:pip install rembg,然后写个几行 Python 就能批量抠图。Real-ESRGAN 官网有 Windows 的 .exe 包,解压即用。这两个门槛最低。
想玩大的就装 Stable Diffusion WebUI(AUTOMATIC1111 版或 ComfyUI 都行),装好之后在扩展商店搜 GFPGAN、Real-ESRGAN、ControlNet,一键安装。一套环境下来,抠图、超分、人脸修复、风格转换全有了。更多玩法可以翻AI修图入门指南和各家AI修图工具横评。
说两句
GitHub 上的 AI 修图开源生态这几年发展挺快,很多以前只有大厂才有的能力,现在普通人也能自己部署。缺点就是要花点时间学,但学会之后真的香——数据在自己手里、不用看厂商脸色、想怎么改就怎么改。
如果你身边也有在找自部署修图方案的朋友,把这篇转给 ta 呗。少走弯路,少踩坑,FlowPix 写工具清单就是干这个的。