图形图像 - AI之家

DragGAN

一款新型的图像编辑工具，以其直观的操作方式和强大的图像变形功能，为用户提供了一个高效、灵活的图像编辑解决方案。

XingangPan 自定义

DemoFusion

一款开源AI图像重绘增强工具。它利用最新的BSR GAN技术显著提升图像分辨率，最高可达原始图像的16倍，同时优化图像细节。

PRIS-CV 自定义

IP-Adapter-FaceID

一款先进的AI图像生成模型，它通过面部识别技术捕捉特定人物的面部特征，并结合文本描述生成个性化图像。

tencent-ailab Apache-2.0 license

InvokeAI

一个开源的创意引擎，专为使用Stable Diffusion模型生成高质量图像而设计。它提供了简化的图像生成流程，支持文本到图像和图像到图像的转换，并具备图像处理功能，如修复、扩展、放大等。

invoke-ai Apache-2.0

CustomNet

一款创新的图像生成技术，专注于将指定物品的图片融合到新生成的图片中，确保原物品的样式和纹理细节得到精确还原。

TencentARC Apache-2.0 license

LucidDreamer

一个创新的无域3D场景生成管道，该系统通过做梦和对齐两个交替步骤，从点云生成多视图一致的图像，并将其聚合成3D场景，提供了一种新颖的方法来创建高详细度、无领域限制的3D场景。

luciddreamer-cvlab 自定义

Waifu2x

一个开源的图像处理工具，专门使用深度卷积神经网络技术来实现图片的无损放大，尤其适合二次元图片。

nagadomi MIT license

ShareX

一款免费、开源的高级截图和屏幕录制工具，专为Windows系统设计。它提供了全面的截图、屏幕录制、自动水印添加等功能，无广告，轻量级，是高效率用户的理想选择。

ShareX GPL-3.0 license

AnimateDiff

一款强大的AI插件，能够将个性化的文本到图像（Text-to-Image，T2I）模型转化为动画生成器，无需特定调整即可实现动画效果。

guoyww Apache-2.0 license

StoryDiffusion

一款创新的AI工具，通过其一致性自注意力技术，不仅提升了图像和视频生成的连贯性和一致性，还拓展了其在不同领域的应用潜力。

HVision-NKU Apache-2.0 license

HiDiffusion

一种创新扩散模型，它显著提升了图像生成的速度和质量。

megvii-research Apache-2.0 license

YOLO-World

实时目标检测工具，以其卓越的速度和准确性在目标检测领域占据领先地位。作为YOLO系列的下一代检测器，YOLO-World专注于实时开放词汇目标检测，能够自动识别和定位图像中的各种对象。

AILAB-CVC GPL-3.0 license

DiffusionGPT

一款文本到图像的多合一系统，它利用大型语言模型（LLM）来解析输入提示，并确定最优的图像生成模型，以产生高质量的图像输出。

DiffusionGPT Apache-2.0 license

PhotoMaker

根据用户提供的多张照片作为身份ID，捕捉人物的特征，并结合描述生成符合要求的新个性化人物图像。

TencentARC 自定义

DDColor图像上色

一款图像上色算法，它通过革命性的双解码器技术，为黑白图像提供自然而生动的上色效果。

piddnad Apache-2.0 license

Personalized Restoration

一项先进的面部图像恢复和编辑技术，专门设计用于精确复原受损或模糊的面部图像，同时捕捉和重现个人独特的面部特征。

nerfies 自定义

Zero123

专注于视图条件图像生成，通过三项关键创新，实现了与之前版本Zero123-XL相比的显著改进

cvlab-columbia MIT license

HandRefiner

一款专注于解决AI图像生成中手部畸形问题的工具。它通过先进的条件修补方法，能够在不改变图像其他部分的前提下，精确地识别和修正手部图像中的畸形。

wenquanlu MIT license

stable-diffusion

stable diffusion是一种潜在的文本到图像的扩散模型。能够在LAION-5B数据库子集的512x512图像上训练潜在扩散模型。

CompVis 自定义

Animagine XL 3.1

一个先进的开源文本到图像动漫模型，它通过整合新的数据集，显著提升了对动漫作品和风格的广泛理解，包括经典和最新作品，以及从古老到现代的艺术风格。