图形图像
DragGAN
一款新型的图像编辑工具,以其直观的操作方式和强大的图像变形功能,为用户提供了一个高效、灵活的图像编辑解决方案。
XingangPan 自定义
DemoFusion
一款开源AI图像重绘增强工具。它利用最新的BSR GAN技术显著提升图像分辨率,最高可达原始图像的16倍,同时优化图像细节。
PRIS-CV 自定义
IP-Adapter-FaceID
一款先进的AI图像生成模型,它通过面部识别技术捕捉特定人物的面部特征,并结合文本描述生成个性化图像。
tencent-ailab Apache-2.0 license
InvokeAI
一个开源的创意引擎,专为使用Stable Diffusion模型生成高质量图像而设计。它提供了简化的图像生成流程,支持文本到图像和图像到图像的转换,并具备图像处理功能,如修复、扩展、放大等。
invoke-ai Apache-2.0
CustomNet
一款创新的图像生成技术,专注于将指定物品的图片融合到新生成的图片中,确保原物品的样式和纹理细节得到精确还原。
TencentARC Apache-2.0 license
LucidDreamer
一个创新的无域3D场景生成管道,该系统通过做梦和对齐两个交替步骤,从点云生成多视图一致的图像,并将其聚合成3D场景,提供了一种新颖的方法来创建高详细度、无领域限制的3D场景。
luciddreamer-cvlab 自定义
Waifu2x
一个开源的图像处理工具,专门使用深度卷积神经网络技术来实现图片的无损放大,尤其适合二次元图片。
nagadomi MIT license
ShareX
一款免费、开源的高级截图和屏幕录制工具,专为Windows系统设计。它提供了全面的截图、屏幕录制、自动水印添加等功能,无广告,轻量级,是高效率用户的理想选择。
ShareX GPL-3.0 license
AnimateDiff
一款强大的AI插件,能够将个性化的文本到图像(Text-to-Image,T2I)模型转化为动画生成器,无需特定调整即可实现动画效果。
guoyww Apache-2.0 license
StoryDiffusion
一款创新的AI工具,通过其一致性自注意力技术,不仅提升了图像和视频生成的连贯性和一致性,还拓展了其在不同领域的应用潜力。
HVision-NKU Apache-2.0 license
HiDiffusion
一种创新扩散模型,它显著提升了图像生成的速度和质量。
megvii-research Apache-2.0 license
YOLO-World
实时目标检测工具,以其卓越的速度和准确性在目标检测领域占据领先地位。作为YOLO系列的下一代检测器,YOLO-World专注于实时开放词汇目标检测,能够自动识别和定位图像中的各种对象。
AILAB-CVC GPL-3.0 license
DiffusionGPT
一款文本到图像的多合一系统,它利用大型语言模型(LLM)来解析输入提示,并确定最优的图像生成模型,以产生高质量的图像输出。
DiffusionGPT Apache-2.0 license
PhotoMaker
根据用户提供的多张照片作为身份ID,捕捉人物的特征,并结合描述生成符合要求的新个性化人物图像。
TencentARC 自定义
DDColor图像上色
一款图像上色算法,它通过革命性的双解码器技术,为黑白图像提供自然而生动的上色效果。
piddnad Apache-2.0 license
Personalized Restoration
一项先进的面部图像恢复和编辑技术,专门设计用于精确复原受损或模糊的面部图像,同时捕捉和重现个人独特的面部特征。
nerfies 自定义
Zero123
专注于视图条件图像生成,通过三项关键创新,实现了与之前版本Zero123-XL相比的显著改进
cvlab-columbia MIT license
HandRefiner
一款专注于解决AI图像生成中手部畸形问题的工具。它通过先进的条件修补方法,能够在不改变图像其他部分的前提下,精确地识别和修正手部图像中的畸形。
wenquanlu MIT license
stable-diffusion
stable diffusion是一种潜在的文本到图像的扩散模型。能够在LAION-5B数据库子集的512x512图像上训练潜在扩散模型。
CompVis 自定义
Animagine XL 3.1
一个先进的开源文本到图像动漫模型,它通过整合新的数据集,显著提升了对动漫作品和风格的广泛理解,包括经典和最新作品,以及从古老到现代的艺术风格。