最新项目

DragGAN

一款新型的图像编辑工具,以其直观的操作方式和强大的图像变形功能,为用户提供了一个高效、灵活的图像编辑解决方案。

XingangPan 自定义

DemoFusion

一款开源AI图像重绘增强工具。它利用最新的BSR GAN技术显著提升图像分辨率,最高可达原始图像的16倍,同时优化图像细节。

PRIS-CV 自定义

LangChain

LangChain是一个由大语言模型 (LLM) 驱动的应用程序开发框架。对于AI类型应用程序,LangChain 简化了整个应用程序生命周期。

langchain-ai MIT license

DreaMoving

一个先进的基于扩散的可控视频生成框架,专门设计用于生成高质量的定制人类舞蹈视频。该框架结合了运动控制和身份保留技术,能够根据目标身份和姿势序列生成相应的舞蹈视频。

dreamoving Apache-2.0 license

ComfyUI Portrait Master

一款功能强大的人像生成工具,它提供了详尽的参数设置,使用户能够轻松创建个性化的人像作品。

ZHO-ZHO-ZHO GPL-3.0 license

DreamTalk

由清华大学、阿里巴巴集团和华中科技大学共同开发的人工智能框架,它利用扩散模型技术,让静态人物照片能够根据音频输入生成动态、逼真的说话表情和嘴唇动作。该框架支持多样化的语言、歌曲和嘈杂环境下的音频

ali-vilab MIT license

Audio2Photoreal

能够根据音频输入生成逼真的全身虚拟人物形象。

facebookresearch 自定义

Make-A-Character

一款创新的3D数字人生成工具,用户可以自定义面部特征,包括脸型、眼睛颜色、发型等,并生成包含人头、人体、配饰和服装的完整模型。

Human3DAIGC 自定义

EmotiVoice

一款功能强大的开源文本到语音(TTS)引擎,该引擎的特色在于其情感合成功能,能够合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,为用户提供丰富的声音体验

netease-youdao Apache-2.0 license

TryOnDiffusion

一种创新的虚拟试衣技术,基于两个UNet的扩散架构,能够生成人物穿上不同服装的可视化效果图。这项技术在保留服装细节的同时,能够适应人体的姿势和形状变化,提供了一种高质量、逼真的试穿图像生成解决方案。

fashn-AI MIT license

EmojiGen

一个创新的开源表情符号生成器,它利用先进的AI技术,根据用户的文本描述生成个性化的表情符号。

cbh123 自定义

AIdea

一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具

mylxsw MIT license

热门推荐

机器学习

应用集成

localGPT

LocalGPT是一项开源计划,它允许用户与文档进行交流而不会泄露隐私。由于一切都在本地运行,可以放心,没有任何数据会离开用户的计算机。使用 LocalGPT 深入了解安全的AI本地文档交互世界。

PromtEngineer Apache-2.0 license

CrewAI

提供开源工具、预建模型,并允许用户创建自定义代理,以满足不同团队的需求。它支持整合人类输入以辅助复杂决策过程,并设计用于生产环境,使用户能够编排智能体团队来简化任务。

crewaiinc MIT license

XHS-Downloader

一款专为小红书平台设计的工具,它能够提取和下载小红书账号发布的作品、收藏、点赞内容,以及搜索结果中的用户和作品链接。

JoeanAmier GPL-3.0 license

Perplexica

一个创新的开源AI搜索引擎,它通过集成多种搜索模式和先进的机器学习技术,为用户提供精准且智能的搜索体验。

ItzCrazyKns MIT license

Open WebUI

该平台具备直观的聊天界面、响应式设计,并集成了多种高级功能,如代码高亮、Markdown与LaTeX支持、RAG集成、网页浏览、预设提示、RLHF注释、模型管理等,旨在增强用户体验并提供高效的对话管理

open-webui MIT license

LibreChat

一个免费开源的AI聊天平台,集成了多种AI模型,包括ChatGPT、OpenAI、BingAI、PaLM 2等,提供多功能聊天界面和丰富的定制选项。

danny-avila MIT license

QAnything AI

一个本地知识库问答系统,支持多种文件格式和数据库,允许用户在离线状态下安装和使用。

netease-youdao AGPL-3.0 license

Jan

作为ChatGPT的替代品,提供本地API服务器,允许用户在自己的计算机上运行AI服务。它是一个本地优先、AI原生的跨平台框架,支持开发人员构建和自定义各种应用。

janhq AGPL-3.0 license

GeeKAI

一个基于AI大语言模型API的开源AI助手解决方案,具备完整的运营管理后台,实现开箱即用

yangjian102621 Apache-2.0 license

Documate

一款开源的AI工具,专门设计用于站内文档问答,能够将AI聊天对话框无缝嵌入到网站中。

aircodelabs MPL-2.0 license

AIdea

一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具

mylxsw MIT license

查看更多

计算机视觉

开发辅助

辅助创作

TryOnDiffusion

一种创新的虚拟试衣技术,基于两个UNet的扩散架构,能够生成人物穿上不同服装的可视化效果图。这项技术在保留服装细节的同时,能够适应人体的姿势和形状变化,提供了一种高质量、逼真的试穿图像生成解决方案。

fashn-AI MIT license

IDM-VTON

一种先进的虚拟试穿技术,它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像,并允许通过定制来提高图像的一致性和真实性。

yisol 自定义

InstantMesh

一款能够将2D图片快速转换成3D模型的工具,它基于先进的稀疏视图大型重建模型(LRM)架构,实现了高效的3D网格生成。

TencentARC Apache-2.0 license

OOTDiffusion

工具能够根据不同性别和体型自动调整服装,确保与模特的贴合度,同时用户也可以根据个人需求和偏好调整试穿效果。

levihsu 自定义

AI Cover 红包封面生成器

一款AI驱动的红包封面生成器,它能够根据用户的需求创造出独特、高清、精美的微信红包封面图片,特别适用于庆祝农历新年。除了核心的AI生成功能,AI Cover还提供用户登录、付费方案、积分系统等服务

all-in-aigc Apache-2.0 license

Motionshop

一款AI角色动画工具,它利用先进的视频处理技术和3D渲染技术,能够自动检测视频中的人物,并将其替换为3D卡通角色模型,快速生成有趣的AI视频。

aigc3d 自定义

M2UGen

一款创新的多模态音乐生成框架,专为音乐艺术创作者设计,该框架结合了音乐理解与多模态音乐生成任务,使用户能够通过文本、图像、视频和音频等多种输入方式生成音乐,并进行音乐编辑。

shansongliu MIT license

VideoSrt

一款开源软件工具,专门设计用于自动识别视频中的语音并生成SRT格式的字幕文件。

wxbool GPL-2.0 license

EmojiGen

一个创新的开源表情符号生成器,它利用先进的AI技术,根据用户的文本描述生成个性化的表情符号。

cbh123 自定义

查看更多

视频处理

MoneyPrinter

专为YouTube短视频创作和发布设计。它通过简单的文本输入,快速生成与主题相关的YouTube Shorts视频,为用户提供了一个高效、自动化的赚钱项目。

FujiwaraChoki MIT license

ProPainter

一款高效的AI视频编辑工具,专注于提供一键移除视频中移动物体和水印的功能。

sczhou 自定义

微软VASA-1

能够将单张肖像照片和语音音频实时转换成超现实的说话脸部视频。这项技术以其精确的唇音同步、逼真的面部行为和自然的头部动作,实现了静态图像到动态视频的无缝转换。

AniPortrait

通过音频驱动的动画合成、用户友好的操作界面、三维数据转换以及高品质动画生成等核心功能,广泛应用于视频配音、人脸动画创作、表情包制作以及面部再现和动画生成等多个领域。

Zejun-Yang Apache-2.0 license

SoraWebui

为用户带来了从创意到视频的快速转化,同时为开发者提供了一个探索和实现先进AI视频生成技术的途径。

SoraWebui Apache-2.0 license

StreamRAG

一个强大的视频搜索和流媒体代理工具,为用户提供了一种全新的视频内容管理和互动方式,无论是个人娱乐、教育学习还是企业培训,都能提供高效的视频处理和搜索解决方案。

video-db MIT license

VideoDrafter

利用开放式扩散模型,能够在保持主体不变的基础上,一次性生成多个场景的视频。

AILab-CVC 自定义

LiveSketch

一款AI驱动的视频生成工具,它允许用户通过文本提示将静态素描转化为动画。

yael-vinker Apache-2.0 license

MagicAvatar

一套视频剪辑方法,它基于多模态框架,允许用户通过文本、视频和音频等多种输入方式生成和动画化虚拟人物。

magic-research BSD-3-Clause license

DeepFaceLive

一款免费开源的AI换脸工具,它利用深度学习算法实现实时视频换脸功能。

iperov GPL-3.0 license

查看更多

图形图像

stable-diffusion

stable diffusion是一种潜在的文本到图像的扩散模型。能够在LAION-5B数据库子集的512x512图像上训练潜在扩散模型。

CompVis 自定义

LucidDreamer

一个创新的无域3D场景生成管道,该系统通过做梦和对齐两个交替步骤,从点云生成多视图一致的图像,并将其聚合成3D场景,提供了一种新颖的方法来创建高详细度、无领域限制的3D场景。

luciddreamer-cvlab 自定义

Waifu2x

一个开源的图像处理工具,专门使用深度卷积神经网络技术来实现图片的无损放大,尤其适合二次元图片。

nagadomi MIT license

InvokeAI

一个开源的创意引擎,专为使用Stable Diffusion模型生成高质量图像而设计。它提供了简化的图像生成流程,支持文本到图像和图像到图像的转换,并具备图像处理功能,如修复、扩展、放大等。

invoke-ai Apache-2.0

ShareX

一款免费、开源的高级截图和屏幕录制工具,专为Windows系统设计。它提供了全面的截图、屏幕录制、自动水印添加等功能,无广告,轻量级,是高效率用户的理想选择。

ShareX GPL-3.0 license

CustomNet

一款创新的图像生成技术,专注于将指定物品的图片融合到新生成的图片中,确保原物品的样式和纹理细节得到精确还原。

TencentARC Apache-2.0 license

AnimateDiff

一款强大的AI插件,能够将个性化的文本到图像(Text-to-Image,T2I)模型转化为动画生成器,无需特定调整即可实现动画效果。

guoyww Apache-2.0 license

DragGAN

一款新型的图像编辑工具,以其直观的操作方式和强大的图像变形功能,为用户提供了一个高效、灵活的图像编辑解决方案。

XingangPan 自定义

StoryDiffusion

一款创新的AI工具,通过其一致性自注意力技术,不仅提升了图像和视频生成的连贯性和一致性,还拓展了其在不同领域的应用潜力。

HVision-NKU Apache-2.0 license

HiDiffusion

一种创新扩散模型,它显著提升了图像生成的速度和质量。

megvii-research Apache-2.0 license

Animagine XL 3.1

一个先进的开源文本到图像动漫模型,它通过整合新的数据集,显著提升了对动漫作品和风格的广泛理解,包括经典和最新作品,以及从古老到现代的艺术风格。

查看更多

语音处理

数字人

Make-A-Character

一款创新的3D数字人生成工具,用户可以自定义面部特征,包括脸型、眼睛颜色、发型等,并生成包含人头、人体、配饰和服装的完整模型。

Human3DAIGC 自定义

Audio2Photoreal

能够根据音频输入生成逼真的全身虚拟人物形象。

facebookresearch 自定义

DreamTalk

由清华大学、阿里巴巴集团和华中科技大学共同开发的人工智能框架,它利用扩散模型技术,让静态人物照片能够根据音频输入生成动态、逼真的说话表情和嘴唇动作。该框架支持多样化的语言、歌曲和嘈杂环境下的音频

ali-vilab MIT license

ComfyUI Portrait Master

一款功能强大的人像生成工具,它提供了详尽的参数设置,使用户能够轻松创建个性化的人像作品。

ZHO-ZHO-ZHO GPL-3.0 license

DreaMoving

一个先进的基于扩散的可控视频生成框架,专门设计用于生成高质量的定制人类舞蹈视频。该框架结合了运动控制和身份保留技术,能够根据目标身份和姿势序列生成相应的舞蹈视频。

dreamoving Apache-2.0 license

EasyPhoto

一款基于Webui的UI插件,专门设计用于生成AI肖像画,并训练与用户相关的数字化替身。

aigc-apps Apache-2.0 license

AI Companion App

一款创新的应用程序,它允许用户创建和训练一个个性化的AI伴侣或女朋友。

a16z-infra MIT license

FaceChain

一个开源的AI模型项目,专注于利用深度学习技术打造个性化的人物写真和数字形象。

modelscope Apache-2.0 license

查看更多