最新项目
DragGAN
一款新型的图像编辑工具,以其直观的操作方式和强大的图像变形功能,为用户提供了一个高效、灵活的图像编辑解决方案。
XingangPan 自定义
DemoFusion
一款开源AI图像重绘增强工具。它利用最新的BSR GAN技术显著提升图像分辨率,最高可达原始图像的16倍,同时优化图像细节。
PRIS-CV 自定义
LangChain
LangChain是一个由大语言模型 (LLM) 驱动的应用程序开发框架。对于AI类型应用程序,LangChain 简化了整个应用程序生命周期。
langchain-ai MIT license
DreaMoving
一个先进的基于扩散的可控视频生成框架,专门设计用于生成高质量的定制人类舞蹈视频。该框架结合了运动控制和身份保留技术,能够根据目标身份和姿势序列生成相应的舞蹈视频。
dreamoving Apache-2.0 license
ComfyUI Portrait Master
一款功能强大的人像生成工具,它提供了详尽的参数设置,使用户能够轻松创建个性化的人像作品。
ZHO-ZHO-ZHO GPL-3.0 license
DreamTalk
由清华大学、阿里巴巴集团和华中科技大学共同开发的人工智能框架,它利用扩散模型技术,让静态人物照片能够根据音频输入生成动态、逼真的说话表情和嘴唇动作。该框架支持多样化的语言、歌曲和嘈杂环境下的音频
ali-vilab MIT license
Audio2Photoreal
能够根据音频输入生成逼真的全身虚拟人物形象。
facebookresearch 自定义
Make-A-Character
一款创新的3D数字人生成工具,用户可以自定义面部特征,包括脸型、眼睛颜色、发型等,并生成包含人头、人体、配饰和服装的完整模型。
Human3DAIGC 自定义
EmotiVoice
一款功能强大的开源文本到语音(TTS)引擎,该引擎的特色在于其情感合成功能,能够合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,为用户提供丰富的声音体验
netease-youdao Apache-2.0 license
TryOnDiffusion
一种创新的虚拟试衣技术,基于两个UNet的扩散架构,能够生成人物穿上不同服装的可视化效果图。这项技术在保留服装细节的同时,能够适应人体的姿势和形状变化,提供了一种高质量、逼真的试穿图像生成解决方案。
fashn-AI MIT license
EmojiGen
一个创新的开源表情符号生成器,它利用先进的AI技术,根据用户的文本描述生成个性化的表情符号。
cbh123 自定义
AIdea
一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具
mylxsw MIT license
热门推荐
机器学习
应用集成
localGPT
LocalGPT是一项开源计划,它允许用户与文档进行交流而不会泄露隐私。由于一切都在本地运行,可以放心,没有任何数据会离开用户的计算机。使用 LocalGPT 深入了解安全的AI本地文档交互世界。
PromtEngineer Apache-2.0 license
CrewAI
提供开源工具、预建模型,并允许用户创建自定义代理,以满足不同团队的需求。它支持整合人类输入以辅助复杂决策过程,并设计用于生产环境,使用户能够编排智能体团队来简化任务。
crewaiinc MIT license
XHS-Downloader
一款专为小红书平台设计的工具,它能够提取和下载小红书账号发布的作品、收藏、点赞内容,以及搜索结果中的用户和作品链接。
JoeanAmier GPL-3.0 license
Perplexica
一个创新的开源AI搜索引擎,它通过集成多种搜索模式和先进的机器学习技术,为用户提供精准且智能的搜索体验。
ItzCrazyKns MIT license
Open WebUI
该平台具备直观的聊天界面、响应式设计,并集成了多种高级功能,如代码高亮、Markdown与LaTeX支持、RAG集成、网页浏览、预设提示、RLHF注释、模型管理等,旨在增强用户体验并提供高效的对话管理
open-webui MIT license
LibreChat
一个免费开源的AI聊天平台,集成了多种AI模型,包括ChatGPT、OpenAI、BingAI、PaLM 2等,提供多功能聊天界面和丰富的定制选项。
danny-avila MIT license
QAnything AI
一个本地知识库问答系统,支持多种文件格式和数据库,允许用户在离线状态下安装和使用。
netease-youdao AGPL-3.0 license
Jan
作为ChatGPT的替代品,提供本地API服务器,允许用户在自己的计算机上运行AI服务。它是一个本地优先、AI原生的跨平台框架,支持开发人员构建和自定义各种应用。
janhq AGPL-3.0 license
GeeKAI
一个基于AI大语言模型API的开源AI助手解决方案,具备完整的运营管理后台,实现开箱即用
yangjian102621 Apache-2.0 license
Documate
一款开源的AI工具,专门设计用于站内文档问答,能够将AI聊天对话框无缝嵌入到网站中。
aircodelabs MPL-2.0 license
AIdea
一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具
mylxsw MIT license
计算机视觉
开发辅助
LangChain
LangChain是一个由大语言模型 (LLM) 驱动的应用程序开发框架。对于AI类型应用程序,LangChain 简化了整个应用程序生命周期。
langchain-ai MIT license
Vanna.AI
一款创新的人工智能工具,旨在简化用户与SQL数据库的交互过程。通过自然语言处理技术,Vanna.ai 允许用户以日常对话的方式提出问题,并自动将这些对话转换为SQL查询语句,从而实现对数据库的高效查询
vanna-ai MIT license
DuckDB-NSQL
一个强大的数据库交互工具,为用户带来了前所未有的便利性,无论是数据库专家还是初学者,都能够通过自然语言与数据库进行高效的沟通和操作
NumbersStationAI Apache-2.0 license
Notebook Copilot
一款旨在简化开发笔记本流程的智能工具,它通过自动生成代码和Markdown单元格来提高用户的工作效率。
talperetz MIT license
TextBase
一款专为AI聊天机器人开发设计的简单框架,帮助开发人员快速搭建和优化聊天机器人。
cofactoryai 自定义
辅助创作
TryOnDiffusion
一种创新的虚拟试衣技术,基于两个UNet的扩散架构,能够生成人物穿上不同服装的可视化效果图。这项技术在保留服装细节的同时,能够适应人体的姿势和形状变化,提供了一种高质量、逼真的试穿图像生成解决方案。
fashn-AI MIT license
IDM-VTON
一种先进的虚拟试穿技术,它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像,并允许通过定制来提高图像的一致性和真实性。
yisol 自定义
InstantMesh
一款能够将2D图片快速转换成3D模型的工具,它基于先进的稀疏视图大型重建模型(LRM)架构,实现了高效的3D网格生成。
TencentARC Apache-2.0 license
OOTDiffusion
工具能够根据不同性别和体型自动调整服装,确保与模特的贴合度,同时用户也可以根据个人需求和偏好调整试穿效果。
levihsu 自定义
AI Cover 红包封面生成器
一款AI驱动的红包封面生成器,它能够根据用户的需求创造出独特、高清、精美的微信红包封面图片,特别适用于庆祝农历新年。除了核心的AI生成功能,AI Cover还提供用户登录、付费方案、积分系统等服务
all-in-aigc Apache-2.0 license
Motionshop
一款AI角色动画工具,它利用先进的视频处理技术和3D渲染技术,能够自动检测视频中的人物,并将其替换为3D卡通角色模型,快速生成有趣的AI视频。
aigc3d 自定义
M2UGen
一款创新的多模态音乐生成框架,专为音乐艺术创作者设计,该框架结合了音乐理解与多模态音乐生成任务,使用户能够通过文本、图像、视频和音频等多种输入方式生成音乐,并进行音乐编辑。
shansongliu MIT license
VideoSrt
一款开源软件工具,专门设计用于自动识别视频中的语音并生成SRT格式的字幕文件。
wxbool GPL-2.0 license
EmojiGen
一个创新的开源表情符号生成器,它利用先进的AI技术,根据用户的文本描述生成个性化的表情符号。
cbh123 自定义
视频处理
MoneyPrinter
专为YouTube短视频创作和发布设计。它通过简单的文本输入,快速生成与主题相关的YouTube Shorts视频,为用户提供了一个高效、自动化的赚钱项目。
FujiwaraChoki MIT license
ProPainter
一款高效的AI视频编辑工具,专注于提供一键移除视频中移动物体和水印的功能。
sczhou 自定义
微软VASA-1
能够将单张肖像照片和语音音频实时转换成超现实的说话脸部视频。这项技术以其精确的唇音同步、逼真的面部行为和自然的头部动作,实现了静态图像到动态视频的无缝转换。
AniPortrait
通过音频驱动的动画合成、用户友好的操作界面、三维数据转换以及高品质动画生成等核心功能,广泛应用于视频配音、人脸动画创作、表情包制作以及面部再现和动画生成等多个领域。
Zejun-Yang Apache-2.0 license
SoraWebui
为用户带来了从创意到视频的快速转化,同时为开发者提供了一个探索和实现先进AI视频生成技术的途径。
SoraWebui Apache-2.0 license
StreamRAG
一个强大的视频搜索和流媒体代理工具,为用户提供了一种全新的视频内容管理和互动方式,无论是个人娱乐、教育学习还是企业培训,都能提供高效的视频处理和搜索解决方案。
video-db MIT license
VideoDrafter
利用开放式扩散模型,能够在保持主体不变的基础上,一次性生成多个场景的视频。
AILab-CVC 自定义
LiveSketch
一款AI驱动的视频生成工具,它允许用户通过文本提示将静态素描转化为动画。
yael-vinker Apache-2.0 license
MagicAvatar
一套视频剪辑方法,它基于多模态框架,允许用户通过文本、视频和音频等多种输入方式生成和动画化虚拟人物。
magic-research BSD-3-Clause license
DeepFaceLive
一款免费开源的AI换脸工具,它利用深度学习算法实现实时视频换脸功能。
iperov GPL-3.0 license
图形图像
stable-diffusion
stable diffusion是一种潜在的文本到图像的扩散模型。能够在LAION-5B数据库子集的512x512图像上训练潜在扩散模型。
CompVis 自定义
LucidDreamer
一个创新的无域3D场景生成管道,该系统通过做梦和对齐两个交替步骤,从点云生成多视图一致的图像,并将其聚合成3D场景,提供了一种新颖的方法来创建高详细度、无领域限制的3D场景。
luciddreamer-cvlab 自定义
Waifu2x
一个开源的图像处理工具,专门使用深度卷积神经网络技术来实现图片的无损放大,尤其适合二次元图片。
nagadomi MIT license
InvokeAI
一个开源的创意引擎,专为使用Stable Diffusion模型生成高质量图像而设计。它提供了简化的图像生成流程,支持文本到图像和图像到图像的转换,并具备图像处理功能,如修复、扩展、放大等。
invoke-ai Apache-2.0
ShareX
一款免费、开源的高级截图和屏幕录制工具,专为Windows系统设计。它提供了全面的截图、屏幕录制、自动水印添加等功能,无广告,轻量级,是高效率用户的理想选择。
ShareX GPL-3.0 license
CustomNet
一款创新的图像生成技术,专注于将指定物品的图片融合到新生成的图片中,确保原物品的样式和纹理细节得到精确还原。
TencentARC Apache-2.0 license
AnimateDiff
一款强大的AI插件,能够将个性化的文本到图像(Text-to-Image,T2I)模型转化为动画生成器,无需特定调整即可实现动画效果。
guoyww Apache-2.0 license
DragGAN
一款新型的图像编辑工具,以其直观的操作方式和强大的图像变形功能,为用户提供了一个高效、灵活的图像编辑解决方案。
XingangPan 自定义
StoryDiffusion
一款创新的AI工具,通过其一致性自注意力技术,不仅提升了图像和视频生成的连贯性和一致性,还拓展了其在不同领域的应用潜力。
HVision-NKU Apache-2.0 license
HiDiffusion
一种创新扩散模型,它显著提升了图像生成的速度和质量。
megvii-research Apache-2.0 license
Animagine XL 3.1
一个先进的开源文本到图像动漫模型,它通过整合新的数据集,显著提升了对动漫作品和风格的广泛理解,包括经典和最新作品,以及从古老到现代的艺术风格。
语音处理
TTS-Vue
一款集成了微软语音合成技术的开源免费工具,它基于Electron、Vue、ElementPlus和Vite框架构建,专门用于将文本转换为语音。
LokerL MIT license
notesGPT
一款创新的语音笔记工具,它能够录制用户的语音内容,并自动将这些语音转换成文字。
nutlope MIT license
WhisperFusion
一个创新的语音交互系统,为需要快速、准确对话处理的场合提供了强大的技术支持,无论是在客户服务还是其他需要实时语音识别和响应的领域,都能发挥重要作用。
collabora 自定义
EmotiVoice
一款功能强大的开源文本到语音(TTS)引擎,该引擎的特色在于其情感合成功能,能够合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,为用户提供丰富的声音体验
netease-youdao Apache-2.0 license
Whisper
一款先进的开源音频转文字语音识别模型。它通过在多样化音频数据集上的训练,实现了多语言的语音识别、翻译和语言检测功能。
openai MIT license
数字人
Make-A-Character
一款创新的3D数字人生成工具,用户可以自定义面部特征,包括脸型、眼睛颜色、发型等,并生成包含人头、人体、配饰和服装的完整模型。
Human3DAIGC 自定义
Audio2Photoreal
能够根据音频输入生成逼真的全身虚拟人物形象。
facebookresearch 自定义
DreamTalk
由清华大学、阿里巴巴集团和华中科技大学共同开发的人工智能框架,它利用扩散模型技术,让静态人物照片能够根据音频输入生成动态、逼真的说话表情和嘴唇动作。该框架支持多样化的语言、歌曲和嘈杂环境下的音频
ali-vilab MIT license
ComfyUI Portrait Master
一款功能强大的人像生成工具,它提供了详尽的参数设置,使用户能够轻松创建个性化的人像作品。
ZHO-ZHO-ZHO GPL-3.0 license
DreaMoving
一个先进的基于扩散的可控视频生成框架,专门设计用于生成高质量的定制人类舞蹈视频。该框架结合了运动控制和身份保留技术,能够根据目标身份和姿势序列生成相应的舞蹈视频。
dreamoving Apache-2.0 license
EasyPhoto
一款基于Webui的UI插件,专门设计用于生成AI肖像画,并训练与用户相关的数字化替身。
aigc-apps Apache-2.0 license
AI Companion App
一款创新的应用程序,它允许用户创建和训练一个个性化的AI伴侣或女朋友。
a16z-infra MIT license
FaceChain
一个开源的AI模型项目,专注于利用深度学习技术打造个性化的人物写真和数字形象。
modelscope Apache-2.0 license