最新项目

DragGAN

一款新型的图像编辑工具,以其直观的操作方式和强大的图像变形功能,为用户提供了一个高效、灵活的图像编辑解决方案。

XingangPan 自定义

DemoFusion

一款开源AI图像重绘增强工具。它利用最新的BSR GAN技术显著提升图像分辨率,最高可达原始图像的16倍,同时优化图像细节。

PRIS-CV 自定义

LangChain

LangChain是一个由大语言模型 (LLM) 驱动的应用程序开发框架。对于AI类型应用程序,LangChain 简化了整个应用程序生命周期。

langchain-ai MIT license

DreaMoving

一个先进的基于扩散的可控视频生成框架,专门设计用于生成高质量的定制人类舞蹈视频。该框架结合了运动控制和身份保留技术,能够根据目标身份和姿势序列生成相应的舞蹈视频。

dreamoving Apache-2.0 license

ComfyUI Portrait Master

一款功能强大的人像生成工具,它提供了详尽的参数设置,使用户能够轻松创建个性化的人像作品。

ZHO-ZHO-ZHO GPL-3.0 license

DreamTalk

由清华大学、阿里巴巴集团和华中科技大学共同开发的人工智能框架,它利用扩散模型技术,让静态人物照片能够根据音频输入生成动态、逼真的说话表情和嘴唇动作。该框架支持多样化的语言、歌曲和嘈杂环境下的音频

ali-vilab MIT license

Audio2Photoreal

能够根据音频输入生成逼真的全身虚拟人物形象。

facebookresearch 自定义

Make-A-Character

一款创新的3D数字人生成工具,用户可以自定义面部特征,包括脸型、眼睛颜色、发型等,并生成包含人头、人体、配饰和服装的完整模型。

Human3DAIGC 自定义

EmotiVoice

一款功能强大的开源文本到语音(TTS)引擎,该引擎的特色在于其情感合成功能,能够合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音,为用户提供丰富的声音体验

netease-youdao Apache-2.0 license

TryOnDiffusion

一种创新的虚拟试衣技术,基于两个UNet的扩散架构,能够生成人物穿上不同服装的可视化效果图。这项技术在保留服装细节的同时,能够适应人体的姿势和形状变化,提供了一种高质量、逼真的试穿图像生成解决方案。

fashn-AI MIT license

EmojiGen

一个创新的开源表情符号生成器,它利用先进的AI技术,根据用户的文本描述生成个性化的表情符号。

cbh123 自定义

AIdea

一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具

mylxsw MIT license

热门推荐

机器学习

应用集成

localGPT

LocalGPT是一项开源计划,它允许用户与文档进行交流而不会泄露隐私。由于一切都在本地运行,可以放心,没有任何数据会离开用户的计算机。使用 LocalGPT 深入了解安全的AI本地文档交互世界。

PromtEngineer Apache-2.0 license

Jan

作为ChatGPT的替代品,提供本地API服务器,允许用户在自己的计算机上运行AI服务。它是一个本地优先、AI原生的跨平台框架,支持开发人员构建和自定义各种应用。

janhq AGPL-3.0 license

GeeKAI

一个基于AI大语言模型API的开源AI助手解决方案,具备完整的运营管理后台,实现开箱即用

yangjian102621 Apache-2.0 license

Documate

一款开源的AI工具,专门设计用于站内文档问答,能够将AI聊天对话框无缝嵌入到网站中。

aircodelabs MPL-2.0 license

AIdea

一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具

mylxsw MIT license

CrewAI

提供开源工具、预建模型,并允许用户创建自定义代理,以满足不同团队的需求。它支持整合人类输入以辅助复杂决策过程,并设计用于生产环境,使用户能够编排智能体团队来简化任务。

crewaiinc MIT license

XHS-Downloader

一款专为小红书平台设计的工具,它能够提取和下载小红书账号发布的作品、收藏、点赞内容,以及搜索结果中的用户和作品链接。

JoeanAmier GPL-3.0 license

Perplexica

一个创新的开源AI搜索引擎,它通过集成多种搜索模式和先进的机器学习技术,为用户提供精准且智能的搜索体验。

ItzCrazyKns MIT license

Open WebUI

该平台具备直观的聊天界面、响应式设计,并集成了多种高级功能,如代码高亮、Markdown与LaTeX支持、RAG集成、网页浏览、预设提示、RLHF注释、模型管理等,旨在增强用户体验并提供高效的对话管理

open-webui MIT license

LibreChat

一个免费开源的AI聊天平台,集成了多种AI模型,包括ChatGPT、OpenAI、BingAI、PaLM 2等,提供多功能聊天界面和丰富的定制选项。

danny-avila MIT license

QAnything AI

一个本地知识库问答系统,支持多种文件格式和数据库,允许用户在离线状态下安装和使用。

netease-youdao AGPL-3.0 license

查看更多

计算机视觉

开发辅助

辅助创作

M2UGen

一款创新的多模态音乐生成框架,专为音乐艺术创作者设计,该框架结合了音乐理解与多模态音乐生成任务,使用户能够通过文本、图像、视频和音频等多种输入方式生成音乐,并进行音乐编辑。

shansongliu MIT license

VideoSrt

一款开源软件工具,专门设计用于自动识别视频中的语音并生成SRT格式的字幕文件。

wxbool GPL-2.0 license

EmojiGen

一个创新的开源表情符号生成器,它利用先进的AI技术,根据用户的文本描述生成个性化的表情符号。

cbh123 自定义

TryOnDiffusion

一种创新的虚拟试衣技术,基于两个UNet的扩散架构,能够生成人物穿上不同服装的可视化效果图。这项技术在保留服装细节的同时,能够适应人体的姿势和形状变化,提供了一种高质量、逼真的试穿图像生成解决方案。

fashn-AI MIT license

IDM-VTON

一种先进的虚拟试穿技术,它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像,并允许通过定制来提高图像的一致性和真实性。

yisol 自定义

InstantMesh

一款能够将2D图片快速转换成3D模型的工具,它基于先进的稀疏视图大型重建模型(LRM)架构,实现了高效的3D网格生成。

TencentARC Apache-2.0 license

OOTDiffusion

工具能够根据不同性别和体型自动调整服装,确保与模特的贴合度,同时用户也可以根据个人需求和偏好调整试穿效果。

levihsu 自定义

AI Cover 红包封面生成器

一款AI驱动的红包封面生成器,它能够根据用户的需求创造出独特、高清、精美的微信红包封面图片,特别适用于庆祝农历新年。除了核心的AI生成功能,AI Cover还提供用户登录、付费方案、积分系统等服务

all-in-aigc Apache-2.0 license

Motionshop

一款AI角色动画工具,它利用先进的视频处理技术和3D渲染技术,能够自动检测视频中的人物,并将其替换为3D卡通角色模型,快速生成有趣的AI视频。

aigc3d 自定义

查看更多

视频处理

VideoDrafter

利用开放式扩散模型,能够在保持主体不变的基础上,一次性生成多个场景的视频。

AILab-CVC 自定义

LiveSketch

一款AI驱动的视频生成工具,它允许用户通过文本提示将静态素描转化为动画。

yael-vinker Apache-2.0 license

MagicAvatar

一套视频剪辑方法,它基于多模态框架,允许用户通过文本、视频和音频等多种输入方式生成和动画化虚拟人物。

magic-research BSD-3-Clause license

DeepFaceLive

一款免费开源的AI换脸工具,它利用深度学习算法实现实时视频换脸功能。

iperov GPL-3.0 license

MoneyPrinter

专为YouTube短视频创作和发布设计。它通过简单的文本输入,快速生成与主题相关的YouTube Shorts视频,为用户提供了一个高效、自动化的赚钱项目。

FujiwaraChoki MIT license

ProPainter

一款高效的AI视频编辑工具,专注于提供一键移除视频中移动物体和水印的功能。

sczhou 自定义

微软VASA-1

能够将单张肖像照片和语音音频实时转换成超现实的说话脸部视频。这项技术以其精确的唇音同步、逼真的面部行为和自然的头部动作,实现了静态图像到动态视频的无缝转换。

AniPortrait

通过音频驱动的动画合成、用户友好的操作界面、三维数据转换以及高品质动画生成等核心功能,广泛应用于视频配音、人脸动画创作、表情包制作以及面部再现和动画生成等多个领域。

Zejun-Yang Apache-2.0 license

SoraWebui

为用户带来了从创意到视频的快速转化,同时为开发者提供了一个探索和实现先进AI视频生成技术的途径。

SoraWebui Apache-2.0 license

StreamRAG

一个强大的视频搜索和流媒体代理工具,为用户提供了一种全新的视频内容管理和互动方式,无论是个人娱乐、教育学习还是企业培训,都能提供高效的视频处理和搜索解决方案。

video-db MIT license

查看更多

图形图像

stable-diffusion

stable diffusion是一种潜在的文本到图像的扩散模型。能够在LAION-5B数据库子集的512x512图像上训练潜在扩散模型。

CompVis 自定义

YOLO-World

实时目标检测工具,以其卓越的速度和准确性在目标检测领域占据领先地位。作为YOLO系列的下一代检测器,YOLO-World专注于实时开放词汇目标检测,能够自动识别和定位图像中的各种对象。

AILAB-CVC GPL-3.0 license

DiffusionGPT

一款文本到图像的多合一系统,它利用大型语言模型(LLM)来解析输入提示,并确定最优的图像生成模型,以产生高质量的图像输出。

DiffusionGPT Apache-2.0 license

PhotoMaker

根据用户提供的多张照片作为身份ID,捕捉人物的特征,并结合描述生成符合要求的新个性化人物图像。

TencentARC 自定义

DDColor图像上色

一款图像上色算法,它通过革命性的双解码器技术,为黑白图像提供自然而生动的上色效果。

piddnad Apache-2.0 license

Personalized Restoration

一项先进的面部图像恢复和编辑技术,专门设计用于精确复原受损或模糊的面部图像,同时捕捉和重现个人独特的面部特征。

nerfies 自定义

Zero123

专注于视图条件图像生成,通过三项关键创新,实现了与之前版本Zero123-XL相比的显著改进

cvlab-columbia MIT license

IP-Adapter-FaceID

一款先进的AI图像生成模型,它通过面部识别技术捕捉特定人物的面部特征,并结合文本描述生成个性化图像。

tencent-ailab Apache-2.0 license

HandRefiner

一款专注于解决AI图像生成中手部畸形问题的工具。它通过先进的条件修补方法,能够在不改变图像其他部分的前提下,精确地识别和修正手部图像中的畸形。

wenquanlu MIT license

DemoFusion

一款开源AI图像重绘增强工具。它利用最新的BSR GAN技术显著提升图像分辨率,最高可达原始图像的16倍,同时优化图像细节。

PRIS-CV 自定义

LucidDreamer

一个创新的无域3D场景生成管道,该系统通过做梦和对齐两个交替步骤,从点云生成多视图一致的图像,并将其聚合成3D场景,提供了一种新颖的方法来创建高详细度、无领域限制的3D场景。

luciddreamer-cvlab 自定义

查看更多

语音处理

数字人

AI Companion App

一款创新的应用程序,它允许用户创建和训练一个个性化的AI伴侣或女朋友。

a16z-infra MIT license

FaceChain

一个开源的AI模型项目,专注于利用深度学习技术打造个性化的人物写真和数字形象。

modelscope Apache-2.0 license

Make-A-Character

一款创新的3D数字人生成工具,用户可以自定义面部特征,包括脸型、眼睛颜色、发型等,并生成包含人头、人体、配饰和服装的完整模型。

Human3DAIGC 自定义

Audio2Photoreal

能够根据音频输入生成逼真的全身虚拟人物形象。

facebookresearch 自定义

DreamTalk

由清华大学、阿里巴巴集团和华中科技大学共同开发的人工智能框架,它利用扩散模型技术,让静态人物照片能够根据音频输入生成动态、逼真的说话表情和嘴唇动作。该框架支持多样化的语言、歌曲和嘈杂环境下的音频

ali-vilab MIT license

ComfyUI Portrait Master

一款功能强大的人像生成工具,它提供了详尽的参数设置,使用户能够轻松创建个性化的人像作品。

ZHO-ZHO-ZHO GPL-3.0 license

DreaMoving

一个先进的基于扩散的可控视频生成框架,专门设计用于生成高质量的定制人类舞蹈视频。该框架结合了运动控制和身份保留技术,能够根据目标身份和姿势序列生成相应的舞蹈视频。

dreamoving Apache-2.0 license

EasyPhoto

一款基于Webui的UI插件,专门设计用于生成AI肖像画,并训练与用户相关的数字化替身。

aigc-apps Apache-2.0 license

查看更多