AI开源 - AI之家

机器学习

应用集成

计算机视觉

开发辅助

辅助创作

视频处理

图形图像

语音处理

数字人

机器学习

MotionAgent

一款深度学习模型工具，提供了一套完整的工作流程，包括剧本创作、剧照生成、视频制作以及背景音乐谱写。

modelscope Apache-2.0 license

应用集成

localGPT

LocalGPT是一项开源计划，它允许用户与文档进行交流而不会泄露隐私。由于一切都在本地运行，可以放心，没有任何数据会离开用户的计算机。使用 LocalGPT 深入了解安全的AI本地文档交互世界。

PromtEngineer Apache-2.0 license

CrewAI

提供开源工具、预建模型，并允许用户创建自定义代理，以满足不同团队的需求。它支持整合人类输入以辅助复杂决策过程，并设计用于生产环境，使用户能够编排智能体团队来简化任务。

crewaiinc MIT license

XHS-Downloader

一款专为小红书平台设计的工具，它能够提取和下载小红书账号发布的作品、收藏、点赞内容，以及搜索结果中的用户和作品链接。

JoeanAmier GPL-3.0 license

Perplexica

一个创新的开源AI搜索引擎，它通过集成多种搜索模式和先进的机器学习技术，为用户提供精准且智能的搜索体验。

ItzCrazyKns MIT license

Open WebUI

该平台具备直观的聊天界面、响应式设计，并集成了多种高级功能，如代码高亮、Markdown与LaTeX支持、RAG集成、网页浏览、预设提示、RLHF注释、模型管理等，旨在增强用户体验并提供高效的对话管理

open-webui MIT license

LibreChat

一个免费开源的AI聊天平台，集成了多种AI模型，包括ChatGPT、OpenAI、BingAI、PaLM 2等，提供多功能聊天界面和丰富的定制选项。

danny-avila MIT license

QAnything AI

一个本地知识库问答系统，支持多种文件格式和数据库，允许用户在离线状态下安装和使用。

netease-youdao AGPL-3.0 license

Jan

作为ChatGPT的替代品，提供本地API服务器，允许用户在自己的计算机上运行AI服务。它是一个本地优先、AI原生的跨平台框架，支持开发人员构建和自定义各种应用。

janhq AGPL-3.0 license

GeeKAI

一个基于AI大语言模型API的开源AI助手解决方案，具备完整的运营管理后台，实现开箱即用

yangjian102621 Apache-2.0 license

Documate

一款开源的AI工具，专门设计用于站内文档问答，能够将AI聊天对话框无缝嵌入到网站中。

aircodelabs MPL-2.0 license

AIdea

一款集成了多种主流大语言模型和绘图模型的开源AI聚合工具

mylxsw MIT license

计算机视觉

Umi-OCR

一款功能强大的离线OCR软件，它利用先进的人工智能技术，为用户提供了一种快速、准确将图片中的文字转换为可编辑文本的方法。

hiroi-sora MIT license

开发辅助

LangChain

LangChain是一个由大语言模型 (LLM) 驱动的应用程序开发框架。对于AI类型应用程序，LangChain 简化了整个应用程序生命周期。

langchain-ai MIT license

Vanna.AI

一款创新的人工智能工具，旨在简化用户与SQL数据库的交互过程。通过自然语言处理技术，Vanna.ai 允许用户以日常对话的方式提出问题，并自动将这些对话转换为SQL查询语句，从而实现对数据库的高效查询

vanna-ai MIT license

DuckDB-NSQL

一个强大的数据库交互工具，为用户带来了前所未有的便利性，无论是数据库专家还是初学者，都能够通过自然语言与数据库进行高效的沟通和操作

NumbersStationAI Apache-2.0 license

Notebook Copilot

一款旨在简化开发笔记本流程的智能工具，它通过自动生成代码和Markdown单元格来提高用户的工作效率。

talperetz MIT license

TextBase

一款专为AI聊天机器人开发设计的简单框架，帮助开发人员快速搭建和优化聊天机器人。

cofactoryai 自定义

辅助创作

TryOnDiffusion

fashn-AI MIT license

IDM-VTON

一种先进的虚拟试穿技术，它通过结合视觉编码器和UNet模型来生成高质量的虚拟试穿图像，并允许通过定制来提高图像的一致性和真实性。

yisol 自定义

InstantMesh

一款能够将2D图片快速转换成3D模型的工具，它基于先进的稀疏视图大型重建模型（LRM）架构，实现了高效的3D网格生成。

TencentARC Apache-2.0 license

OOTDiffusion

工具能够根据不同性别和体型自动调整服装，确保与模特的贴合度，同时用户也可以根据个人需求和偏好调整试穿效果。

levihsu 自定义

AI Cover 红包封面生成器

一款AI驱动的红包封面生成器，它能够根据用户的需求创造出独特、高清、精美的微信红包封面图片，特别适用于庆祝农历新年。除了核心的AI生成功能，AI Cover还提供用户登录、付费方案、积分系统等服务

all-in-aigc Apache-2.0 license

Motionshop

一款AI角色动画工具，它利用先进的视频处理技术和3D渲染技术，能够自动检测视频中的人物，并将其替换为3D卡通角色模型，快速生成有趣的AI视频。

aigc3d 自定义

M2UGen

一款创新的多模态音乐生成框架，专为音乐艺术创作者设计，该框架结合了音乐理解与多模态音乐生成任务，使用户能够通过文本、图像、视频和音频等多种输入方式生成音乐，并进行音乐编辑。

shansongliu MIT license

VideoSrt

一款开源软件工具，专门设计用于自动识别视频中的语音并生成SRT格式的字幕文件。

wxbool GPL-2.0 license

EmojiGen

一个创新的开源表情符号生成器，它利用先进的AI技术，根据用户的文本描述生成个性化的表情符号。

cbh123 自定义

视频处理

MoneyPrinter

专为YouTube短视频创作和发布设计。它通过简单的文本输入，快速生成与主题相关的YouTube Shorts视频，为用户提供了一个高效、自动化的赚钱项目。

FujiwaraChoki MIT license

ProPainter

一款高效的AI视频编辑工具，专注于提供一键移除视频中移动物体和水印的功能。

sczhou 自定义

微软VASA-1

能够将单张肖像照片和语音音频实时转换成超现实的说话脸部视频。这项技术以其精确的唇音同步、逼真的面部行为和自然的头部动作，实现了静态图像到动态视频的无缝转换。

AniPortrait

通过音频驱动的动画合成、用户友好的操作界面、三维数据转换以及高品质动画生成等核心功能，广泛应用于视频配音、人脸动画创作、表情包制作以及面部再现和动画生成等多个领域。

Zejun-Yang Apache-2.0 license

SoraWebui

为用户带来了从创意到视频的快速转化，同时为开发者提供了一个探索和实现先进AI视频生成技术的途径。

SoraWebui Apache-2.0 license

StreamRAG

一个强大的视频搜索和流媒体代理工具，为用户提供了一种全新的视频内容管理和互动方式，无论是个人娱乐、教育学习还是企业培训，都能提供高效的视频处理和搜索解决方案。

video-db MIT license

VideoDrafter

利用开放式扩散模型，能够在保持主体不变的基础上，一次性生成多个场景的视频。

AILab-CVC 自定义

LiveSketch

一款AI驱动的视频生成工具，它允许用户通过文本提示将静态素描转化为动画。

yael-vinker Apache-2.0 license

MagicAvatar

一套视频剪辑方法，它基于多模态框架，允许用户通过文本、视频和音频等多种输入方式生成和动画化虚拟人物。

magic-research BSD-3-Clause license

DeepFaceLive

一款免费开源的AI换脸工具，它利用深度学习算法实现实时视频换脸功能。

iperov GPL-3.0 license

图形图像

stable-diffusion

stable diffusion是一种潜在的文本到图像的扩散模型。能够在LAION-5B数据库子集的512x512图像上训练潜在扩散模型。

CompVis 自定义

LucidDreamer

一个创新的无域3D场景生成管道，该系统通过做梦和对齐两个交替步骤，从点云生成多视图一致的图像，并将其聚合成3D场景，提供了一种新颖的方法来创建高详细度、无领域限制的3D场景。

luciddreamer-cvlab 自定义

Waifu2x

一个开源的图像处理工具，专门使用深度卷积神经网络技术来实现图片的无损放大，尤其适合二次元图片。

nagadomi MIT license

InvokeAI

一个开源的创意引擎，专为使用Stable Diffusion模型生成高质量图像而设计。它提供了简化的图像生成流程，支持文本到图像和图像到图像的转换，并具备图像处理功能，如修复、扩展、放大等。

invoke-ai Apache-2.0

ShareX

一款免费、开源的高级截图和屏幕录制工具，专为Windows系统设计。它提供了全面的截图、屏幕录制、自动水印添加等功能，无广告，轻量级，是高效率用户的理想选择。

ShareX GPL-3.0 license

CustomNet

一款创新的图像生成技术，专注于将指定物品的图片融合到新生成的图片中，确保原物品的样式和纹理细节得到精确还原。

TencentARC Apache-2.0 license

AnimateDiff

一款强大的AI插件，能够将个性化的文本到图像（Text-to-Image，T2I）模型转化为动画生成器，无需特定调整即可实现动画效果。

guoyww Apache-2.0 license

DragGAN

一款新型的图像编辑工具，以其直观的操作方式和强大的图像变形功能，为用户提供了一个高效、灵活的图像编辑解决方案。

XingangPan 自定义

StoryDiffusion

一款创新的AI工具，通过其一致性自注意力技术，不仅提升了图像和视频生成的连贯性和一致性，还拓展了其在不同领域的应用潜力。

HVision-NKU Apache-2.0 license

HiDiffusion

一种创新扩散模型，它显著提升了图像生成的速度和质量。

megvii-research Apache-2.0 license

Animagine XL 3.1

一个先进的开源文本到图像动漫模型，它通过整合新的数据集，显著提升了对动漫作品和风格的广泛理解，包括经典和最新作品，以及从古老到现代的艺术风格。

语音处理

TTS-Vue

一款集成了微软语音合成技术的开源免费工具，它基于Electron、Vue、ElementPlus和Vite框架构建，专门用于将文本转换为语音。

LokerL MIT license

notesGPT

一款创新的语音笔记工具，它能够录制用户的语音内容，并自动将这些语音转换成文字。

nutlope MIT license

WhisperFusion

一个创新的语音交互系统，为需要快速、准确对话处理的场合提供了强大的技术支持，无论是在客户服务还是其他需要实时语音识别和响应的领域，都能发挥重要作用。

collabora 自定义

EmotiVoice

netease-youdao Apache-2.0 license

Whisper

一款先进的开源音频转文字语音识别模型。它通过在多样化音频数据集上的训练，实现了多语言的语音识别、翻译和语言检测功能。

openai MIT license

数字人

Make-A-Character

一款创新的3D数字人生成工具，用户可以自定义面部特征，包括脸型、眼睛颜色、发型等，并生成包含人头、人体、配饰和服装的完整模型。

Human3DAIGC 自定义

Audio2Photoreal

能够根据音频输入生成逼真的全身虚拟人物形象。

facebookresearch 自定义

DreamTalk

ali-vilab MIT license

ComfyUI Portrait Master

一款功能强大的人像生成工具，它提供了详尽的参数设置，使用户能够轻松创建个性化的人像作品。

ZHO-ZHO-ZHO GPL-3.0 license

DreaMoving

dreamoving Apache-2.0 license

EasyPhoto

一款基于Webui的UI插件，专门设计用于生成AI肖像画，并训练与用户相关的数字化替身。

aigc-apps Apache-2.0 license

AI Companion App

一款创新的应用程序，它允许用户创建和训练一个个性化的AI伴侣或女朋友。

a16z-infra MIT license

FaceChain

一个开源的AI模型项目，专注于利用深度学习技术打造个性化的人物写真和数字形象。

modelscope Apache-2.0 license

最新项目

DragGAN

DemoFusion

LangChain

DreaMoving

ComfyUI Portrait Master

DreamTalk

Audio2Photoreal

Make-A-Character

EmotiVoice

TryOnDiffusion

EmojiGen

AIdea

热门推荐

机器学习

MotionAgent

应用集成

localGPT

CrewAI

XHS-Downloader

Perplexica

Open WebUI

LibreChat

QAnything AI

Jan

GeeKAI

Documate

AIdea

计算机视觉

Umi-OCR

开发辅助

LangChain

Vanna.AI

DuckDB-NSQL

Notebook Copilot

TextBase

辅助创作

TryOnDiffusion

IDM-VTON

InstantMesh

OOTDiffusion

AI Cover 红包封面生成器

Motionshop

M2UGen

VideoSrt

EmojiGen

视频处理

MoneyPrinter

ProPainter

微软VASA-1

AniPortrait

SoraWebui

StreamRAG

VideoDrafter

LiveSketch

MagicAvatar

DeepFaceLive

图形图像

stable-diffusion

LucidDreamer

Waifu2x

InvokeAI

ShareX

CustomNet

AnimateDiff

DragGAN

StoryDiffusion

HiDiffusion

Animagine XL 3.1

语音处理

TTS-Vue

notesGPT

WhisperFusion

EmotiVoice

Whisper

数字人

Make-A-Character

Audio2Photoreal

DreamTalk

ComfyUI Portrait Master