YOLO-World

2024-10-27 14:32

实时目标检测工具，以其卓越的速度和准确性在目标检测领域占据领先地位。作为YOLO系列的下一代检测器，YOLO-World专注于实时开放词汇目标检测，能够自动识别和定位图像中的各种对象。

项目参数：

GPL-3.0 license

英文

项目介绍：

YOLO-World

YOLO-World是由腾讯AI实验室精心开发的实时目标检测工具，以其卓越的速度和准确性在目标检测领域占据领先地位。作为YOLO系列的下一代检测器，YOLO-World专注于实时开放词汇目标检测，能够自动识别和定位图像中的各种对象。

YOLO-World的主要功能：

大规模预训练：YOLO-World在包括Objects365、GQA、Flickr30K和CC3M在内的大规模视觉-语言数据集上进行了预训练，赋予了它强大的视觉和语言知识。
快速准确的检测：在LVIS数据集上的零样本评估中达到了35.4 AP的高准确率，同时在V100上的处理速度高达52.0 FPS，超越了许多现有方法。
零样本检测能力：即便面对之前未见过的物体，YOLO-World也能通过图片中的线索和上下文信息成功识别和定位，无需额外训练。
语言理解与物体识别：YOLO-World结合了视觉信息和语言描述，能够理解人类的语言指令，识别出相应的物体。
高效率：与现有的开放词汇检测方法相比，YOLO-World的检测速度快了至少20倍，每秒能处理大约52帧图像。
数据集上的突破：在LVIS对象检测数据集上，YOLO-World设定了新的最先进的标准。