博客

Graph RAG

graph rag 简介 1. Knowledge Graph Graph RAG 中的 Graph 指的是知识图谱 —— Knowledge Graph:一个用来表示实体及其相互关系的结构化图形数据模型。 在 Graph 中,节点(Nodes) 代表实体如人、地点、事件等;边(Edges)则代表这些实体之间的关系,

长视频理解

长视频理解 详细 VideoRAG^1 VideoRAG 是一种用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。它通过提取视频中的视觉对齐辅助文本,帮助大型视频语言模型(LVLMs)更好地理解和处理长视频内容。 具体来说,VideoRAG 使用开源工具从视频数据中提取音频、文字和对象检测等信息,将这些信息作为辅助文本与视频帧和用户查询一起输入到现有的 LVLM 中。这种方法计算开销低,易于实现,能与任何 LVLM 兼容。

rkwv 微调

rkwv 微调 简介 为什么要微调 RWKV 模型? 目前开源发布的 RWKV 模型均为基底模型(base model ,又称预训练模型),基底模型在自然语言处理等领域的大规模数据集上进行了训练,具备较强的泛化能力和丰富的知识储备。 但为了保持泛化能力和通用性,RWKV 基底模型并未针对某一类任务作优化。因此,RWKV 模型在某些特定任务上的表现可能不够理想。 而对 RWKV 模型进行微调,通俗地说,指的是使用特定领域(

RWKV

RWKV 简介 RWKV(读作 RWaKuV)是一种具有 GPT 级大型语言模型(LLM)性能的 RNN,也可以像 GPT Transformer 一样直接训练(可并行化)。 RWKV 结合了 RNN 和 Transformer 的最佳特性:出色的性能、恒定的显存占用、恒定的推理生成速度、

Episode

00:00:00 00:00:00
苏ICP备19018690号-1