RWKV 12 Jun 2026 博客 RWKV RWKV 简介 RWKV(读作 RWaKuV)是一种具有 GPT 级大型语言模型(LLM)性能的 RNN,也可以像 GPT Transformer 一样直接训练(可并行化)。 RWKV 结合了 RNN 和 Transformer 的最佳特性:出色的性能、恒定的显存占用、恒定的推理生成速度、
RAG 12 Jun 2026 博客 RAG rag 检索增强生成(Retrieval-augmented Generation),简称RAG,是当下热门的大模型前沿技术之一 ^1。 检索增强生成模型结合了语言模型和信息检索技术。具体来说,当模型需要生成文本或者回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成,从而提高预测的质量和准确性。 历史沿革 2020年,Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP
摩尔线程开源 MusaCoder — 首个基于国产全功能 GPU 全栈训练的代码大模型 12 Jun 2026 技术资讯 摩尔线程开源 MusaCoder — 首个基于国产全功能 GPU 全栈训练的代码大模型 摩尔线程开源 MusaCoder — 首个基于国产全功能 GPU 全栈训练的代码大模型 发布时间: 2026年6月 来源: OSCHINA | 摩尔学院论文版 | InfoQ 报道 论文: arXiv:2606.04847 归档日期: 2026-06-11 概述 摩尔线程正式发布并开源面向 GPU 底层算子生成的专用代码大模型 MusaCoder,包含 9B
MCP协议 12 Jun 2026 博客 MCP协议 MCP协议 MCP 是一个标准化协议,旨在通过提供结构化的上下文管理来增强大型语言模型(LLMs)与应用程序之间的交互。 介绍 MCP (Model Context Protocol) 是一个开放协议,用于标准化应用程序如何向 LLM 提供上下文。可以将 MCP 想象成 AI 应用程序的 USB-C 接口。就像 USB-C 为设备连接各种外设和配件提供标准化方式一样,
llama.cpp 12 Jun 2026 博客 llama.cpp llama.cpp llama.cpp 是一个专为大型语言模型(LLMs)设计的 高性能开源推理引擎 ,由开发者 Georgi Gerganov 基于 C/C++ 实现。它通过底层优化技术,实现在多种硬件(包括消费级设备)上高效运行大模型,尤其适合本地化部署场景。 llama.cpp 是一个库,可以基于其进行开发。 核心定位与功能