什么是评估模型(Judge models) – AI百科知识

评估模型(Judge models)是用于评估其他模型输出质量的辅助模型,能够充当“裁判员”的角色,对大语言模型(LLM)的输出结果进行评估和打分。这些模型通过输入问题和待评测模型的回答,自主完成对大语言模型的分析与评价,提供评分和理由。评估模型的主要优势包括准确性、高效性、易用性和低成本。它们可以处理各种类型的评估任务,包括但不限于回复的帮助性、无害性、可靠性和生成文本的综合质量。评估模型的训练方法通常包括微调技术和提示策略,提升其性能和效率。 什么是评估模型 评估模型(Judge models)是用于评估其他模型输出质量的辅助模型,充当“裁判员”的角色,对大语言模型(LLM)的输出结果进行评估和打分。模型通过输入问题和待...
日期: 栏目:ai工具大全 阅读:22

什么是规模定律(Scaling Law) – AI百科知识

规模定律(Scaling Law)的概念在不同学科领域中有不同的应用,但在人工智能和机器学习领域,它主要用来描述模型性能如何随着模型大小、数据集大小和计算资源的增加而变化。随着模型中参数数量的增加,性能通常会按照幂律改善。更大的训练数据集通常带来更好的性能,也遵循幂律关系。用于训练的计算资源(浮点运算次数)与性能改善相关。 什么是规模定律 规模定律(Scaling Law)描述了模型性能如何随着模型规模(如参数数量)、训练数据集大小以及用于训练的计算资源的增加而变化。体现为模型性能与这些因素之间的幂律关系,即模型性能会随着规模的增长而按照一定的规律性变化。具体来说,随着模型参数量的增加、数据集的扩大和计算资源的提升,模型性能...
日期: 栏目:ai工具大全 阅读:14

鸿蒙智能体框架(HMAF)是什么?一文看懂 – AI百科知识

鸿蒙智能体框架 HMAF(Harmony Agent Framework)是华为推出的核心人工智能框架,构建一个具备自主决策和群体协作能力的 AI 生态系统,全面赋能鸿蒙应用的智能化升级。HMAF 通过将 AI 能力深度融入操作系统底层,推动人机交互从传统的图形界面向更自然的语言交互演进,为开发者提供强大的工具与平台支持,加速智能体应用的创新与落地。 什么是鸿蒙智能体框架 定义 鸿蒙智能体框架(Harmony Agent Framework,简称 HMAF)是华为公司为其自主研发的鸿蒙操作系统(HarmonyOS)打造的一款核心人工智能框架 。在于构建一个具备自主决策和群体协作能力的 AI 生态系统,全面赋能应用的智能化升...
日期: 栏目:ai工具大全 阅读:20

什么是ANP(Agent Network Protocol) – AI百科知识

ANP(Agent Network Protocol)是开源的智能体通信协议,成为智能体互联网时代的 HTTP,为数十亿智能体构建一个开放、安全、高效的协作网络。打破数据孤岛,实现所有智能体之间的无障碍通信,确保 AI 能获取完整的上下文信息。智能体无需模仿人类的互联网交互方式,是通过专用 API 和协议与数字世界直接交互,优化机器对机器的通信效率。用 AI 实现智能体自动组织和自主协商,创建更具成本效益的协作网络。 什么是ANP ANP(Agent Network Protocol)是开源的智能体通信协议,成为智能体互联网时代的 HTTP,为数十亿智能体构建一个开放、安全、高效的协作网络。实现所有智能体之间的无障碍通信,确...
日期: 栏目:ai工具大全 阅读:22

AGL框架是什么?一文看懂 – AI百科知识

Agent Guidance Language(AGL,Agent指导语言)是一种借鉴标准作业流程(SOP)的自然语言结构化编写法,让业务专家能够用自然语言为Agent编写“可执行的指令书”,将专家的偏好、私域知识和隐性规则注入任务执行流程。AGL通过模板化的方式,让业务专家能够清晰、完整地描述任务,考虑Agent的适配性,极大提升了Agent任务执行的稳定性。 什么是AGL AGL(Agent Guidance Language,Agent指导语言)是借鉴标准作业流程(SOP)的自然语言结构化编写法,让业务专家能用自然语言为Agent编写“可执行的指令书”,将专家的偏好、私域知识和隐性规则注入任务执行流程。 AGL的工作...
日期: 栏目:ai工具大全 阅读:23

MCP是什么?一文看懂 – AI百科知识

Model Context Protocol(MCP) 是人工智能公司 Anthropic 于 2024 年 11 月 推出的一个开放协议,标准化大型语言模型(LLM)与外部数据源和工具之间的通信。MCP 被比喻为 AI 应用的 USB-C 接口,通过提供统一的接口,使 LLM 能灵活地访问和交互各种数据和服务,促进了 AI 的广泛应用和生态发展。协议推出,解决了传统集成方式的复杂性和安全隐患,提升了开发效率和数据安全性,已被 Microsoft、OpenAI、Google 等公司采用。MCP 的出现标志着 AI 模型与外部世界交互方式的一个重要进步,为构建更强大、更智能的 AI 应用提供了坚实的基础,有望推动整个 AI 行业的标准...
日期: 栏目:ai工具大全 阅读:25

什么是慢感知(slow perception) – AI百科知识

慢感知(Slow Perception)是阶跃多模态团队提出的一种新型视觉感知概念,通过逐步分解和流动的方式,让模型像人类一样更精细地感知复杂的几何图形。实验中,研究人员构建了20万个合成几何图形数据样本用于训练,从中学考试中收集了480个真实几何图形用于验证和测试。结果显示,慢感知能显著提升模型的几何解析能力,F1分数提高了6%。慢感知表现出推理时间扩展规律:感知尺越短,模型对线段的感知越精细,推理时间也越长。 什么是慢感知 慢感知(Slow Perception)是阶跃多模态团队提出的一种新型视觉感知概念,通过逐步分解和流动的方式,让模型像人类一样更精细地感知复杂的几何图形。 慢感知的工作原理 慢感知(Slow Pe...
日期: 栏目:ai工具大全 阅读:18

什么是判别式模型(Discriminative Model) – AI百科知识

判别式模型是机器学习中一类重要的模型,主要用于分类和回归任务。它们的核心目标是学习输入变量x和输出变量y之间的映射关系,即条件概率分布P(y|x)。与生成式模型不同,判别式模型不考虑输入变量x和输出变量y之间的联合分布P(x,y),而是直接建模条件概率P(y|x)。 什么是判别式模型 判别式模型(Discriminative Model)是机器学习中的一种模型,用于对未知数据y与已知数据x之间的关系进行建模。通过构建条件概率分布P(y|x)来预测y,而不考虑x和y之间的联合分布。 判别式模型的工作原理 判别式模型的核心在于学习输入数据 x 和输出数据 y 之间的映射关系,即条件概率 P(y|x) 。这种模型不关注数据是如...
日期: 栏目:ai工具大全 阅读:18

上下文工程是什么?一文读懂 – AI百科知识

上下文工程(Context Engineering) 是在人工智能(AI)领域,特别是大型语言模型(LLM)应用中逐渐兴起并日益受到重视的概念。可以理解为一种系统性的工程方法。在于构建动态的系统,以便向AI模型,尤其是LLM,提供精准、相关且及时的信息和工具,使模型能更合理、更有效地完成特定任务 。与传统的提示工程(Prompt Engineering)主要关注单次交互中的指令和示例不同,上下文工程更侧重于设计和实现能捕获、存储、检索和管理上下文信息的完整系统。意味着上下文工程不仅关注“说什么”,更关注“在什么情况下说”,以及如何构建和利用这个“情况”来提升AI的整体表现。涉及到对AI模型运作环境的全面考量,包括模型可以访问的知识范...
日期: 栏目:ai工具大全 阅读:24

什么是草稿链(Chain-of-Draft, CoD) – AI百科知识

草稿链(Chain-of-Draft, CoD)是新型的AI推理范式,通过简洁的中间推理步骤提升推理效率。模仿人类解决问题时的简洁思维,限制每一步输出的关键信息,不超过五个词。与传统的思维链(CoT)相比,草稿链大幅减少了Token使用量,显著降低了推理成本和延迟,同时保持较高的准确率。在多种推理任务(如算术、常识和符号推理)中,草稿链表现出色,适合实时AI应用、资源受限环境和成本敏感场景。 什么是草稿链 草稿链(Chain-of-Draft, CoD)是Zoom的研究团队提出新的AI推理范式,通过模仿人类的简洁思维过程来提升推理效率,节省成本。受到了人类解决问题时依赖草稿或速记捕捉关键见解的启发。与传统的思维链(Chain...
日期: 栏目:ai工具大全 阅读:26