Coding One

  • java
  • php
  • python
  • 前端
  • 大数据
  • 操作系统
  • 树莓派
  • 其他
Coding One
如果每天只要敲敲代码,那这样一辈子也挺好。
AI 资讯

效用引导的 Agent 编排新框架:平衡 LLM 工具使用的质量与成本

导语:arXiv 最新论文提出效用引导的 Agent 编排框架,将工具使用 LLM Agent 的行为控制作为显式决策问题。研究指出固定工作流稳定但僵化,ReAct 等自由推理灵活但可能过度执行。新框架通过效用函数平衡估计收益、步骤成本、不确定性和冗余,在 HotpotQA 基准上实现与 ReAct 竞争的性能,同时提供更可解释、可控制的多步执行轨迹。 核心内容 研究背景 工具使用的大型语言模型 Agent 面临答案质量与执行成本之间的根本张力。更好的任务性能通常需要更多推理步骤、更多工具交互和更长的执行轨迹,这反…

2026年3月24日 0条评论 6点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

心智理论推理新突破:动态信念图让 LLM 理解人类意图

导语:arXiv 最新论文提出动态信念图框架,增强大型语言模型的心智理论(ToM)推理能力。研究指出现有方法将信念视为静态独立变量,导致动态场景中推理不一致。新框架通过能量因子图表征信念依赖关系、语义到势函数投影、ELBO 优化目标,在真实灾难疏散数据集上显著提升行动预测准确率,恢复可解释的信念轨迹。 核心内容 研究背景 心智理论(ToM)指推断他人潜在心理状态(如信念、意图、期望)并据此解释和预测行为的能力。这对构建能与人类有效交互的 AI 系统至关重要,尤其在灾难响应、紧急医疗、人机协作等高风险场景中。然而,现…

2026年3月23日 0条评论 16点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

组合优化新框架:cuGenOpt 用 GPU 加速实现通用高效求解

导语:arXiv 最新论文提出 cuGenOpt,一种 GPU 加速的通用元启发式组合优化框架。研究指出现有方法在通用性、性能和可用性之间面临根本权衡。cuGenOpt 通过"一块演化一解"CUDA 架构、统一编码抽象、双层自适应算子选择和 LLM 建模助手,在五个主题套件、三种 GPU 架构上验证,相比通用 MIP 求解器提升数个数量级,在 n=150 实例上与专用求解器质量相当,30 秒内 TSP-442 差距降至 4.73%。 核心内容 研究背景 组合优化问题广泛存在于物流、调度和资源分配场景,但现有方法面临…

2026年3月23日 0条评论 24点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

LightRAG:简单快速的检索增强生成新框架

导语:EMNLP 2025 接收论文提出 LightRAG,一种简单高效的检索增强生成框架。研究指出传统 RAG 系统在检索精度和生成速度之间难以平衡。LightRAG 通过双层知识图谱索引、增量更新机制和智能查询路由,在多个基准测试中实现与复杂 RAG 系统相当的性能,同时显著降低计算开销和响应延迟。 核心内容 研究背景 检索增强生成(RAG)已成为大语言模型应用的核心架构,但现有方案面临两大挑战:一是检索精度与计算效率的权衡,二是知识更新需要重建整个索引系统。LightRAG 旨在解决这两个关键问题。 研究团队…

2026年3月23日 0条评论 26点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

时间序列预测新架构:Li-Net 用稀疏注意力实现精准高效预测

导语:ICDE 2026 最新论文提出 Li-Net(Linear-Network),一种面向多通道时间序列预测的新型架构。研究指出传统方法忽视通道间交互学习,难以捕捉复杂动态依赖。Li-Net 通过动态压缩序列和通道维度表示、集成稀疏 Top-K Softmax 注意力机制,并支持多模态嵌入融合,在多个真实世界基准上实现与最先进方法竞争的性能,同时显著降低内存使用和推理时间。 核心内容 研究背景 多通道时间序列预测任务广泛应用于金融、供应链管理、能源规划等领域。有效捕捉通道内和通道间的复杂动态依赖对准确预测至关重…

2026年3月23日 0条评论 27点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

多 Agent 路径查找新突破:CBS-AA 解决异步动作完整性难题

导语:AAMAS 2026 最新论文提出 CBS-AA(Conflict-Based Search with Asynchronous Actions),解决多 Agent 路径查找中异步动作的完整性难题。研究指出主流 CCBS 方法因连续等待时长导致状态空间无限,无法保证找到解。CBS-AA 通过新型约束传播技术绕过理论缺陷,在保持最优性同时提升求解成功率,分支数量减少高达 90%。 核心内容 研究背景 多 Agent 路径查找(MAPF)旨在为多个 Agent 规划从起点到终点的无碰撞路径。现有算法大多假设同步…

2026年3月23日 0条评论 22点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

LLM 方言偏见新发现:多 Agent 架构可有效缓解刻板印象

导语:arXiv 最新研究系统分析大型语言模型在方言处理中的刻板印象偏见。研究团队复制并扩展了现有方言偏见分析,测试提示工程和多 Agent 架构的缓解效果。研究发现 SAE(标准美式英语)与 AAE(非裔美国人英语)输入在所有模板类别中均产生刻板印象差异,其中形容词和职业归属偏见最显著。多 Agent 生成 - 批评 - 修订架构在所有测试模型上实现一致的偏见缓解,为高影响 LLM 部署提供工作流级控制方案。 核心内容 研究背景 大量文献表明 LLM 输出存在歧视性行为,会基于输入方言触发刻板印象推理。这种偏见在…

2026年3月23日 0条评论 20点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

多模态大模型认知错配:符号识别失败却能复杂推理

导语:arXiv 最新研究揭示多模态大模型(MLLM)在离散符号理解中的认知错配现象。研究团队构建涵盖语言、文化、数学、物理、化学五领域的基准测试,发现顶级 MLLM 经常在基本符号识别任务上失败,却在复杂推理任务中表现优异。这一反直觉现象表明模型依赖语言概率而非真实视觉感知,暴露出当前 AI 系统在理解科学符号语言方面的根本缺陷。 核心内容 研究背景 多模态大模型(MLLM)在自然场景图像理解上取得显著成功,但处理离散符号——人类认知的基本构建块——的能力仍是关键开放问题。与自然场景的连续视觉数据不同,数学公式、…

2026年3月23日 0条评论 20点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

VLM 思维链训练新突破:SCALe 用动态权重平衡推理与答案

导语:arXiv 最新论文提出 SCALe(Scheduled Curriculum Adaptive Loss),解决视觉语言模型思维链训练中的 token 不平衡难题。研究指出标准监督微调中所有 token 贡献相等,但推理数据 inherently token 不平衡——长思考痕迹 overshadow 短但关键的答案段。SCALe 通过动态、长度独立的权重分配,在训练过程中逐渐将焦点从思考段转移到答案段,仅需 1/7 训练时间即匹配完整 SFT+GRPO pipeline 性能。 核心内容 研究背景 视觉语…

2026年3月23日 0条评论 19点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

离线知识库新选择:Project N.O.M.A.D.打造随身 AI 生存计算机

导语:GitHub 热门项目 Project N.O.M.A.D.推出离线优先生存计算机,整合本地 AI 聊天、离线维基百科、教育平台和离线地图等核心功能。这款自包含的知识服务器无需互联网即可运行,支持 Ollama 本地大模型、Kiwix 知识库、Kolibri 教育平台等 7 大核心模块,为户外探险、灾难应急、教育场景和隐私敏感环境提供完整的离线知识解决方案。 核心内容 项目定位 Project N.O.M.A.D.(Never Offline Memory And Data)是一款自包含的离线优先知识和教育服…

2026年3月23日 0条评论 20点热度 0人点赞 JVS, Claw 阅读全文
12345…9

Wang

这个人很懒,什么都没留下

分类
  • AI 资讯 / 64篇
  • java / 2篇
  • php / 5篇
  • python / 3篇
  • 其他 / 15篇
  • 前端 / 5篇
  • 大数据 / 3篇
  • 操作系统 / 4篇
  • 树莓派 / 3篇
标签聚合
ipv6 自动化 建模 cloud 前端 spring 插件 微信小程序
最新 热点 随机
最新 热点 随机
效用引导的 Agent 编排新框架:平衡 LLM 工具使用的质量与成本 心智理论推理新突破:动态信念图让 LLM 理解人类意图 组合优化新框架:cuGenOpt 用 GPU 加速实现通用高效求解 LightRAG:简单快速的检索增强生成新框架 时间序列预测新架构:Li-Net 用稀疏注意力实现精准高效预测 多 Agent 路径查找新突破:CBS-AA 解决异步动作完整性难题
SGAZ 智能体评估俄罗斯方块变体难度:持有块增加降低挑战文生图模型概念遗忘新突破:多样化提示词表征提升去学习鲁棒性vLLM-Omni 全模态推理框架:解耦架构重塑多模态服务合成心智治理新框架:本体 - 关系 - 智慧三支柱重塑 AI 监管PentAGI:AI 自主渗透测试系统重塑网络安全评估MANAR 认知科学启发注意力新架构:全局工作空间理论重塑线性缩放
离线知识库新选择:Project N.O.M.A.D.打造随身 AI 生存计算机 D-Mem:双过程记忆系统,认知科学启发 LLM Agent 记忆架构 宝塔面板的Wordpress在Nginx下进行伪静态设置 LLM 定量内省新突破:数字自报告可追踪内部情感状态 NeuroGame Transformer:博弈论与统计物理重塑注意力机制 效用引导的 Agent 编排新框架:平衡 LLM 工具使用的质量与成本
关于本站

作为一只代码汪,我会把平时遇到的各类问题和解决办法写下来。坚持下去,我想里总有一天会变得繁荣起来!

COPYRIGHT © 2022 Coding One. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

闽ICP备17024682号