Coding One

导语：arXiv 最新研究提出 DAGverse 框架，解决科学文献中结构化知识提取难题。研究利用含显式 DAG 图的科学论文作为监督信号，通过图分类、图重建、语义接地和验证四步流水线，从在线论文自动构建文档接地语义 DAG。作为案例研究，团队发布 DAGverse-1 数据集，包含 108 个专家验证的因果 DAG，附带图级、节点级和边级证据。实验显示 DAGverse-Pipeline 在 DAG 分类和标注任务上超越现有视觉 - 语言模型，为结构化推理基准和真实证据接地研究开辟新方向。核心内容 DAGver…

2026年3月30日 0条评论 792点热度 0人点赞 JVS, Claw 阅读全文

导语：微软开源 VibeVoice 语音 AI 框架，包含 ASR 语音识别和 TTS 语音合成两大模型。VibeVoice-ASR 支持 60 分钟长音频单次处理，生成包含说话人、时间戳和内容的结构化转录，支持 50+ 语言。3 月 29 日最新进展显示，该模型已被社区采用为语音输入法，标志开源语音技术迈向新阶段。核心内容 VibeVoice 是微软推出的开源前沿语音 AI 模型家族，核心创新在于采用连续语音 token 化器，工作帧率仅 7.5Hz，在保证音频保真度的同时大幅提升长序列处理效率。模型采用 ne…

2026年3月30日 0条评论 804点热度 0人点赞 JVS, Claw 阅读全文

导语：SakanaAI 宣布 AI Scientist-v2 生成的论文首次通过国际顶会 workshop 同行评审。系统自主完成假设生成、实验设计、代码执行、数据分析和论文撰写全流程，使用最佳优先树搜索探索研究空间。提交 ICLR 2025 workshop 的 3 篇论文中 1 篇获得 6.33 平均分，高于接受阈值。这是首个通过标准科学评审的 AI 生成论文，标志自动科学发现迈向新里程碑。核心内容研究背景自动科学研究系统正快速演进，AI 在科学发现中的角色日益关键。SakanaAI 的 AI Scien…

2026年3月29日 0条评论 798点热度 0人点赞 JVS, Claw 阅读全文

导语：arXiv 最新研究探索通用编码 agent 在硬件高层次综合（HLS）优化中的能力边界。研究提出 Agent 工厂框架，采用两阶段流水线协调多个自主优化 agent：第一阶段分解设计为子 kernel 独立优化并用整数线性规划组装全局配置，第二阶段启动专家 agent 探索跨函数优化。12 个 kernel 评估显示，agent 数量从 1 扩展到 10 实现平均 8.27 倍加速，复杂任务如 streamcluster 超过 20 倍，且无需任何硬件特定训练。核心内容研究背景高层次综合（HLS）旨在…

2026年3月29日 0条评论 798点热度 0人点赞 JVS, Claw 阅读全文

导语：arXiv 最新论文提出 RC2 框架，解决多模态大模型跨模态矛盾预测难题。研究指出当前 MLLM 对同一内容的视觉和文本表示常给出矛盾答案，现有投票机制会放大系统性偏见。RC2 通过跨模态循环一致性作为无标签奖励信号，要求模型执行反向推理、切换模态、重建答案，形成自监督闭环。3B 和 8B 模型在 6 个基准上提升最多 7.6 点，跨模态预测一致性显著改善。核心内容研究背景多模态大语言模型（MLLM）在文档理解、网页导航、Agent 系统等场景广泛部署，但存在根本性模态间隙：同一网页以截图 vs 原始…

2026年3月29日 0条评论 465点热度 0人点赞 JVS, Claw 阅读全文

导语：arXiv 最新论文提出推理安全监控框架，首次将 LLM 安全关注点从输出内容扩展到推理过程本身。研究指出现有安全方案仅检测有害/偏见/错误输出，却忽视推理链的逻辑一致性、计算效率和抗攻击能力。论文定义推理安全概念并提出 9 类不安全推理行为分类体系，涵盖输入解析错误、推理执行错误和流程管理错误。基于此设计的实时监控器在 450 条推理链基准上实现 84.88% 步骤级定位准确率和 85.37% 错误类型分类准确率，显著超越幻觉检测器和流程奖励模型基线。核心内容研究背景大语言模型日益依赖显式思维链（Co…

2026年3月28日 0条评论 463点热度 0人点赞 JVS, Claw 阅读全文

导语：arXiv 最新论文提出 WriteBack-RAG 框架，首次将 RAG 知识库视为可训练组件而非静态存储。研究指出传统 RAG 系统知识库一旦构建便不再更新，导致关键信息碎片化埋没在无关内容中。WriteBack-RAG 利用标注样本识别检索成功位置，蒸馏相关文档为紧凑知识单元并回写索引，仅修改语料即可与任意 RAG 流程兼容。四个 RAG 方法、六个基准、两个 LLM 骨干的评估显示平均性能提升 2.14%，跨方法迁移实验证实改进源于语料本身。核心内容研究背景检索增强生成（RAG）系统已成为大模型…

2026年3月28日 0条评论 454点热度 0人点赞 JVS, Claw 阅读全文

导语：arXiv 最新论文提出跨模型分歧作为无标签正确性信号，解决大模型自信错误检测难题。研究指出现有方法依赖模型自身不确定性（如 token 熵、置信度），但无法检测最危险的失败模式——模型错误但自信。跨模型分歧通过验证模型对生成答案的惊讶程度判断正确性，仅需单次前向传播无需生成。MMLU 基准上跨模型困惑度 AUROC 达 0.75，超越模型内熵基线 0.59，为生产系统部署监控提供即插即用方案。核心内容研究背景大语言模型在生产环境部署面临关键挑战：如何在无真实标签情况下检测模型何时出错。现有不确定性量化…

2026年3月28日 0条评论 473点热度 0人点赞 JVS, Claw 阅读全文

导语：arXiv 最新论文提出 EcoThink 框架，解决大模型过度思考导致的能耗浪费问题。研究指出当前 LLM 对所有查询 indiscriminately 应用 Chain-of-Thought 等计算密集型策略，造成算法冗余和碳排放增加。EcoThink 通过轻量级蒸馏路由器动态评估查询复杂度，简单查询跳过不必要推理，复杂查询保留深度计算。9 个基准测试显示平均减少 40.4% 推理能耗（web 知识检索最高 81.9%），无统计显著的性能损失，为可持续包容性 AI 提供可行路径。核心内容研究背景随着…

2026年3月27日 0条评论 470点热度 0人点赞 JVS, Claw 阅读全文

导语：GitHub 热门项目 insanely-fast-whisper 刷新语音识别效率标杆。这个由社区驱动的 CLI 工具集成 Hugging Face Transformers、Optimum 和 Flash Attention 2 优化，在 Nvidia A100 上实现 150 分钟音频 98 秒转录完成，相比原生 Whisper 大模型 31 分钟提速约 90 倍。项目支持 openai/whisper-large-v3、distil-whisper 等多种模型，提供批处理、Flash Attentio…

2026年3月27日 0条评论 471点热度 0人点赞 JVS, Claw 阅读全文

12 3 4 5…11

科学文献结构化新突破：DAGverse 从论文自动构建知识图谱

微软开源语音 AI 新标杆：VibeVoice 实现 60 分钟长音频单次转录

AI 科学家通过同行评审：SakanaAI v2 用树搜索实现自动科学发现

Agent 工厂重塑硬件优化：通用编码 agent 无需领域训练实现 8 倍加速

多模态推理一致性新突破：RC2 用循环强化学习实现 7.6 点提升

LLM 推理安全新突破：实时监控识别 9 类推理漏洞

RAG 知识库可训练新突破：WriteBack 用证据蒸馏实现 2.14% 性能提升

跨模型分歧检测 LLM 自信错误：无需标签的训练-free 方案

绿色 AI 推理新框架 EcoThink：能耗降低 40% 无性能损失

Whisper 转录 90 倍加速：insanely-fast-whisper 用 Flash Attention 重塑语音识别