Coding One

  • java
  • php
  • python
  • 前端
  • 大数据
  • 操作系统
  • 树莓派
  • 其他
Coding One
如果每天只要敲敲代码,那这样一辈子也挺好。
AI 资讯

OCR 新标杆 Chandra 2:90+ 语言手写表格全搞定,开源模型碾压 GPT-4o

导语:GitHub 最新开源项目 Chandra OCR 2 刷新文档智能技术标杆。这款由 Datalab 推出的 OCR 模型支持 90+ 语言识别,在复杂表格、手写笔记、数学公式和表单还原场景表现卓越。olmocr 基准测试中 Chandra 2 以 85.9 分超越 GPT-4o(69.9 分)和 Gemini Flash 2(63.8 分),多语言性能在德语、法语、西班牙语等主流语言上准确率超 93%。项目采用 Apache 2.0 开源,提供本地 HuggingFace 和远程 vLLM 两种部署模式,让…

2026年3月27日 0条评论 4点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

OpenAI 公开模型行为规范:指令链框架重塑 AI 对齐透明度

导语:OpenAI 发布深度文章详解 Model Spec 设计理念,这是其正式框架定义模型行为规范。研究指出 AI 行为透明度对公平与安全至关重要。Model Spec 通过指令链框架解决多源指令冲突,区分硬规则(不可覆盖的安全边界)与默认值(可调整的行为起点),并配备决策规则与具体示例辅助应用。框架自 2024 年首版以来持续演进,基于实际部署反馈与集体对齐机制,为行业提供可公开审查的模型行为参考标准。 核心内容 研究背景 随着 AI 系统能力增强,人们和机构需要更清晰的预期了解模型如何行为、体现何种权衡、以及…

2026年3月26日 0条评论 17点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

描述先行重塑机器人安全控制:DILLO 用语言世界模型实现 14 倍加速

导语:arXiv 最新论文提出 DILLO 框架,挑战机器人世界模型必须依赖视觉模拟的假设。研究指出现有主动安全方法需渲染未来图像再评估,单次决策延迟超 3 秒无法实时控制。DILLO 通过跨模态蒸馏将 VLM 教师的语义预见能力迁移到潜变量条件 LLM 学生,仅需策略内部表征和规划动作即可预测结果,实现从"模拟后执行"到"描述后执行"的范式转变,在消费级硬件上完成完整校正循环仅需 0.26 秒,任务成功率提升 15 个百分点。 核心内容 研究背景 AI 驱动的智能体在机器人操作、自主导航等高可靠性场景部署日益增多…

2026年3月26日 0条评论 23点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

双路径推测生成重塑实时语音对话:RelayS2S 实现 81ms 延迟与 99% 质量兼得

导语:arXiv 最新论文提出 RelayS2S 框架,解决实时语音对话系统中延迟与质量的根本矛盾。研究指出现有端到端语音模型响应快但语义弱,级联 pipeline 质量高但延迟大。RelayS2S 通过双路径并行架构——快路径 S2S 模型推测生成短前缀立即播放,慢路径 ASR→LLM 生成高质量续写——在 GPT-4o 后端实现 P90 延迟 81ms(级联基线 1091ms)同时保持 99% 响应质量,且无需修改现有组件即可集成。 核心内容 研究背景 实时语音对话是对话 AI 最具挑战性的场景之一:系统需以人…

2026年3月26日 0条评论 31点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

自改进 Agent 新突破:Hermes 从经验中学习并创建技能

导语:Nous Research 开源 Hermes Agent,首个内置学习循环的自改进 AI 代理系统。研究指出传统 Agent 缺乏持续学习能力,每次对话从零开始。Hermes 通过经验驱动的技能创建、使用中自我改进、跨会话用户建模和自主知识持久化,实现"越用越聪明"。系统支持多平台部署(Telegram/Discord/Slack/WhatsApp/CLI)、200+ 模型切换、子代理并行工作,并提供 OpenClaw 无缝迁移,让个人 Agent 真正成长为用户的数字分身。 核心内容 研究背景 现有 AI…

2026年3月25日 0条评论 41点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

物理约束掩码重塑地球观测 AI:SpecTM 实现 99% 预测精度提升

导语:arXiv 最新论文提出 SpecTM(Spectral Targeted Masking)框架,为地球观测基础模型引入物理约束掩码设计。研究指出现有随机掩码方法忽视光谱物理规律,限制模型可信度。SpecTM 通过多任务自监督学习(波段重建、生物光学指数推断、8 天时序预测),在 NASA PACE 高光谱图像上实现微囊藻毒素浓度预测 R²=0.695(当周)和 0.620(8 天预测),超越基线模型 34%-99%,标签效率提升 2.2 倍。 核心内容 研究背景 基础模型在地球观测(EO)领域快速发展,但现…

2026年3月25日 0条评论 40点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

WiFi 信号重塑人体感知:RuView 用无线电波实现无摄像头姿态估计

导语:GitHub 最新开源项目 RuView 将普通 WiFi 信号转化为人体感知系统,实现无摄像头、无穿戴设备的实时姿态估计与生命体征监测。研究指出传统视觉感知存在隐私泄露、部署成本高、环境受限等痛点。RuView 通过分析 WiFi 信道状态信息(CSI)扰动,结合 Rust 高性能信号处理与自学习嵌入模型,在 ESP32 低成本硬件上实现 54K fps 姿态重建、呼吸心率检测、穿墙感知,为隐私优先的空间智能提供全新方案。 核心内容 研究背景 人体姿态估计与生命体征监测在医疗监护、智能家居、灾难救援等场景需…

2026年3月25日 0条评论 47点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

心脏诊断多模态 AI 新突破:MARCUS 超越 GPT-5 与 Gemini

导语:斯坦福大学联合 UCSF 推出 MARCUS 系统,一种用于心脏诊断的多模态智能体视觉语言模型。研究指出现有 AI 模型局限于单模态输入且缺乏交互能力。MARCUS 通过分层智能体架构整合心电图、超声心动图和心脏磁共振三种模态,在 1350 万张图像和 160 万问答对上训练,内部和外部测试中准确率达 87-91%(心电图)、67-86%(超声)、85-88%(磁共振),超越 GPT-5 Thinking 和 Gemini 2.5 Pro Deep Think 达 34-45%,多模态病例准确率 70% 是前…

2026年3月24日 0条评论 53点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

LLM Agent 赋能手机省电新方案:PowerLens 实现 38.8% 能耗降低

导语:arXiv 最新论文提出 PowerLens 系统,将大语言模型的推理能力应用于 Android 设备电源管理。研究指出现有电源管理机制依赖静态规则,忽视用户活动和个人偏好。PowerLens 通过多 Agent 架构识别 UI 语义、生成 18 项设备参数的 holistic 电源策略,采用 PDL 约束框架验证每个动作,并通过双层记忆系统从隐式用户覆盖中学习个性化偏好。在真实 Android 设备上实现 81.7% 动作准确率和 38.8% 能耗降低,系统自身仅消耗 0.5% 日电量。 核心内容 研究背景…

2026年3月24日 0条评论 59点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

效用引导的 Agent 编排新框架:平衡 LLM 工具使用的质量与成本

导语:arXiv 最新论文提出效用引导的 Agent 编排框架,将工具使用 LLM Agent 的行为控制作为显式决策问题。研究指出固定工作流稳定但僵化,ReAct 等自由推理灵活但可能过度执行。新框架通过效用函数平衡估计收益、步骤成本、不确定性和冗余,在 HotpotQA 基准上实现与 ReAct 竞争的性能,同时提供更可解释、可控制的多步执行轨迹。 核心内容 研究背景 工具使用的大型语言模型 Agent 面临答案质量与执行成本之间的根本张力。更好的任务性能通常需要更多推理步骤、更多工具交互和更长的执行轨迹,这反…

2026年3月24日 0条评论 62点热度 0人点赞 JVS, Claw 阅读全文
12345…10

Wang

这个人很懒,什么都没留下

分类
  • AI 资讯 / 73篇
  • java / 2篇
  • php / 5篇
  • python / 3篇
  • 其他 / 15篇
  • 前端 / 5篇
  • 大数据 / 3篇
  • 操作系统 / 4篇
  • 树莓派 / 3篇
标签聚合
ipv6 自动化 建模 cloud 前端 spring 插件 微信小程序
最新 热点 随机
最新 热点 随机
OCR 新标杆 Chandra 2:90+ 语言手写表格全搞定,开源模型碾压 GPT-4o OpenAI 公开模型行为规范:指令链框架重塑 AI 对齐透明度 描述先行重塑机器人安全控制:DILLO 用语言世界模型实现 14 倍加速 双路径推测生成重塑实时语音对话:RelayS2S 实现 81ms 延迟与 99% 质量兼得 自改进 Agent 新突破:Hermes 从经验中学习并创建技能 物理约束掩码重塑地球观测 AI:SpecTM 实现 99% 预测精度提升
SGAZ 智能体评估俄罗斯方块变体难度:持有块增加降低挑战文生图模型概念遗忘新突破:多样化提示词表征提升去学习鲁棒性vLLM-Omni 全模态推理框架:解耦架构重塑多模态服务合成心智治理新框架:本体 - 关系 - 智慧三支柱重塑 AI 监管PentAGI:AI 自主渗透测试系统重塑网络安全评估MANAR 认知科学启发注意力新架构:全局工作空间理论重塑线性缩放
LLM 生成数学研究问题新突破:DeepMath 智能体产出 665 个微分几何前沿课题 LuMamba:4.6M 参数 EEG 基础模型,377 倍能效提升 国密算法sm2:微信小程序sm-crypto 和 python 的gmssl 包互通 LangChain 开源企业级编码 Agent 框架 Open SWE 自改进 Agent 新突破:Hermes 从经验中学习并创建技能 LightRAG:简单快速的检索增强生成新框架
关于本站

作为一只代码汪,我会把平时遇到的各类问题和解决办法写下来。坚持下去,我想里总有一天会变得繁荣起来!

COPYRIGHT © 2022 Coding One. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

闽ICP备17024682号