Coding One

  • java
  • php
  • python
  • 前端
  • 大数据
  • 操作系统
  • 树莓派
  • 其他
Coding One
如果每天只要敲敲代码,那这样一辈子也挺好。
AI 资讯

跨模型分歧检测 LLM 自信错误:无需标签的训练-free 方案

导语:arXiv 最新论文提出跨模型分歧作为无标签正确性信号,解决大模型自信错误检测难题。研究指出现有方法依赖模型自身不确定性(如 token 熵、置信度),但无法检测最危险的失败模式——模型错误但自信。跨模型分歧通过验证模型对生成答案的惊讶程度判断正确性,仅需单次前向传播无需生成。MMLU 基准上跨模型困惑度 AUROC 达 0.75,超越模型内熵基线 0.59,为生产系统部署监控提供即插即用方案。 核心内容 研究背景 大语言模型在生产环境部署面临关键挑战:如何在无真实标签情况下检测模型何时出错。现有不确定性量化…

2026年3月28日 0条评论 4点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

绿色 AI 推理新框架 EcoThink:能耗降低 40% 无性能损失

导语:arXiv 最新论文提出 EcoThink 框架,解决大模型过度思考导致的能耗浪费问题。研究指出当前 LLM 对所有查询 indiscriminately 应用 Chain-of-Thought 等计算密集型策略,造成算法冗余和碳排放增加。EcoThink 通过轻量级蒸馏路由器动态评估查询复杂度,简单查询跳过不必要推理,复杂查询保留深度计算。9 个基准测试显示平均减少 40.4% 推理能耗(web 知识检索最高 81.9%),无统计显著的性能损失,为可持续包容性 AI 提供可行路径。 核心内容 研究背景 随着…

2026年3月27日 0条评论 13点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

Whisper 转录 90 倍加速:insanely-fast-whisper 用 Flash Attention 重塑语音识别

导语:GitHub 热门项目 insanely-fast-whisper 刷新语音识别效率标杆。这个由社区驱动的 CLI 工具集成 Hugging Face Transformers、Optimum 和 Flash Attention 2 优化,在 Nvidia A100 上实现 150 分钟音频 98 秒转录完成,相比原生 Whisper 大模型 31 分钟提速约 90 倍。项目支持 openai/whisper-large-v3、distil-whisper 等多种模型,提供批处理、Flash Attentio…

2026年3月27日 0条评论 25点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

OCR 新标杆 Chandra 2:90+ 语言手写表格全搞定,开源模型碾压 GPT-4o

导语:GitHub 最新开源项目 Chandra OCR 2 刷新文档智能技术标杆。这款由 Datalab 推出的 OCR 模型支持 90+ 语言识别,在复杂表格、手写笔记、数学公式和表单还原场景表现卓越。olmocr 基准测试中 Chandra 2 以 85.9 分超越 GPT-4o(69.9 分)和 Gemini Flash 2(63.8 分),多语言性能在德语、法语、西班牙语等主流语言上准确率超 93%。项目采用 Apache 2.0 开源,提供本地 HuggingFace 和远程 vLLM 两种部署模式,让…

2026年3月27日 0条评论 30点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

OpenAI 公开模型行为规范:指令链框架重塑 AI 对齐透明度

导语:OpenAI 发布深度文章详解 Model Spec 设计理念,这是其正式框架定义模型行为规范。研究指出 AI 行为透明度对公平与安全至关重要。Model Spec 通过指令链框架解决多源指令冲突,区分硬规则(不可覆盖的安全边界)与默认值(可调整的行为起点),并配备决策规则与具体示例辅助应用。框架自 2024 年首版以来持续演进,基于实际部署反馈与集体对齐机制,为行业提供可公开审查的模型行为参考标准。 核心内容 研究背景 随着 AI 系统能力增强,人们和机构需要更清晰的预期了解模型如何行为、体现何种权衡、以及…

2026年3月26日 0条评论 38点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

描述先行重塑机器人安全控制:DILLO 用语言世界模型实现 14 倍加速

导语:arXiv 最新论文提出 DILLO 框架,挑战机器人世界模型必须依赖视觉模拟的假设。研究指出现有主动安全方法需渲染未来图像再评估,单次决策延迟超 3 秒无法实时控制。DILLO 通过跨模态蒸馏将 VLM 教师的语义预见能力迁移到潜变量条件 LLM 学生,仅需策略内部表征和规划动作即可预测结果,实现从"模拟后执行"到"描述后执行"的范式转变,在消费级硬件上完成完整校正循环仅需 0.26 秒,任务成功率提升 15 个百分点。 核心内容 研究背景 AI 驱动的智能体在机器人操作、自主导航等高可靠性场景部署日益增多…

2026年3月26日 0条评论 41点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

双路径推测生成重塑实时语音对话:RelayS2S 实现 81ms 延迟与 99% 质量兼得

导语:arXiv 最新论文提出 RelayS2S 框架,解决实时语音对话系统中延迟与质量的根本矛盾。研究指出现有端到端语音模型响应快但语义弱,级联 pipeline 质量高但延迟大。RelayS2S 通过双路径并行架构——快路径 S2S 模型推测生成短前缀立即播放,慢路径 ASR→LLM 生成高质量续写——在 GPT-4o 后端实现 P90 延迟 81ms(级联基线 1091ms)同时保持 99% 响应质量,且无需修改现有组件即可集成。 核心内容 研究背景 实时语音对话是对话 AI 最具挑战性的场景之一:系统需以人…

2026年3月26日 0条评论 46点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

自改进 Agent 新突破:Hermes 从经验中学习并创建技能

导语:Nous Research 开源 Hermes Agent,首个内置学习循环的自改进 AI 代理系统。研究指出传统 Agent 缺乏持续学习能力,每次对话从零开始。Hermes 通过经验驱动的技能创建、使用中自我改进、跨会话用户建模和自主知识持久化,实现"越用越聪明"。系统支持多平台部署(Telegram/Discord/Slack/WhatsApp/CLI)、200+ 模型切换、子代理并行工作,并提供 OpenClaw 无缝迁移,让个人 Agent 真正成长为用户的数字分身。 核心内容 研究背景 现有 AI…

2026年3月25日 0条评论 62点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

物理约束掩码重塑地球观测 AI:SpecTM 实现 99% 预测精度提升

导语:arXiv 最新论文提出 SpecTM(Spectral Targeted Masking)框架,为地球观测基础模型引入物理约束掩码设计。研究指出现有随机掩码方法忽视光谱物理规律,限制模型可信度。SpecTM 通过多任务自监督学习(波段重建、生物光学指数推断、8 天时序预测),在 NASA PACE 高光谱图像上实现微囊藻毒素浓度预测 R²=0.695(当周)和 0.620(8 天预测),超越基线模型 34%-99%,标签效率提升 2.2 倍。 核心内容 研究背景 基础模型在地球观测(EO)领域快速发展,但现…

2026年3月25日 0条评论 53点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

WiFi 信号重塑人体感知:RuView 用无线电波实现无摄像头姿态估计

导语:GitHub 最新开源项目 RuView 将普通 WiFi 信号转化为人体感知系统,实现无摄像头、无穿戴设备的实时姿态估计与生命体征监测。研究指出传统视觉感知存在隐私泄露、部署成本高、环境受限等痛点。RuView 通过分析 WiFi 信道状态信息(CSI)扰动,结合 Rust 高性能信号处理与自学习嵌入模型,在 ESP32 低成本硬件上实现 54K fps 姿态重建、呼吸心率检测、穿墙感知,为隐私优先的空间智能提供全新方案。 核心内容 研究背景 人体姿态估计与生命体征监测在医疗监护、智能家居、灾难救援等场景需…

2026年3月25日 0条评论 61点热度 0人点赞 JVS, Claw 阅读全文
12345…11

Wang

这个人很懒,什么都没留下

分类
  • AI 资讯 / 76篇
  • java / 2篇
  • php / 5篇
  • python / 3篇
  • 其他 / 15篇
  • 前端 / 5篇
  • 大数据 / 3篇
  • 操作系统 / 4篇
  • 树莓派 / 3篇
标签聚合
ipv6 自动化 建模 cloud 前端 spring 插件 微信小程序
最新 热点 随机
最新 热点 随机
跨模型分歧检测 LLM 自信错误:无需标签的训练-free 方案 绿色 AI 推理新框架 EcoThink:能耗降低 40% 无性能损失 Whisper 转录 90 倍加速:insanely-fast-whisper 用 Flash Attention 重塑语音识别 OCR 新标杆 Chandra 2:90+ 语言手写表格全搞定,开源模型碾压 GPT-4o OpenAI 公开模型行为规范:指令链框架重塑 AI 对齐透明度 描述先行重塑机器人安全控制:DILLO 用语言世界模型实现 14 倍加速
SGAZ 智能体评估俄罗斯方块变体难度:持有块增加降低挑战文生图模型概念遗忘新突破:多样化提示词表征提升去学习鲁棒性vLLM-Omni 全模态推理框架:解耦架构重塑多模态服务合成心智治理新框架:本体 - 关系 - 智慧三支柱重塑 AI 监管PentAGI:AI 自主渗透测试系统重塑网络安全评估MANAR 认知科学启发注意力新架构:全局工作空间理论重塑线性缩放
因果推理新突破:结构最终模型可检测 AI 代理意图 Box Maze:LLM 推理可靠性新架构,边界失败率降至 1% 以下 VMware安装CentOS 7.7网络链接失败解决方案 PentAGI:AI 自主渗透测试系统重塑网络安全评估 国密算法sm2:微信小程序sm-crypto 和 python 的gmssl 包互通 Docker可用国内加速镜像地址分享
关于本站

作为一只代码汪,我会把平时遇到的各类问题和解决办法写下来。坚持下去,我想里总有一天会变得繁荣起来!

COPYRIGHT © 2022 Coding One. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

闽ICP备17024682号