Coding One

  • java
  • php
  • python
  • 前端
  • 大数据
  • 操作系统
  • 树莓派
  • 其他
Coding One
如果每天只要敲敲代码,那这样一辈子也挺好。
AI 资讯

微软开源语音 AI 新标杆:VibeVoice 实现 60 分钟长音频单次转录

导语:微软开源 VibeVoice 语音 AI 框架,包含 ASR 语音识别和 TTS 语音合成两大模型。VibeVoice-ASR 支持 60 分钟长音频单次处理,生成包含说话人、时间戳和内容的结构化转录,支持 50+ 语言。3 月 29 日最新进展显示,该模型已被社区采用为语音输入法,标志开源语音技术迈向新阶段。 核心内容 VibeVoice 是微软推出的开源前沿语音 AI 模型家族,核心创新在于采用连续语音 token 化器,工作帧率仅 7.5Hz,在保证音频保真度的同时大幅提升长序列处理效率。模型采用 ne…

2026年3月30日 0条评论 3点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

AI 科学家通过同行评审:SakanaAI v2 用树搜索实现自动科学发现

导语:SakanaAI 宣布 AI Scientist-v2 生成的论文首次通过国际顶会 workshop 同行评审。系统自主完成假设生成、实验设计、代码执行、数据分析和论文撰写全流程,使用最佳优先树搜索探索研究空间。提交 ICLR 2025 workshop 的 3 篇论文中 1 篇获得 6.33 平均分,高于接受阈值。这是首个通过标准科学评审的 AI 生成论文,标志自动科学发现迈向新里程碑。 核心内容 研究背景 自动科学研究系统正快速演进,AI 在科学发现中的角色日益关键。SakanaAI 的 AI Scien…

2026年3月29日 0条评论 13点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

Agent 工厂重塑硬件优化:通用编码 agent 无需领域训练实现 8 倍加速

导语:arXiv 最新研究探索通用编码 agent 在硬件高层次综合(HLS)优化中的能力边界。研究提出 Agent 工厂框架,采用两阶段流水线协调多个自主优化 agent:第一阶段分解设计为子 kernel 独立优化并用整数线性规划组装全局配置,第二阶段启动专家 agent 探索跨函数优化。12 个 kernel 评估显示,agent 数量从 1 扩展到 10 实现平均 8.27 倍加速,复杂任务如 streamcluster 超过 20 倍,且无需任何硬件特定训练。 核心内容 研究背景 高层次综合(HLS)旨在…

2026年3月29日 0条评论 20点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

多模态推理一致性新突破:RC2 用循环强化学习实现 7.6 点提升

导语:arXiv 最新论文提出 RC2 框架,解决多模态大模型跨模态矛盾预测难题。研究指出当前 MLLM 对同一内容的视觉和文本表示常给出矛盾答案,现有投票机制会放大系统性偏见。RC2 通过跨模态循环一致性作为无标签奖励信号,要求模型执行反向推理、切换模态、重建答案,形成自监督闭环。3B 和 8B 模型在 6 个基准上提升最多 7.6 点,跨模态预测一致性显著改善。 核心内容 研究背景 多模态大语言模型(MLLM)在文档理解、网页导航、Agent 系统等场景广泛部署,但存在根本性模态间隙:同一网页以截图 vs 原始…

2026年3月29日 0条评论 30点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

LLM 推理安全新突破:实时监控识别 9 类推理漏洞

导语:arXiv 最新论文提出推理安全监控框架,首次将 LLM 安全关注点从输出内容扩展到推理过程本身。研究指出现有安全方案仅检测有害/偏见/错误输出,却忽视推理链的逻辑一致性、计算效率和抗攻击能力。论文定义推理安全概念并提出 9 类不安全推理行为分类体系,涵盖输入解析错误、推理执行错误和流程管理错误。基于此设计的实时监控器在 450 条推理链基准上实现 84.88% 步骤级定位准确率和 85.37% 错误类型分类准确率,显著超越幻觉检测器和流程奖励模型基线。 核心内容 研究背景 大语言模型日益依赖显式思维链(Co…

2026年3月28日 0条评论 36点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

RAG 知识库可训练新突破:WriteBack 用证据蒸馏实现 2.14% 性能提升

导语:arXiv 最新论文提出 WriteBack-RAG 框架,首次将 RAG 知识库视为可训练组件而非静态存储。研究指出传统 RAG 系统知识库一旦构建便不再更新,导致关键信息碎片化埋没在无关内容中。WriteBack-RAG 利用标注样本识别检索成功位置,蒸馏相关文档为紧凑知识单元并回写索引,仅修改语料即可与任意 RAG 流程兼容。四个 RAG 方法、六个基准、两个 LLM 骨干的评估显示平均性能提升 2.14%,跨方法迁移实验证实改进源于语料本身。 核心内容 研究背景 检索增强生成(RAG)系统已成为大模型…

2026年3月28日 0条评论 38点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

跨模型分歧检测 LLM 自信错误:无需标签的训练-free 方案

导语:arXiv 最新论文提出跨模型分歧作为无标签正确性信号,解决大模型自信错误检测难题。研究指出现有方法依赖模型自身不确定性(如 token 熵、置信度),但无法检测最危险的失败模式——模型错误但自信。跨模型分歧通过验证模型对生成答案的惊讶程度判断正确性,仅需单次前向传播无需生成。MMLU 基准上跨模型困惑度 AUROC 达 0.75,超越模型内熵基线 0.59,为生产系统部署监控提供即插即用方案。 核心内容 研究背景 大语言模型在生产环境部署面临关键挑战:如何在无真实标签情况下检测模型何时出错。现有不确定性量化…

2026年3月28日 0条评论 47点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

绿色 AI 推理新框架 EcoThink:能耗降低 40% 无性能损失

导语:arXiv 最新论文提出 EcoThink 框架,解决大模型过度思考导致的能耗浪费问题。研究指出当前 LLM 对所有查询 indiscriminately 应用 Chain-of-Thought 等计算密集型策略,造成算法冗余和碳排放增加。EcoThink 通过轻量级蒸馏路由器动态评估查询复杂度,简单查询跳过不必要推理,复杂查询保留深度计算。9 个基准测试显示平均减少 40.4% 推理能耗(web 知识检索最高 81.9%),无统计显著的性能损失,为可持续包容性 AI 提供可行路径。 核心内容 研究背景 随着…

2026年3月27日 0条评论 47点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

Whisper 转录 90 倍加速:insanely-fast-whisper 用 Flash Attention 重塑语音识别

导语:GitHub 热门项目 insanely-fast-whisper 刷新语音识别效率标杆。这个由社区驱动的 CLI 工具集成 Hugging Face Transformers、Optimum 和 Flash Attention 2 优化,在 Nvidia A100 上实现 150 分钟音频 98 秒转录完成,相比原生 Whisper 大模型 31 分钟提速约 90 倍。项目支持 openai/whisper-large-v3、distil-whisper 等多种模型,提供批处理、Flash Attentio…

2026年3月27日 0条评论 57点热度 0人点赞 JVS, Claw 阅读全文
AI 资讯

OCR 新标杆 Chandra 2:90+ 语言手写表格全搞定,开源模型碾压 GPT-4o

导语:GitHub 最新开源项目 Chandra OCR 2 刷新文档智能技术标杆。这款由 Datalab 推出的 OCR 模型支持 90+ 语言识别,在复杂表格、手写笔记、数学公式和表单还原场景表现卓越。olmocr 基准测试中 Chandra 2 以 85.9 分超越 GPT-4o(69.9 分)和 Gemini Flash 2(63.8 分),多语言性能在德语、法语、西班牙语等主流语言上准确率超 93%。项目采用 Apache 2.0 开源,提供本地 HuggingFace 和远程 vLLM 两种部署模式,让…

2026年3月27日 0条评论 58点热度 0人点赞 JVS, Claw 阅读全文
12345…11

Wang

这个人很懒,什么都没留下

分类
  • AI 资讯 / 82篇
  • java / 2篇
  • php / 5篇
  • python / 3篇
  • 其他 / 15篇
  • 前端 / 5篇
  • 大数据 / 3篇
  • 操作系统 / 4篇
  • 树莓派 / 3篇
标签聚合
ipv6 自动化 建模 cloud 前端 spring 插件 微信小程序
最新 热点 随机
最新 热点 随机
微软开源语音 AI 新标杆:VibeVoice 实现 60 分钟长音频单次转录 AI 科学家通过同行评审:SakanaAI v2 用树搜索实现自动科学发现 Agent 工厂重塑硬件优化:通用编码 agent 无需领域训练实现 8 倍加速 多模态推理一致性新突破:RC2 用循环强化学习实现 7.6 点提升 LLM 推理安全新突破:实时监控识别 9 类推理漏洞 RAG 知识库可训练新突破:WriteBack 用证据蒸馏实现 2.14% 性能提升
SGAZ 智能体评估俄罗斯方块变体难度:持有块增加降低挑战文生图模型概念遗忘新突破:多样化提示词表征提升去学习鲁棒性vLLM-Omni 全模态推理框架:解耦架构重塑多模态服务合成心智治理新框架:本体 - 关系 - 智慧三支柱重塑 AI 监管PentAGI:AI 自主渗透测试系统重塑网络安全评估MANAR 认知科学启发注意力新架构:全局工作空间理论重塑线性缩放
Docker可用国内加速镜像地址分享 效用引导的 Agent 编排新框架:平衡 LLM 工具使用的质量与成本 踩坑归来,经验贴!成功完成 Hoppscotch 的 Docker 部署! dTRPO:扩散 LLM 策略优化新突破,STEM 任务提升 9.6% OpenAI 公开模型行为规范:指令链框架重塑 AI 对齐透明度 因果推理新突破:结构最终模型可检测 AI 代理意图
关于本站

作为一只代码汪,我会把平时遇到的各类问题和解决办法写下来。坚持下去,我想里总有一天会变得繁荣起来!

COPYRIGHT © 2022 Coding One. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

闽ICP备17024682号