小米MiMo推理速度突破1000 tokens/s

脑机接口企业博睿康完成IPO辅导

途虎养车接入微信AI Agent

海南商业航天目标2030年500亿元营收。宏观数据持续向好

外贸增长15.3%

港口物流指数创年内新高。Claude Code推出动态工作流编排子代理

AdaCoM实现长任务上下文四倍压缩

Search-as-Code成搜索新范式。算力股集体走强

AI应用加速落地

具身智能与多模态进入产品化阶段。

2026-06-09 AI 日报

查看完整日报 →
今日科技圈最受关注的是小米MiMo推理速度突破1000 tokens/s——在不降低模型能力的前提下,仅用通用GPU即可达成,这一工程突破让端侧AI推理进入实用阶段。与此同时,博睿康完成脑机接口IPO辅导标志着国内神经接口赛道正式进入上市通道,资本开始系统性布局人机融合赛道。途虎养车接入微信AI Agent则意味着AI大模型在汽车后市场这一垂直场景首次完成商业化闭环。宏观层面,外贸数据延续高增长态势(+15.3%),港口物流指数创年内新高,多项先行指标显示经济稳中向好。海南商业航天2030年500亿元目标出炉,标志着商业航天正式进入地方规划体系。Claude Code的动态工作流与Perplexity的Search-as-Code继续推动AI从"工具"向"执行体"的进化,底层基础设施与产品化应用正同步加速。 事件:6月8日晚,小米MiMo技术团队正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。通过对模型推理系统全链路工程能力优化,在不降低模型能力前提下,首次将推理速度提升至1000 tokens/s,且无需定制芯片,只使用通用GPU即可达成。 🔗 https://36kr.com/newsflashes/3845358573144581 我的分析:1000 tokens/s是一个关键门槛——这意味着AI助手的响应延迟将低于人类阅读速度(约300-500 tokens/min),交互体验从"等待"变为"即时"。更值得关注的是"通用GPU即可达成"这一描述:当前主流AI推理依赖高端GPU(H100/A100),成本极高;而通过算法和系统工程优化实现的加速,意味着推理成本将大幅下降,这可能重构AI云服务的定价体系。对开发者而言,这意味着端侧部署AI应用的可行性大幅提升——未来在消费级硬件上跑70B参数的模型可能成为常态,而非需要专业服务器集群。小米在AI推理工程化上的突破,也预示着手机和PC厂商将成为AI基础设施的重要玩家。 事件:Claude Code引入"Dynamic Workflows"能力,由Claude为复杂任务自动生成JavaScript工作流脚本,后台调度数十到上百个子代理协同工作。适合代码库审计、大规模迁移、交叉验证研究等高复杂度任务,通过/deep-research或ultracode模式触发。
阅读完整日报 →