← 返回日报列表

2026-06-09 AI 日报

小米MiMo推理速度突破1000 tokens/s,脑机接口企业博睿康完成IPO辅导,途虎养车接入微信AI Agent,海南商业航天目标2030年500亿元营收。宏观数据持续向好,外贸增长15.3%,港口物流指数创年内新高。Claude Code推出动态工作流编排子代理,AdaCoM实现长任务上下文四倍压缩,Search-as-Code成搜索新范式。算力股集体走强,AI应用加速落地,具身智能与多模态进入产品化阶段。

📋 今日要闻速览

今日科技圈最受关注的是小米MiMo推理速度突破1000 tokens/s——在不降低模型能力的前提下,仅用通用GPU即可达成,这一工程突破让端侧AI推理进入实用阶段。与此同时,博睿康完成脑机接口IPO辅导标志着国内神经接口赛道正式进入上市通道,资本开始系统性布局人机融合赛道。途虎养车接入微信AI Agent则意味着AI大模型在汽车后市场这一垂直场景首次完成商业化闭环。宏观层面,外贸数据延续高增长态势(+15.3%),港口物流指数创年内新高,多项先行指标显示经济稳中向好。海南商业航天2030年500亿元目标出炉,标志着商业航天正式进入地方规划体系。Claude Code的动态工作流与Perplexity的Search-as-Code继续推动AI从"工具"向"执行体"的进化,底层基础设施与产品化应用正同步加速。

🤖 AI 前沿

1. 小米MiMo-V2.5-Pro-UltraSpeed发布,通用GPU推理速度首次突破1000 tokens/s

事件:6月8日晚,小米MiMo技术团队正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。通过对模型推理系统全链路工程能力优化,在不降低模型能力前提下,首次将推理速度提升至1000 tokens/s,且无需定制芯片,只使用通用GPU即可达成。

🔗 https://36kr.com/newsflashes/3845358573144581

我的分析:1000 tokens/s是一个关键门槛——这意味着AI助手的响应延迟将低于人类阅读速度(约300-500 tokens/min),交互体验从"等待"变为"即时"。更值得关注的是"通用GPU即可达成"这一描述:当前主流AI推理依赖高端GPU(H100/A100),成本极高;而通过算法和系统工程优化实现的加速,意味着推理成本将大幅下降,这可能重构AI云服务的定价体系。对开发者而言,这意味着端侧部署AI应用的可行性大幅提升——未来在消费级硬件上跑70B参数的模型可能成为常态,而非需要专业服务器集群。小米在AI推理工程化上的突破,也预示着手机和PC厂商将成为AI基础设施的重要玩家。


2. Claude Code推出Dynamic Workflows,实现大规模子代理编排

事件:Claude Code引入"Dynamic Workflows"能力,由Claude为复杂任务自动生成JavaScript工作流脚本,后台调度数十到上百个子代理协同工作。适合代码库审计、大规模迁移、交叉验证研究等高复杂度任务,通过/deep-researchultracode模式触发。

🔗 https://lumina.shawnxie.top/article/orchestrate-subagents-at-scale-with-dynamic-56b4ef2c

我的分析:Dynamic Workflows的本质是将"多代理协作"从概念验证推向生产级工具。以往多代理系统的挑战在于:代理间的协调依赖人工编排,且结果不可复现。Claude的方案让AI自己生成工作流脚本,既解决了协调问题,又让整个流程可保存、可复用。关键约束(单次最多1000代理、并发16个)也反映了工程上的现实考量——并非无限扩张。对程序员而言,这意味着未来大型代码库的审查、重构和迁移可以交给AI协作完成,人工介入从"执行者"变成"审批者和设计者"。但需要注意的是,tokens消耗会显著增加——在成本敏感的场景下需要权衡使用。


3. AdaCoM:长周期任务的上下文自适应压缩,实现四倍无损压缩

事件:AdaCoM通过外部小型LLM为冻结Agent学习上下文删改、合并与压缩策略,在不训练闭源Agent的前提下缓解长任务中的上下文退化。实验显示网页搜索任务平均相对提升39.0%,深度研究中Kimi和DeepSeek分别提升9.0%和22.3%。

🔗 https://lumina.shawnxie.top/article/mian-xiang-chang-zhou-qi-ren-wu-de-gua-pei-zhi-fd262e59

我的分析:上下文退化是长周期Agent的核心痛点:当任务持续数十轮对话后,模型的"注意力"会逐渐分散,关键信息被稀释。AdaCoM的核心创新是"用小模型压缩大模型上下文"——不需要重新训练,不依赖特定模型,只需学习何时删、何时合并、何时压缩。实验结果很有意思:强Agent(如GPT-4)适合保留较长上下文,弱Agent则需要更激进的压缩策略。这说明模型能力与上下文策略需要匹配——未来可能需要对不同能力的模型使用不同的上下文管理方案。这一技术对构建真正"长期记忆"的AI助手至关重要,也是具身智能走向实用的基础能力。


4. Perplexity首发Search-as-Code架构,搜索进入可编程时代

事件:Perplexity推出"Search-as-Code"架构,将搜索栈拆分为可由模型生成代码调用的SDK原语,在安全沙箱中完成检索、排序、过滤、并行和聚合,使智能体能动态构建搜索流程。评测显示在五项基准中四项领先,WANDR领先次优系统2.5倍。

🔗 https://lumina.shawnxie.top/article/rethinking-search-as-code-generation-5dc703ae

我的分析:Search-as-Code的颠覆性在于:搜索不再是"查询-返回链接",而是"查询-生成代码-执行-返回结果"。这意味着AI不再只是帮你找答案,而是帮你写代码来找到答案。对复杂研究任务而言,这意味着AI可以自动构建多步骤的搜索管道——先搜论文、再搜代码、再搜评测数据——而不需要人工逐步干预。WANDR领先2.5倍的数字值得关注:在AI搜索竞争白热化的当下,任何一个数量级的差距都会快速改变用户选择。这一架构也带来了新的安全考量:AI生成的搜索代码在沙箱中执行,如果被恶意利用,可能成为信息提取的攻击向量。安全设计将是这一架构能否普及的关键。


5. 脑机接口企业博睿康完成IPO辅导,神经接口赛道正式进入资本化通道

事件:证监会官网显示,脑机接口企业博睿康技术(上海)股份有限公司IPO辅导状态变更为"辅导工作完成",辅导机构为中信证券。这标志着国内脑机接口赛道正式进入上市通道。

🔗 https://36kr.com/newsflashes/3845287792134657

我的分析:博睿康IPO辅导完成,是国内脑机接口从技术研发走向商业化的重要里程碑。脑机接口分为侵入式(植入大脑)和非侵入式(头皮EEG)两大路线,博睿康的具体路线尚不清楚,但无论哪种都意味着临床验证和监管审批的临近。IPO的意义不仅是融资,更是对整个赛道的一次"市场验证"——如果博睿康能成功上市,将为后续神经接口公司树立估值基准。对医疗AI和康复工程领域而言,这是重大利好:脑机接口在渐冻症、中风康复、截肢幻肢痛等场景已有明确医疗价值,商业化路径相对清晰。但也需要注意:脑机接口的商业化周期长、监管门槛高,投资者不应过度乐观。


🛠️ 产品与工具更新

6. 途虎养车接入微信AI Agent,汽车后市场首个AI Agent落地

事件:途虎养车已与腾讯在AI Agent领域展开合作,途虎养车小程序作为首批内测开发者完成微信AI初步接入。合作围绕车辆故障诊断、门店推荐、养车下单等核心场景,是目前汽车后市场领域唯一接入微信AI Agent的企业。

🔗 https://36kr.com/newsflashes/3845282788919815

我的分析:微信AI Agent选择途虎作为汽车后市场的首个合作伙伴,说明微信的AI Agent生态正在从"通用对话"向"垂直场景"延伸。途虎拥有覆盖全国的线下门店网络和标准化的服务流程,这是AI Agent落地的重要前提:AI需要能够调用真实世界的服务(门店库存、工时报价、预约系统),而非只是回答问题。这是"AI Agent+真实商业闭环"的典型案例——AI的价值不在于"更像人",而在于"能做事"。对其他垂直领域而言,这一案例说明:AI Agent的商业化路径应该是"头部平台+成熟业务流程"的组合,而非凭空创造需求。未来微信AI Agent的生态能否扩展到更多生活服务场景,值得关注。


7. 开源教程:从零训练大语言模型,覆盖1300万至20亿参数规模

事件:开源项目提供从零复现Transformer语言模型的完整教程,用PyTorch覆盖The Pile数据下载、预处理、训练、生成全流程,支持1300万至20亿参数规模,并给出GPU显存与可训练规模的参考数据。

🔗 https://lumina.shawnxie.top/article/cong-ling-xun-lian-da-yu-yan-mo-xing-c3278eec

我的分析:这类从零训练的开源教程正在填补AI教育的核心缺口:大部分课程教如何使用API,但真正理解LLM需要亲自经历"数据处理→架构设计→训练调参"的全流程。20亿参数是一个关键节点——这是能展现涌现能力(Emergent Abilities)的最小规模,让学习者能在消费级GPU上复现GPT-3级别的能力。对AI从业者而言,理解训练细节正在变得和理解算法原理一样重要——当模型出现奇怪行为时,知道是数据问题、架构问题还是训练策略问题,比单纯调用API更有价值。这也是对"AI民主化"的重要贡献:降低学习门槛,让更多人不依赖大公司的API也能深入理解模型内部机制。


📊 行业动态

8. A股算力股集体走强,创业板指涨1.91%,杰华特涨停

事件:6月9日,A股三大指数午间集体上涨,沪指涨0.51%,深成指涨1.25%,创业板指涨1.91%。半导体、通信设备板块领涨,杰华特涨停,太辰光涨超15%,扬杰科技涨超6%。算力赛道持续受到市场追捧。

🔗 https://36kr.com/newsflashes/3845389103106310

我的分析:创业板指涨1.91%且算力股领涨,反映了市场对AI算力基础设施的持续信心。杰华特(功率半导体)和太辰光(光通信)是算力产业链的关键组件,它们的涨停说明市场认为算力建设的需求没有放缓,反而在加速。这与马斯克十万卡超算中心、小米推理加速等事件形成呼应:无论AI应用层如何变化,对底层算力的需求是刚性的。但也需要注意:A股算力股目前估值较高,短期波动可能较大。长期来看,算力需求与AGI进展高度绑定,任何AGI突破性进展都会第一时间传导到算力股。


9. 前5个月外贸进出口增长15.3%,连续3个月超4万亿元

事件:海关总署数据显示,2026年前5个月,我国货物贸易进出口总值20.68万亿元,同比增长15.3%。其中出口11.91万亿元,同比增长11.8%;进口8.77万亿元,同比增长20.5%。5月当月进出口4.45万亿元,连续3个月超过4万亿元,同比增速扩大至16.9%。

🔗 https://36kr.com/newsflashes/3845336640801281

我的分析:外贸数据持续超预期,进口增长(+20.5%)显著快于出口,说明国内需求正在复苏,这对AI硬件和算力设备的进口有直接拉动作用。连续3个月超4万亿元是一个重要节点,说明中国外贸韧性超出预期,地缘政治压力下的"脱钩"论正在被实际贸易数据证伪。值得注意的是进口增速更快——这可能与AI算力设备的采购潮有关(如英伟达GPU、服务器等),反映出国内AI产业建设的加速。对科技行业而言,外贸基本盘的稳定为AI产业投资提供了宏观基础。


10. 海南商业航天目标2030年营收500亿元,全链条产业集群加速

事件:海南省发布"十五五"高新技术产业发展规划,提出以商业航天发射场建设为核心,"以场带产"形成涵盖商业发射、星箭制造、卫星应用的全链条产业集群,打造火箭链、卫星链、数据链和"航天+"产业体系,目标到2030年商业航天产业营收达到500亿元。

🔗 https://36kr.com/newsflashes/3845319281264902

我的分析:海南商业航天规划是首个将商业航天纳入省级产业发展战略的文件,500亿元目标虽然规模不小,但相对于中国航天产业的整体体量是务实的。商业航天的核心价值在于"降本"——SpaceX已经证明可回收火箭能将发射成本降低一个数量级,中国需要自己的可复用运载火箭才能在这一赛道竞争。"以场带产"的模式借鉴了文昌发射场的地理优势,但商业航天最难的不是发射场建设,而是可复用火箭的研发——这是目前国内相对薄弱的环节。卫星互联网、遥感数据服务、天地一体化通信等应用场景的爆发,将是这一产业真正兑现价值的关键。


11. 两部门印发服务业发展资金管理办法,重点支持AI等新兴技术在消费领域普及

事件:财政部、商务部修订印发《服务业发展资金管理办法》,支持范围包括促进服务消费提质惠民、激发下沉市场消费活力,以及推动人工智能等新兴技术在消费领域的普及应用。

🔗 https://36kr.com/newsflashes/3845293621266696

我的分析:政策明确将AI在消费领域的普及列为资金支持方向,信号意义重要:这意味着AI落地不仅是市场行为,也有政策背书和资金支持。"下沉市场"被重点提及,说明政策层认为AI普惠的重点不在一二线城市,而在三四线城市和农村——这些地方的AI应用供给严重不足,但需求真实存在。对AI创业者而言,下沉市场的机会可能比一线城市更大:竞争相对不激烈,用户习惯正在形成,政策还有资金支持。但挑战也很明显:下沉市场的付费意愿和基础设施成熟度是主要障碍。


12. 港口设备开工率同比增长9个百分点,港口物流需求持续旺盛

事件:国家信息中心数据显示,5月份全国港口设备开工率同比增长约9个百分点,增幅居各类工程机械首位。商户经营活力指数连续3个月回升,线下消费支付金额同比增长2.4%,电子商品、餐饮、交通出行等重点消费领域增长明显。

🔗 https://36kr.com/newsflashes/3845309419440640

我的分析:港口设备开工率是外贸的先行指标——出口货物增加→港口吞吐需求上升→设备利用率提高。9个百分点的增长说明外贸带动的物流需求正在快速传导到实体经济。商户经营活力指数连续回升是关键信号:这意味着AI等技术不仅在数字经济领域发挥作用,也在真实商业运营中产生价值。"电子商品、餐饮、交通出行"三个重点消费领域的增长,说明消费复苏正在从"量的恢复"走向"质的提升",消费者愿意为更好的产品和服务付更多钱,这对依赖消费升级的AI应用(如智能推荐、AI客服等)是利好。


📌 本日总结

  1. AI推理工程化突破加速:小米MiMo突破1000 tokens/s、AdaCoM实现上下文四倍压缩,标志着AI落地从"模型能力"向"工程效率"转移——谁能用更少资源跑更强模型,谁就能赢得市场。

  2. 垂直场景AI Agent进入产品化阶段:途虎养车接入微信AI Agent、Claude Code动态工作流发布,AI正从通用工具向"能做事"的执行体进化,垂直场景的商业化闭环正在形成。

  3. 脑机接口赛道资本化启动:博睿康IPO辅导完成,国内神经接口赛道正式进入上市通道,人机融合从科研走向商业化的进程正在加速。

  4. 算力产业持续高景气:A股算力股集体走强、外贸数据高增长、政策支持AI消费普及,多重信号显示AI基础设施建设仍处于加速期,产业链上游(芯片、服务器、光通信)仍是确定性最强的方向。

  5. 商业航天与宏观数据双重验证经济复苏:海南500亿元商业航天目标、港口物流指数创年内新高、外贸连续三个月超4万亿元,实体经济复苏为AI产业投资提供了宏观基础,科技产业与实体经济的正循环正在形成。