比特网早报:字节攻克MoE关键瓶颈,OpenAI发布CoT监控
2025年3月11日消息,昨夜今晨,科技圈都发生了哪些大事?行业大咖抛出了哪些新的观点?比特网为您带来值得关注的科技资讯:
机构:2024年第四季度前十大晶圆代工业者合计营收季增近10%
据TrendForce集邦,2024年第四季全球晶圆代工产业呈两极化发展,先进制程受惠于AI Server等新兴应用增长,以及新款旗舰级智能手机AP和PC新平台备货周期延续,带动高价晶圆出货增长,抵销成熟制程需求趋缓带来的冲击,前十大晶圆代工业者合计营收季增近10%,达384.8亿美元,再创新高。(36氪)
先进制程受益于AI服务器、新款旗舰级智能手机AP和PC新平台备货周期延续等新兴应用的需求增长,带动了高价晶圆出货量的显著增长。
字节攻克MoE关键瓶颈,训练成本节省40%
3月10日,字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据了解,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。(证券时报)
随着该技术的普及和应用,有望推动整个AI产业从“堆算力”向“拼效率”的战略转型。
Manus创始人透露,产品基于阿里千问大模型开发
3月10日,Manus创始人季逸超在社交平台透露,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。Manus是由创业公司Monica发布的首款AI Agent产品,最近在社交媒体火爆出圈。(界面新闻)
智元机器人发布国内首个通用具身基座大模型GO-1
3月10日,上海智元新创技术有限公司(以下简称“智元机器人”)发布国内首个通用具身基座模型——智元启元大模型(GenieOperator-1,以下简称“GO-1”)。智元机器人相关负责人表示,GO-1开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,该架构由VLM(多模态大模型)+MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的LatentPlanner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。三者环环相扣,实现了通过人类视频学习的能力,完成了小样本快速泛化,降低了具身智能门槛,并成功被部署到公司的多款机器人本体。GO-1可以持续进化,将具身智能推上新台阶。(证券时报)
小米辟谣人形机器人即将量产
据报道,近期有消息称,小米机器人CyberOne正分阶段落地亦庄产线,并计划于3-4月公示量产进展,4-5月开放参观,下半年做PR宣发。对此,小米相关人员回应称,前述消息不属实。CyberOne是小米首个全尺寸人形仿生机器人,2022年8月正式亮相,身高177cm,体重52kg,艺名为“铁大”。(科创板日报)
OpenAI发布CoT监控
OpenAI发布了最新研究,用CoT(思维链)监控的方式,可以阻止大模型胡说八道、隐藏真实意图等恶意行为,同时也是监督超级模型的有效工具之一。OpenAI使用了最新发布的前沿模型o3-mini作为被监控对象,并以较弱的GPT-4o模型作为监控器。测试环境为编码任务,要求AI在代码库中实现功能以通过单元测试。结果显示,CoT监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达95%,远超仅监控行为的60%。(新浪科技)
天风证券:英伟达GTC大会即将举行,重视人形机器人产业链
天风证券研报指出,英伟达GTC大会即将举行,本次大会展示的智能及图形感知技术突破可能预示着未来机器人的更大规模普及广泛应用,有望推动着各大厂商进入人形机器人行业。传感器及机械关节等作为人形机器人运动及感知的关键部件,其性能会对人形机器人的反应与运动精准度产生影响,而AI智能的进步带来的性能需求有望推动机器人关键硬件行业向高精度、高可靠性方向发展。(36氪)
CoreWeave宣布与OpenAI达成协议
据报道,CoreWeave宣布与OpenAI达成协议,将提供人工智能基础设施。OpenAI将通过认购价值3.5亿美元的CoreWeave公司股票,成为科CoreWeave的投资者。(财联社)



-
微博认证登录
-
QQ账号登录
-
微信账号登录

企业俱乐部
Copyright (C) 1997-2020 Chinabyte.com, All Rights Reserved