从芯片到应用:亚马逊云科技以全栈实力助力企业迈入AI Agent时代
过去几年间,大模型技术及其相关产品持续快速迭代,能力边界不断拓宽,推动人工智能(AI)实现跨越式发展。无论是文本、代码还是图像、视频,大模型所生成的内容在质量与多样性方面均展现出令人瞩目的进步。
随着技术的不断演进,人们已不再满足于仅仅将AI用于内容生成,而是期待其能够成为理解意图、执行任务,并代表用户自动处理工作的得力助手。这一新的愿景与目标,正是AI Agent(智能体)所承载的重要使命与实践方向。
但需要指出的是,企业AI Agent成功需要强大的AI基础设施、广泛的模型选择与高性价比推理系统、能够深度整合企业数据的工具、以及完整的AI Agent构建与管理系统。如何有效整合这些资源并实现技术的高效融合,解决技术融合与落地应用中的难点,成为实现智能化转型突破的关键所在。
为破解企业AI Agent落地过程中所面临的挑战,在12月18日举办的re:Invent中国行北京站活动上,亚马逊云科技展示了从基础设施、模型服务、数据整合到构建管理的解决方案,为企业AI Agent的规模化落地提供了全方位的支持。
亚马逊云科技大中华区产品部总经理陈晓建
基础设施:算力与弹性的双重保障
AI Agent的大规模训练、推理及稳定运行,离不开底层基础设施的强力支撑。亚马逊云科技以软硬件深度整合为核心,打造了全层级算力体系,实现了性能、成本与合规性的精准平衡,为各类AI应用的落地与创新提供坚实保障。
在实例层面,亚马逊云科技发布了Amazon EC2 P6E GB300实例,搭载NVIDIA最新的GB300 NVL72系统,凭借软硬件的深度协同优化,为极致严苛的AI工作负载提供了出色的性能表现与可靠性保障。值得一提的是,亚马逊云科技与NVIDIA拥有超过15年的深度合作积淀,而这一实例的推出,进一步巩固了其作为NVIDIA GPU最优运行平台的地位。
在部署层面,针对拥有自有数据中心、且希望在内部部署前沿AI技术的客户,亚马逊云科技推出全新产品Amazon AI Factories。该产品可依托客户自有数据中心的资源与电力容量,搭建包含最新NVIDIA GPU、亚马逊云科技自研Amazon Trainium芯片的前沿AI基础设施,并提供基于该设施的Amazon SageMaker AI训练与推理平台、Amazon Bedrock模型服务平台等能力。同时,它为每位客户配置独立运营环境,在保障资源与业务完全隔离的前提下,延续亚马逊云科技一致的安全性、可靠性及核心能力,助力客户充分满足严苛的合规、主权及监管要求,将先进AI能力触达更广泛的客户群体。
在芯片层面,Amazon Trainium是亚马逊云科技自主研发的训练与推理芯片,其设计初衷聚焦于AI训练场景,同时凭借卓越性能成为业界顶尖的推理芯片。目前,Amazon Bedrock平台的大部分推理服务均由Amazon Trainium支持,包括Anthropic最新一代Claude模型的全部流量,该芯片可提供业界领先的端到端响应速度。
如今,Amazon Trainium部署量已突破100万片,已成长为数十亿美元规模的核心业务,客户需求持续强劲,业务规模保持高速增长。关于下一代芯片规划,亚马逊云科技大中华区产品部总经理陈晓建透露,该公司正推进Amazon Trainium4芯片,相比前代Trainium3,Trainium4可提供高达6倍的FP4计算性能、4倍的内存带宽,并支持更大规模的AI模型训练与推理,能效也将提升2倍。
“Amazon Trainium正在不断突破AI基础设施的可能性边界,让我们能够运用更强大的技术赋能实际应用。”陈晓建说道。
在服务器层面,亚马逊云科技发布了下一代Amazon Trainium服务器——Amazon EC2 Trn3 UltraServers。该产品专为大规模AI训练与推理场景设计,具备业界领先的性价比优势。相较于前代产品Amazon EC2 Trn2 UltraServers,新一代产品实现了性能的跨越式提升,计算能力提升高达4.4倍,内存带宽提升3.9倍,每兆瓦功耗可处理的Tokens数量提升5倍,增强了客户在AI业务中的成本效益与运行效率,为大规模AI模型的高效运转提供了更强力的硬件支撑。
模型服务:选型到定制的场景适配
AI Agent的智能水平与适配能力,依赖于模型的多样性与可定制性。亚马逊云科技通过Amazon Bedrock构建了领先的模型推理平台,同时提供从低门槛到高阶的定制工具,让不同技术基础的企业都能打造贴合业务的专属模型。
在模型选型上,Amazon Bedrock新增18款开放权重模型,涵盖Google Gemma、NVIDIA Nemotron等国际标杆,更纳入Kimi K2 Thinking、MiniMax M2等国内头部模型,加上已上架的Qwen、DeepSeek等,形成了覆盖多语言、多场景的多元化选择。自研的Nova 2模型家族则展现了差异化优势,Nova 2 Lite 以超高性价比适配通用推理场景,在指令追随、工具调用、代码生成等基准测试中,可与Claude Haiku4.5、GPT mini等模型媲美;Nova 2 Pro聚焦复杂场景,在AI Agent开发、工作流自动化等核心场景中,性能超越GPT5.1、Gemini 3 Pro等同类模型;Nova 2 Sonic是下一代语音到语音模型,优化了对话延迟与语言支持,可实现类人实时AI通话;跨模态模型Nova 2 Omni更是突破技术边界,支持文本、图像、视频、音频的多源输入,以及文本、图像的输出,既能精准提取合同、表格等复杂文档的关键信息,又能根据文本描述生成、编辑超现实图像,为多模态AI Agent应用提供了核心能力。
在模型定制上,亚马逊云科技提供了四种能力,覆盖从简单优化到深度训练的需求:一是强化微调(Reinforcement Fine-Tuning,简称RFT),无需用户具备机器学习专业知识,IT人员只需上传数据集、定义评估标准,Amazon Bedrock即可自动完成端到端定制,模型准确率平均提升66%;二是Amazon SageMaker AI无服务器化定制,支持RLHF(人类反馈强化学习)、RLAIF(AI强化学习)、DPO(直接偏好优化)等复杂任务,提供自动引导与自助控制两种模式,用户无需管理底层GPU、网络与存储;三是Checkpointless Training,可让数千个AI加速器在几天内完成模型自定义,且能快速从故障中恢复;四是Nova Forge开放式训练,允许用户在Nova模型的训练环节注入业务数据,避免后期微调导致的模型遗忘问题。
数据整合:存储与检索的协同赋能
实际上,数据是企业构建竞争优势的一大要素。对于企业实际应用的AI能力而言,使模型充分理解业务数据非常重要。
当前主流技术路径为通过检索增强生成(RAG)或向量数据,在模型推理阶段为其提供上下文支持。向量技术是助力模型高效检索与理解数据的关键支撑,这也是亚马逊云科技持续在多款核心产品中融入向量支持能力的原因,其中就涵盖了被众多客户广泛采用的对象存储服务Amazon S3。用户可在单个Amazon S3存储桶中存储高达数万亿个向量,且存储与查询成本可降低90%。
需要说明的是,Amazon S3仅为存储方案之一,为解决向量高效检索问题,亚马逊云科技通过GPU加速Amazon OpenSearch Service 的向量索引构建,相比传统方式,可节省75%成本,索引速度提升10倍。这种“海量存储+高效检索”的协同模式,已在多个场景落地。例如,12 Labs利用其实现视频精准搜索与分析,通过视频切帧、向量生成、元数据标注的全流程自动化,可根据文本定位视频关键帧;Adobe及国内智能摄像头客户则借助其处理媒体数据的冷热平衡需求,对非实时性的历史视频、音频数据进行自然语言检索,兼顾成本与效率。
构建管理:AI Agent一站式工具链
企业构建生产级 AI Agent,面临着上下文管理、安全合规、弹性部署、质量监控等多重挑战。亚马逊云科技推出的Amazon Bedrock AgentCore提供覆盖AI Agent开发、部署、运维、优化的全生命周期工具链,搭配面向特定场景的垂直AI Agent产品,让企业以最低门槛实现规模化落地。
Amazon Bedrock AgentCore通过其一系列能力,有效解决 AI Agent构建中的痛点:Memory模块支持短期、长期及情景记忆(episodic memory),让AI Agent能理解对话上下文,例如根据用户历史出差偏好推荐行程;Identity与Gateway实现多系统安全访问控制,可对接企业现有身份验证体系,授权AI Agent访问数据库、第三方API等资源;Code Interpreter支持自动化代码执行,例如在贷款审核场景中,自动运行负债率风险评估代码,生成分析结果;Runtime基于Amazon Lambda 的microVM技术,提供安全隔离、弹性扩展的运行环境,可自动适配短时轻量任务与长时复杂任务;Observability模块实现AI Agent运行状态实时监控,及时发现并解决故障;新增的Policy功能则通过亚马逊内部成熟的Cedar策略语言,在AI Agent与工具、数据之间建立动态护栏;Evaluations提供13种预设评估器,支持准确性、有害性、可用性等多维度质量检测。
除了通用构建工具,亚马逊云科技还推出了垂直场景AI Agent产品,包括:Amazon Quick Suite 面向企业内部办公场景,已在亚马逊内部服务数十万名员工,税务团队通过其整合政策文件、审计数据,实现政策变化实时同步与自动报告生成;Amazon Connect聚焦客服场景,结合Nova 2 Sonic的实时语音交互能力,让客户通过自然对话解决问题;Amazon Transform则针对技术历史债务问题,支持大型机、Windows.NET等老旧系统的代码自动化迁移。此外,亚马逊云科技还发布了Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent三款前沿产品,分别聚焦编程协作、安全防护、运维自动化场景,进一步拓宽AI Agent应用边界。
写在最后
AI Agent作为具备自主性、感知力与决策能力的智能系统,能够主动与环境交互、灵活调用工具、协同大模型与专业模型,为用户提供个性化的服务。亚马逊云科技CTO Werner Vogels预测,2026年我们将迈入人机协作的新纪元。这种协作模式将为解决真正重要的问题创造巨大机遇,同时将人置于核心位置。
我们看到,亚马逊云科技正以全栈布局的硬实力、场景化创新的巧思与开放协同的生态理念,构建起完整AI Agent落地体系,这不仅是技术的集成,更是对企业智能化转型路径的深刻理解与务实支撑。
X
-
微博认证登录
-
QQ账号登录
-
微信账号登录
企业俱乐部
Copyright (C) 1997-2025 Chinabyte.com, All Rights Reserved



