智东西X月XX日消息,今日在深圳举办的"智启云端·共创未来"腾讯数字生态大会上,云计算与人工智能技术的融合发展成为行业关注的焦点。会上,腾讯云重磅推出了其自主研发的星海AI推理框架,并宣布将于今年第四季度推出一项名为"潮汐算力"的创新功能。
一、腾讯云发布星海AI推理框架,打造高效推理引擎
腾讯云副总裁、云与智慧产业事业群COO邱跃鹏在主题演讲中指出:"随着大模型时代的到来,AI推理需求呈现爆炸式增长。如何高效、低成本地完成海量推理任务,已成为行业共同面临的挑战。"
邱跃鹏介绍,星海AI推理框架是腾讯云面向大模型时代推出的新一代推理引擎,具备三大核心技术优势:
- 异构算力调度:支持CPU、GPU、FPGA等多种计算资源的智能调度,可根据任务特性自动匹配最优算力资源;
- 动态批处理:通过智能批处理技术,将多个小请求合并为大批次处理,显著提升计算效率;
- 模型压缩优化:内置多种模型压缩算法,可在保证精度的前提下,将模型体积缩小50%以上,推理速度提升3倍。
此外,邱跃鹏还宣布,腾讯云已建成亚洲最大的万卡级AI推理集群,支持单集群10万卡规模的无阻塞推理,为星海框架提供了强大的底层支撑。
二、"潮汐算力"功能发布,算力利用率有望提升40%
在本次大会上,腾讯云正式宣布将于第四季度推出"潮汐算力"功能。该功能基于腾讯云自研的智能调度系统,可根据业务需求和算力资源的实时状况,自动调整模型推理和训练任务的执行时间。
"潮汐算力"的核心理念是"白天推,夜间训"——在业务高峰时段优先保障模型推理服务,在夜间等闲时资源闲置期,则自动切换至模型训练任务。据腾讯云测算,该功能可将算力资源综合利用率提升40%以上,同时降低企业使用成本。
腾讯云AI平台部总经理周斌详细解释了"潮汐算力"的工作原理:
- 智能预测:基于历史数据和实时监控,预测未来24小时的算力需求;
- 动态调度:根据预测结果,自动划分推理和训练任务的执行时段;
- 无缝切换:通过腾讯云自研的FastSwitch技术,实现推理与训练任务的毫秒级切换,确保业务连续性;
- 弹性扩缩:根据实际负载情况,动态调整计算资源,既保证服务质量,又避免资源浪费。
周斌表示:"'潮汐算力'不仅是一种技术突破,更是一种全新的资源管理思维。它让企业能够以更低的成本获得更高的算力价值,真正实现'削峰填谷'的智慧运营。"
三、腾讯云与头部企业合作,推动大模型落地
在本次大会上,腾讯云还展示了与大模型领域的多个合作案例。
澜舟科技创始人兼CEO周明分享了与腾讯云合作开发孟子大模型的经验。他指出:"腾讯云的星海推理框架帮助我们将孟子模型的推理速度提升了5倍,同时通过'潮汐算力'功能,我们的研发成本降低了30%。"
云启资本创始合伙人毛丞宇则从投资角度分析了大模型时代的机遇:"大模型正在重塑各行各业,而算力基础设施是这一切的基础。腾讯云的'潮汐算力'功能,为企业提供了一种经济高效的算力使用方式,这将大大加速大模型的普及和应用。"
此外,腾讯云还宣布与清华大学智能产业研究院(AIR)达成战略合作,共同研发面向未来的AI基础设施技术。
四、行业专家共议AI基础设施发展趋势
在本次大会的高峰对话环节,多位行业专家就AI基础设施的未来发展展开了深入讨论。
华为昇腾计算业务总裁张迪煊表示:"大模型时代对算力提出了全新要求,我们需要构建更加高效、智能的算力基础设施。腾讯云的'潮汐算力'功能是一个很好的创新尝试。"
阿里云智能事业群副总裁刘伟光则认为:"除了技术创新,商业模式也需要相应变革。'潮汐算力'实际上是一种按需付费的新模式,这将改变企业使用云计算的方式。"
商汤科技联合创始人徐冰分享了商汤在大模型训练方面的经验:"大模型训练需要海量算力,如何高效利用这些算力是关键。腾讯云的星海框架和'潮汐算力'功能为我们提供了很好的解决方案。"
五、腾讯云助力行业数字化转型
在大会的应用展示区,多家企业展示了基于腾讯云AI能力的创新应用。
招商银行信息技术部总经理周天虹介绍了招行如何利用腾讯云AI能力提升金融服务:"我们通过腾讯云的星海推理框架,实现了智能客服系统的实时响应,客户等待时间缩短了70%。"
比亚迪数字科技有限公司CTO王传福展示了比亚迪在智能制造领域的应用:"借助腾讯云的大模型能力,我们的生产线实现了智能质检,缺陷识别准确率达到了99.9%。"
微众银行首席人工智能官杨强则分享了金融领域的大模型应用:"我们基于腾讯云的AI基础设施,开发了智能风控系统,能够实时分析数亿用户的交易行为,有效防范金融风险。"
六、展望未来:共建智能计算新生态
在大会闭幕式上,邱跃鹏宣布了腾讯云的下一步计划:
- 持续投入研发:未来三年将投入100亿元用于AI基础设施建设;
- 开放合作生态:与更多企业和研究机构合作,共同推动AI技术进步;
- 降低使用门槛:通过技术创新和服务优化,让更多中小企业也能享受到大模型的红利;
- 构建绿色数据中心:采用液冷等先进技术,将数据中心的PUE值降至1.2以下。
邱跃鹏表示:"AI正在重塑世界,而算力是这一切的基础。腾讯云将继续秉持'用户为本,科技向善'的理念,与合作伙伴一起,构建开放、共享、高效的智能计算新生态,为数字经济发展贡献力量。"
本次腾讯云数字生态大会不仅展示了最新的技术成果,也为行业指明了发展方向。随着"潮汐算力"等创新功能的推出,我们有理由相信,AI基础设施将变得更加高效、智能和经济,为各行各业的数字化转型提供强大支撑。