结合公司现阶段人工智能业务发展基础、已租赁算力资源使用情况以及未来业务拓展方向,公司将坚持需求牵引、统筹布局、适度超前、分步实施的原则,围绕人工智能模型训练、模型微调、推理部署、行业应用落地、国产化适配优化等重点方向,持续提升算力资源配置能力和资源使用效率,逐步形成与业务规模、技术路线和应用场景相匹配的中长期算力保障体系。该需求计划既服务于公司当前人工智能业务开展,也与国家持续推进“人工智能+”、强化高质量数据供给、推动算力基础设施高质量发展和算力互联互通的政策方向总体一致。
一、算力资源现状与需求趋势
目前已租用总算力规模为 455P,能够较好满足当前阶段模型推理、模型部署、部分模型训练与应用开发等需求。
随着后续业务由单一推理服务向“模型训练 + 模型微调 + 推理服务 + 行业应用 + 智能体开发 + 多场景部署”逐步延伸,预计未来 3—5 年算力需求将保持持续增长态势。综合考虑模型参数规模提升、业务并发增长、应用场景扩展、国产化适配要求提升以及多模型协同运行等因素:
- 未来 1—2 年:整体算力需求稳步增长,主要以推理服务扩容、垂类模型微调和行业应用部署为主;
- 未来 3 年左右:随着行业模型、智能体应用、多模态处理等业务持续增加,算力需求将进一步扩大;
- 未来 5 年左右:公司将根据业务拓展情况逐步形成较为稳定的智能算力资源保障体系,实现算力资源从“满足当前使用”向“支撑持续创新和规模化应用”转变。
二、分阶段算力需求测算
结合现有业务基础和未来发展规划,公司对未来 3—5 年的算力需求初步测算如下:
(一)近期(未来 1—2 年)
- 预计总算力需求较现有规模提升约 30%—50%;
- 总体需求预计达到 600P—700P 左右;
- 重点满足:大模型推理服务扩容、垂类模型微调、知识库增强、检索增强生成(RAG)、智能问答、内容生成、业务辅助分析及智能体应用开发等需求。
(二)中期(未来 3 年左右)
- 预计总算力需求进一步提升至 800P—1000P 左右;
- 重点支撑:多模型并行部署、复杂业务流程自动化、行业模型持续训练优化、多模态模型处理、智能体集群协同以及面向重点行业的规模化应用交付。
(三)远期(未来 5 年左右)
- 预计总算力需求将达到 1200P 以上,并根据实际业务发展情况动态扩容;
- 逐步建立覆盖模型训练、推理服务、数据处理、资源调度和跨场景协同的一体化算力支撑体系。
三、算力资源配置方向
未来公司将以国产智能算力为主要方向,持续提升面向人工智能训练和推理场景的资源配置能力,同时兼顾通用计算、存储和网络等配套能力建设:
- 智能算力:重点保障适用于大模型训练、微调和推理部署的智能算力需求,支撑大参数模型、MoE 模型、垂类行业模型及多模态模型的运行需要;
- 通用计算:同步配置一定规模的通用计算资源,用于数据预处理、任务调度、工程服务、平台管理和系统支撑;
- 高性能存储:加强存储资源保障,满足训练数据、模型参数、向量数据、日志数据和业务数据的存储、读取、备份及归档需要;
- 高速网络与算网协同:提升多节点、多集群、多任务并发场景下的数据传输效率和资源调度效率;
- 边缘推理:结合业务落地需要,适度考虑边缘推理和轻量化部署需求,提升面向不同场景的服务适配能力。
上述方向与当前算力基础设施高质量发展强调的“多元供给、异构协同、应用赋能、绿色安全”总体导向相契合。
四、重点投入模型类型
公司拟重点围绕以下几类模型持续增加算力投入:
- 通用大语言模型及行业微调模型:面向自然语言处理、智能问答、知识推理、文本生成等场景;
- 垂类行业模型:面向企业服务、政务协同、智能客服、内容生成、数据分析、流程自动化等具体业务场景;
- 智能体类模型与工具链:面向复杂任务拆解、流程编排和数字员工场景;
- 多模态模型:面向图文、文本与结构化数据融合处理;
- 国产化优化模型:围绕国产算力生态开展的模型迁移、蒸馏、压缩、量化和部署优化。
随着模型规模、推理并发量和场景复杂度提升,公司对高性能、低时延、稳定可调度算力资源的需求将进一步增强。
五、总体展望
总体来看,未来 3—5 年,公司对算力资源的需求将呈现以下特点:
- 规模持续扩大;
- 结构更加多元;
- 应用更加深入;
- 数据支撑更加完善;
- 国产化适配要求更高。
公司将以本次算力资源使用为基础,持续推进人工智能技术研发和行业应用落地,统筹推进算力、模型、数据和场景协同发展,不断提升人工智能产品化、平台化和规模化服务能力,为后续业务增长、行业赋能和区域数字经济发展提供稳定支撑。