2月8日,位于郑州航空港区的河南空港智算中心发出重磅消息,基于远远满足6710亿参数模型部署要求的2000P算力,上线了“满血版”的DeepSeek全量级R1及V3模型,以及多模态版本的Janus-Pro模型,能够更好发挥大模型潜能为政府与企业提供AI智能服务,信息安全方面做到“原始数据不出域,数据可用不可见”,达到保障客户隐私的效果。此外,河南空港智算中心将于下周起提供可用于DeepSeek私有化部署的算力服务,中部地区NO.1的算力,可支持近5万个DeepSeek小参数模型实例按需部署并同时调用。
强大算力引领中部数字经济发展
春节后上班第一天,河南空港智算中心副总经理魏文普就接到朋友电话,咨询“能否租用服务器”,用于DeepSeek模型的私有化部署,“以前,这个门槛非常高,只有大厂才能玩”,魏文普介绍说,但随着DeepSeek在春节期间的爆火,这几天下来已经有近10家公司打招呼,希望能够借助空港智算中心的强大算力,建设自己的私有领域。
河南空港智算中心(简称空港智算)目前已具备的2000P算力是什么概念,足以称为强大?某些城市的智能计算中心只有仅仅300P算力,即号称可为DeepSeek打造高效稳定运行的“智能中枢”,并提供高效安全灵活的智能算力体验,而这足足多出了1700P,并且空港智算接下来正在以每季度增长1万P的速度进行扩容,最终将达到规划的300亿元投资、10万P算力,打造出中部最大、国内领先的万卡算力集群。
“满血版”DeepSeek,解决算力瓶颈
空港智算技术人员介绍,DeepSeek如此受到关注,不仅是由于它解决了“卡脖子”的问题,并且它还降低了“门槛”,对于CPU、内存和显卡的要求可谓相当“友善”,并且效率也得到了提升。以流水线工作举例,其他传统大模型的工作原理是不管什么物件过来都需要从A到B再到C,才能交付成品;而它的工作原理是,一个物件会被合理分配到A、B、C中的最适合处理它的专家来处理,即可快速准确地交付成品。即利用混合专家架构(MoE)提升模型性能与计算效率。
据了解,DeepSeek是完全对外开放状态,任何人只要有电脑,都可以将数据交给它,经过对它不断“投喂”“锻炼”,建立属于自己的大模型,这也就是常说的“蒸馏版”或“残血版”,但也就是由于其算力不够,导致目前使用受限。技术人员继续举例说,假如一个饭店里,10个服务员处于正常工作状态,可一旦客人突然暴增,或有服务员生病无法工作后,饭店则会运营不畅,目前DeepSeek不能正常运转就是这个原理,而只要提供足够的算力后,这些问题即可一并解决,空港智算强大的算力完全可以保障支撑,因此上线了“满血版”的DeepSeek模型。
空港智算上线多模型,助力区域数字化转型
空港智算同时上线了DeepSeek的R1、V3及Janus-Pro模型,可谓是一项突破性进展,进一步巩固其行业领先地位的同时,也为区域数字化转型和科技创新注入强大动力。其中至关重要的一项优势,就是Janus-Pro模型的部署,这款融合支持多模态理解和文本到图像生成的模型,可以让人工智能具备更接近人类的感知和理解能力。
而R1和V3,则可推动企业或个人的“定制化服务”,在研发应用、数字化转型、无人驾驶、智慧城市、交通物流、游戏、视频等领域广泛应用,为各行各业的发展注入强大的动力。
目前,空港智算已在郑州航空港区正式投用了首个企业级AI办公智能体应用,企业在确保企业数据安全的基础上,实现了办公流程的自动化和智能化,减少人工操作带来的误差,提升办公管理的精细化水平,全面提升办公效率和质量。据使用者介绍,其公司利用该应用开发了公司制度小助手,可充当高效的“制度讲解员”,通过简洁易懂的操作,能快速为员工解读复杂的公司制度条款,并且保证了“原始数据不出域,数据可用不可见”。
DeepSeek应用于多领域,开启智算新篇章
记者了解到,随着DeepSeek模型的成功部署,空港智算预计将在教育、交通、政府等多个领域提供前所未有的AI服务支持。无论是个人用户还是企业用户都能从中受益,个人用户可根据自身需求进行优化和工具集成,享受个性化的AI 服务;企业则可以根据具体业务需求对模型进行微调,提升模型在特定任务中的表现,更好地适应市场变化。
此外,空港智算还计划在未来几个月内,推出一系列基于DeepSeek模型的应用解决方案,跨境大模型,新材料科研大模型、交通物流大模型等进一步拓展市场影响力和服务范围。
面对日益增长的数据处理需求,河南空港智算中心将在人工智能大模型研发应用、数字化转型、智慧城市建设等领域发挥更大的作用,为河南乃至全国的科技产业发展提供有力支撑,开启智算新时代的新篇章。
记者 刘凌智 文/图
编辑:周爱巧
统筹:曹杰