云服务器哪家好

百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

每天7点左右,阳泉籍高级工程师李姓同学会驱车5分钟,来到城东的百度阳泉云计算中心,在公司吃完早餐后,开始一天的工作,系统调优、技术巡检、维保检修8个模组的各种供电制冷设施。

李高工毕业于太原理工大学的暖通专业,毕业之前本来希望赴北京闯荡一番,加入百度,没想到却被派回老家。2014年,阳泉云计算中心2号和4号模组正式运营,他是进驻的第一批工程师。这个本地团队主要负责现场运营管理、故障处理和维护保养,业务的部署和调度则由北京总部统一调度。

每时每刻,大量数据流会借由骨干网络,从全国汇集到阳泉计算、存储,这里为百度智能云、百度App、百度地图、智能城市、小度、Apollo等百度内部各种业务和外部企业提供强劲的计算能力,关系到亿万用户的畅捷体验,保持数据中心安全、高效、稳定运营,是李高工团队最重要的职责,一般工作日,他会按时下班,但手机必须24小时保持畅通,随叫随到。

如今,阳泉云计算中心规划建筑面积超过20万平米,服务器装机能力超过28万台。目前,已是全亚洲最大的单体数据中心,已上线超过15万台的服务器,约占中国一年服务器总采购量的1/20-25,可存储的信息量相当于30多万个国家图书馆的藏书量;这里也是全球最节能的数据中心之一——年均PUE只有1.09。而管理这个大型设施的百度员工只有几十人,以一期项目公开披露的47亿投资推算,平均每人照看着超过5000万的资产。百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

李高工参与管理的这项重资产,支撑了他另一位阳泉同乡——百度CEO李彦宏的AI雄心。算力、算法、数据是发展AI的三大基础要素,通过大带宽、低时延的网络互联,把包括阳泉在内的多个数据中心连接成一个巨大的算力基座,成为支撑百度智能云服务的核心竞争力。

落地阳泉

位于山西东部的阳泉并不有名,这座约140万人的城市,在互联网科技圈,知名度远不及李彦宏和刘慈欣——这位科幻作家正是在阳泉的娘子关电厂创作了《三体》。刘在电厂工作,不是偶然的,阳泉盛产煤炭,这座城市到处可见字母Y、M组成的标志,意为“阳煤”(阳煤集团)。百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

2012年,在这个距离北京约400公里的老家,李彦宏做了一项重大决定,在阳泉建设云计算中心,公开报道称,项目一期投资规模超过47.08亿,二期项目投资正在进行中。除了创始人的家乡情缘,能源成为百度青睐阳泉的一大优势:全国数据中心的运营成本中,电力成本占60%-70%,丰富的电力以及水源供应是必备条件。

这并不是阳泉唯一胜出的优势,百度系统部总监张炳华介绍,除了水电成本,数据中心选址的考量因素包括:环境地理条件,必须远离地震、海啸、台风等自然灾害地区,且气候适宜;网络技术条件良好,可接入运营商骨干网,具备超大规模的网络吞吐能力;交通便利,利于人员交流和设施供应;人文环境良好,可提供所需的专业人才;尤其重要的是,当地政府能给予大力支持,利于长期的运营。

阳泉的多数指标表现都不错,政府尤为热情,比如,其中一项配套工程是阳泉东区110千伏输变电工程建设项目,通常,110千伏变电站设计采用2条电源线路,以确保在1条线路出现故障时,另1条能及时替代,保障供电可靠性,该工程设计却特意建设了3条电源线路,实现了 “三保险”。

阳泉主要弱项是人才池不足。阳泉云计算中心的林经理回忆,2012年立项时,国内超大型数据中心寥寥无几,专业人才非常稀缺,在阳泉的更是无处寻觅,“我们确定以校招为主、社招为辅的策略,全面实现阳泉本地化的目标,2013年招聘了大概二三十名员工,先在北京的数据中心进行为期半年左右的实地培训,2014年再将他们派驻到阳泉。”李高工就是首批招募的成员之一,专业和籍贯成为其入职的两大优势。百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

2014年,2号和4号模组正式运营,其后,阳泉云计算中心以一年2个模组的速度,不断壮大算力规模,2018年1月,成为国内首个服务器规模突破10万台的单体数据中心,现已超过15万台服务器,成为百度最昂贵的资产之一。

亚洲最佳

2014年的李高工是一名行业新兵,而他参与管理的,却是亚洲单体规模最大、技术最先进的数据中心。

2012年规划设计时,百度即对标国际巨头,在单体规模、算力、存储容量等方面均采用高标准配置,其中包括“天蝎”整机柜服务器、“冰山”冷存储系统、“X-MAN” AI超级计算平台等;在数据中心基础设施架构同样领先,比如,高效供电、免费冷却、智能控制等技术不只先进,且与服务器、网络设备间的协同创新,达到了最佳匹配效果。在阳泉,百度共应用了400余项专利技术,并通过ODCC(开放数据中心委员会)等平台共享大量技术,百度主导的数据中心模块化、整机柜服务器等多项技术现已成国家标准。

此外,阳泉云计算中心配置了国内最大的深度学习计算集群,构成的AI超级计算平台,成为全球最先进的AI计算集群之一,适用于模型训练学习等场景,有效支撑了百度自动驾驶汽车、智能商业平台等众多AI应用项目。

据张炳华透露, 7年前规划时,阳泉云计算中心的机柜即按40A的标准进行规划,以增加单机柜的功率密度,适应强大算力的功率需求,即便在当下的IDC供应市场,主流服务器机柜的配置也仅为20A-32A的水平。

为便利计算能力的快速部署,阳泉云计算中心在设计之初,即取消传统的架空地板的设计,按照“整机柜交付”模式设计,从卸货平台、走廊、电梯到机房全程实现无障碍交付设计。换言之,出厂时,服务器机柜即已安装部署服务器节点,将机柜直接交付就可测试上线,无需像其他云计算厂商那样,一台一台在现场安装,节约大量时间和人力。

“随着摩尔定律的失效,未来5年,CPU的功耗预计会增加3-4倍,百度新建的数据中心,将按照更高的功率密度进行规划,并在供电模式和冷却模式持续进行优化。”张炳华表示,百度会继续扩张算力的基础设施。

对林经理和李高工的团队而言,管理这些先进设施的核心指标只有两个:一是稳定性,防止服务器宕机, 99.99%以上的时间能正常运作;一个是PUE(电力使用效率,即数据中心总能耗与IT能耗之比),PUE值越接近于1,效率越高、越节能,运营成本也越低。

在团队的努力下,2018年,百度阳泉云计算中心年均PUE突破了1.10,达到比肩国际巨头的1.09,对比全国平均1.73的PUE水平,这个水平意味着每年节电量可达2.5亿度,相当于13万户居民一年的用电量,若以一度电0.6元的成本计算,至少节省1.5个亿的电费,

“我们的PUE水平在国内遥遥领先,但是,大家依然有很大的内驱力,骨子里的劲不能松。” 李高工说,阳泉云计算中心在PUE上的极致追求,也同样落地到运维部门,“就像我们好好开车一样,养护得好,车子不仅能开很多年,还可以省油。”为此,他们基于百度PaddlePaddle平台开发了数据中心智能监控系统,包括可识别天气,提前智能预测室外温度、湿度的系统,“智能监控系统会预测服务器负荷变化趋势,结合天气情况,自动控制空调系统开机台数、运行频率、送风速度,以达到节能的目的。”

如今,阳泉云计算中心1号模组最佳状态的PUE已降至1.06,这不只是技术的荣耀,也预示百度智能云服务方面巨大的成本优势。百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

春晚故事

基于强大的技术架构和基础能力,阳泉云计算中心已安全运维超过1700多天,并非所有时刻都能闲庭信步般悠然,2019年的春晚就是一场大仗。

1月17日,百度宣布获得央视春晚红包的独家合作权益,第二天,阳泉云计算中心即召开动员会议,春晚的红包活动,无异于一场流量的海啸,准备时间只有半个月,这是一个巨大的挑战,“我们充分相信百度的技术实力,但是,春晚红包这么高的流量,没打过这种仗,公司就一个要求——必须赢”李义说。

林经理回忆,从那天开始,直到大年三十,阳泉云计算中心的工作人员每天都是晚八九点后才下班,一天至少两次例会,以确定风险点,讨论和制定应急方案,同步排查风险、准备备件、进行应急演练。为保障基础设施系统的稳定运营,很多同事推迟甚至放弃了回家团圆的机会,他们还说服、协调二三十家供应商在活动当天,来到阳泉进行现场支援。

大年三十这一天,包括供应商在内,所有人当天早8点进入阳泉云计算中心,对每一个可能的风险点最后进行一次检查和演练。当春晚一轮轮红包流量呼啸而过,他们则紧盯着设施的各种参数。整个春晚红包活动,全球观众互动次数高达208亿次,春晚数据流量为每秒峰值5000万次,每分钟峰值10亿次,而百度则成为扛住春晚流量的第一家互联网公司。

阳泉团队一直坚持到年初一中午才回家,而年三十的团圆饭是在单位餐厅就着电磁炉,以一顿简单的火锅解决的。对于离家只有5分钟车程的李高工,这是第5个值班的春节。百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

AI高铁站

阳泉是百度最大的单体数据中心,但是在容灾备灾问题上,始终力求多手准备。

百度智能云产业智能化业务负责人李硕介绍,百度所提供的服务采用分层机制,基本能够做到“N+1”的服务模式,即一个用户可通过多个入口来访问百度的服务,利用智能调度系统实现访问服务的智能化调配,譬如在阳泉能访问的服务也可转到西安进行访问。2016年,百度内部曾经做过一件事情,随机关掉百度的任何一个数据中心,其日常业务的访问依旧没有任何问题,“到今天为止依然是这样,这是上层服务设计需要做到的。”李硕说。

据张炳华表示,基于用户、行业和不同应用场景,百度全国各大区均布局了数据中心,他没有透露全部的服务器总量或者阳泉云计算中心的权重占比,因为“这是一个互联网公司的核心家底”,然而,家底间接反映在资产负债表上“固定资产总额”的不断攀升。公开资料显示,百度在北京亦庄和内蒙的数据中心规模均相当可观。

多个数据中心通过大带宽、低时延、多路由的网络链接成超级计算集群,响应了百度多个核心应用的海量访问,且有力支持了百度的智能云服务。

依托于强大的算力,百度智能云服务大规模进军金融、互联网和媒体等行业,不断向公共安全、通信、能源和交通等行业进行拓展,使得ABC技术能力与业务充分融合与应用,包括阳泉在内的巨大算力已经深入地渗透到所有人的日常生活。

以百度百科旗下的知识短视频平台“秒懂百科”为例,该服务每天着承载千万量级的视频播放需求,幕后功臣百度智能云即是通过这些算力设施,其为秒懂百科提供了稳定、安全、高效以及高扩展存储服务;携程也是借助百度智能云的自动语音识别、文语转换、自然语言处理等AI技术,打造和完善自己的智能客服平台,更好地做到7×24小时回答用户咨询,解答相关问题。百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”

过去3年,百度智能云已与来自金融、安防、交通、教育等30+行业的2000+合作伙伴达成合作,携手打造上百款解决方案,帮助合作伙伴快速进入智能化时代。以农业银行为例,百度智能云为其农银e管家、智慧信贷、智能掌银、集中作业运营优化等13大业务场景中提供智能应用,如账户开户、财务报表信息提取、票据信息提取等,且正在孵化20类场景,未来将产生更多智能应用。

现在,经由高铁网络,从北京到达阳泉不过2小时左右的车程,“阳泉云计算中心就像是AI时代的高铁站,只有依赖这种强大的基础设施,各种AI应用才能真正跑起来,”张炳华说。

(专题)

本文:百度智能云的隐形硬核:隐匿在山西阳泉的“重资产”,来源:21世纪商业评论。

©2022 云服务器哪家好 remenyouxipaihangbang.com 联系我们