AI基础设施:下一个十年的新起点
1
“我所见过的事物,你们人类绝对无法置信。”
这是经典科幻电影《银翼杀手》中的一句台词,我看过很多遍,每次都会被AI复制人Roy的这句经典台词感染。
这部电影诞生40年以来,电影中前瞻呈现的AI、视频通话、智能汽车、图片社交、智能家居等应用都一一成为现实,并且激发了一代代后来者探索前瞻,用AI赋能、改造我们的这个世界。
在我们这个人工智能日新月异发展的时代,如何快速的将电影中的科技畅想变为现实? 答案很简单,离不开“数据训练”,多维的算法模型、海量的数据积累等等。这个答案看起来很简单,实践起来很难。需要底层技术的支撑,要耗费大量的资金,更得有超强的运算中心等等,各种条件缺一不可。
2
AI的发展落地离不开海量的数据和训练,关乎AI训练,我们的企业走过了曲曲折折的道路。
几年前,笔者拜访了北京朝阳区的一家AI服务企业。他们招募了上千专职人员,自主打造了还原AI真实场景的“场景实验室”和自建的数据标注基地,帮助人工智能企业获取更多优质的特定场景数据。
这样的方式虽然比较笨,但只要数量达到一定量级,就能应用于实践。有了大量来源于场景的结构化数据,接下来要考虑的,就是如何高效地“解读”与“利用”。如果没有通用人工智能,大量人力都将囿于单一项目之中,且不能很好地解决小数据、小样本的问题。此外,只聚焦单一问题使得解决方案难以拥有泛化能力,无法适用众多通用场景,性能也会不稳定。因此,通用超大规模模型再加上小样本单一场景的细分优化成为“刚需”,直观地表现为对AI算力的巨大需求。
对于大规模参数的通用模型,特别是超大规模与训练模型,世界超级科技巨头已经开始部署,惊人的参数算力保障必不可少。提及AI训练,必然绕不开微软、谷歌、Facebook等国际科技巨头企业。同样,中国的科技巨头们这几年也在加速布局。
这种事情只有巨头公司才可以做,然后我们便期待巨头能把创造成果分享出来,服务于社会各个行业。
比如华为就进入了这个行业,它发布的Atlas 900 AI训练集群,由数千颗昇腾910 AI处理器互联构成,是当前全球最快的AI训练集群之一,其总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。华为的布局,帮助各大企业和合作伙伴解决了算力的难题,而算力是AI训练的核心能力。
还有商汤,近期正式发布了SenseCore商汤AI大装置,这个大装置集大数据、大模型和超强算力三位一体,类似大科学装置粒子对撞机那般,赋能广大合作伙伴“撞”出无限新可能。目前在上海等地,商汤AI大装置开始发挥积极的效应。
值得一提的是,在世界人工智能大会上以SenseCore商汤AI大装置为基石的智能汽车解决方案--SenseAuto商汤绝影,同期进行发布,已赋能智能出行服务领域的30+国内外合作伙伴。
3
俗话说,量变产生质变。
同样的算法和数据,如果算力足够强大,就能发挥不一样的效应。《倚天屠龙记》中,张无忌的内功不精纯(算法一般),但也震惊了张三丰,“只觉掌心中传来这股力道雄强无比,虽然远不及自己内力的精纯醇正,但泊泊然、绵绵然,直是无止无歇、无穷无尽。” 为什么会有如此功效?简单来说,如果张三丰体内有100台服务器,张无忌就有200台,算力好几Pflops。
上文提及的商汤的AI大装置,包含有算力层、平台层、算法层。今年以来,商汤算力层面也得到了保障,它们在上海临港新片区投资建立了一个全新的AI算力中心(AIDC),计算峰值速度可达到3740Pflops。
至于商汤AI大装置的平台层,则是一个底层基座,这个底层基座打通了数据管理、样本生产、模型训练、智能解译等步骤,可以实现不同场景的算法模型的底层抽象,很多服务模块化输出,开发难度大大降低,为合作伙伴提供了“拎包入住”的开发体验。
算法层很多媒体已经提及,我们不再作探讨。简单来说,商汤的算法直面企业和产业需求。迄今为止,商汤的算法工具箱已开发超过1.7万个算法模型。这个平台上的算法也积累了使用中的最佳实践,让大家能够从零开始快速使用。
4
包括华为、BAT等在内的科技巨头和以商汤为代表的人工智能企业,纷纷加速数据中心建设,开展并且输出AI训练相关的项目,其目的在于赋能我们的360行,服务于经济社会的发展。
这一切的先决条件,也离不开政策支持。
人工智能发展早已上升到国家战略层面,这几年国务院、工信部、发改委等印发并实施了一大批鼓励、引导人工智能产业发展的文件和通知,比如《关于积极推进“互联网+”行动的指导意见》、《新一代人工智能发展规划》、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》等等不一而论。
透过这些政策,我们应该捕捉到一些关键要点。比如这几条:
①建设城市大数据平台,构建多元异构数据融合的城市运行管理体系,实现对城市基础设施等重要生态要素的全面感知以及对城市复杂系统运行的深度认知;研发构建社区公共服务信息系统,促进社区服务系统与居民智能家庭系统协同;推进城市规划、建设、管理、运营全生命周期智能化。
②人工智能基础数据与安全检测平台重点建设面向人工智能的公共数据资源库、标准测试数据集、云服务平台等,形成人工智能算法与平台安全性测试评估的方法、技术、规范和工具集。促进各类通用软件和技术平台的开源开放。
③培育智能理解产品,加快模式识别、智能语义理解、智能分析决策等核心技术研发和产业化,支持设计一批智能化水平和可靠性较高的智能理解产品或模块,优化智能系统与服务的供给结构。
AI基础设施建设正是对政策鼓励的“全面感知以及对城市复杂系统运行的深度认知”“建设云服务平台”“智能分析决策”的具体落地行动。从另外一个层面来看,这种借助AI科技创新,赋能各行业降本增效和规模化落地应用的服务体系,也为政策的落地写下了坚实的注脚。
今年是十四五规划的开局之年,在当前我国经济从高速增长向高质量发展的重要阶段中,以人工智能为代表的新一代信息技术,将成为我国“十四五”期间推动经济高质量发展、建设创新型国家,实现新型工业化、信息化、城镇化和农业现代化的重要技术保障和核心驱动力之一。
5
在十四五规划建议中,我国47次强调创新,36次提及科技,人工智能成最优先发展的领域之一,并提出“把科技自立自强作为国家发展的战略支撑”,“坚持创新驱动发展”被摆在各项规划任务的首位,进行专章部署。
被人扼住咽喉的感觉很不好,要想破解,就需要我国研发一大批自主可控的科技产品和服务,在这其中人工智能领域无疑是重中之重。
人工智能不是单纯的某项技术,而是一个技术应用生态体系,它考验到国家和企业方方面面的协作能力和研发能力,以及市场应用能力。前文我们提过,人工智能的迅速落地,离不开高强度的AI训练模型,从这个层面来说,AI大模型训练是未来AI发展的角力点,凭借AI大装置,中国人工智能产业就有了打破“卡脖子”限制的可能。
上文我们提到过,当今国际,主流的几大科技巨头都在强化AI训练模型和相关装置的建设。
比如微软投资10亿美元的OpenAI,正在和微软的Windows Azure云服务协作联动起来,服务各方开发人工智能技术;还有,谷歌大脑提出的Switch Transformer,号称可以将语言模型的参数量扩展至1.6万亿,比OpenAI的GPT-3还要多十倍;Facebook号称全球最强的开源聊天机器人Blender,它的出行标志着“可以假乱真”的对话机器人将加速应用......
随着核心能力的不断突破,中国人工智能的市场应用并不落后于领先国家,甚至在某些方面取得了领先。中国智慧城市数量竟已超过全世界的50%,根植于中国的华为、腾讯、商汤等企业,自然拥有更广大的应用实验空间和场景。
比如在上海城市管理的工作改善,就得益于商汤AI大装置带来的改变。举几个简单的小例子,上海徐汇区田林街道,在“消防通道被堵、被占用”这个历史难题上,AI系统可智能感知生命通道堵塞,帮助实现区、街道两级政府对生命通道堵塞的发现、上报和处理等全流程管理;上海长宁区江苏路街道,针对“单车乱停放”城市治理难题,通过AI场景分割等技术将区域内1000个摄像头转化成为智能感知神经元,对中心城区这些问题秒级发现、秒级推送给管理人员,最终联合各方实现了自动发现、处置、自动核查并结案三个环节。
还有上文提到的SenseAuto绝影,包含了智能驾驶解决方案,拥有道路全场景视觉感知能力、激光雷达感知技术以及基于多模态的目标意图预测技术(简单来说,这个方案可以让汽车模拟人的眼睛和大脑,一个用来看,一个用来决策)。
据介绍,这套自动驾驶方案又包含多种协同方案。其中视觉感知方案可以提供200m前向有效探测,支持自动紧急制动、车道保持辅助、双预警功能,还可以有效应对近距离行人/非机动车横穿等复杂场景;驾驶领航方案可实现高速公路场景下的车道跟随、超车自动变道、导航自动变道、自动上下匝道、匝道通行等多种L2+级高级辅助驾驶功能,并可拓展城市工况场景的应用;激光雷达感知方案则搭载了商汤激光雷达高精3D感知技术,为复杂天气和环境下的智能驾驶提供精准可靠的技术支撑。
我们可以期待一把,这套智能驾驶解决方案将来如果能够按照预期效能大规模应用,赋能给广大的车企,那么将会大大加速自动驾驶时代的到来。
商汤认为,AI 大装置的本质就是让AI落地摆脱人力密集的状态,通过自动化生产,自适应应用的方式,打通商业价值的闭环,全面构建物理空间的数字化搜索引擎和推荐系统。
实践是检验真理的唯一标准,AI 的想象力在于落地,而落地的关键在于是否有一批行业领军企业协同产业伙伴去实践相关的理念和模型。从这个层面来看,AI大装置的出现,可能是打开了一扇新的大门,未来会有这样的落地,我们可以共同拭目以待。
丁道师
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。