我的位置:

金准产业研究 云-边-端融合的机器人系统和架构分析报告

发布人:行业研究

前言

当前,全球机器人市场规模持续扩大,工业机器人市场增速稳定,服务机器人增速突出。2018年,全球机器人市场规模达298.2亿美元,2013-2018年的平均增长率约为15.1%。在装备制造领域,机械臂凭借强大的负重能力和精准的抓取操作代替着工人的双手;在物流领域,智能仓储机器人和无人搬运车不断提高着运输效率;在生活服务领域,家用清洁机器人和服务机器人正成为许多家庭的私人保姆和小秘书。

一、迈向云--端融合的机器人4.0时代

1.1机器人技术发展主要阶段分析

2017年,中国信息通信研究院、IDC国际数据集团和英特尔共同发布的《人工智能时代的机器人3.0新生态》白皮书把机器人的发展历程划分为三个时代,分别称之为机器人1.0、机器人2.0、机器人3.0。

图片1.png 

机器人1.0(1960-2000),机器人对外界环境没有感知,只能单纯复现人类的示教动作,在制造业领域替代工人进行机械性的重复体力劳动。

机器人2.0(2000-2015),通过传感器和数字技术的应用构建起机器人的感觉能力,并模拟部分人类功能,不但促进了机器人在工业领域的成熟应用,也逐步开始向商业领域拓展应用。

机器人3.0(2015-),伴随着感知、计算、控制等技术的迭代升级和图像识别、自然语音处理、深度认知学习等新型数字技术在机器人领域的深入应用,机器人领域的服务化趋势日益明显,逐渐渗透到社会生产生活的每一个角落。在机器人2.0的基础上,机器人3.0实现从感知到认知、推理、决策的智能化进阶。

1.2应用领域分析

当前,全球机器人市场规模持续扩大,工业机器人市场增速稳定,服务机器人增速突出。2018年,全球机器人市场规模达298.2亿美元,2013-2018年的平均增长率约为15.1%。在装备制造领域,机械臂凭借强大的负重能力和精准的抓取操作代替着工人的双手;在物流领域,智能仓储机器人和无人搬运车不断提高着运输效率;在生活服务领域,家用清洁机器人和服务机器人正成为许多家庭的私人保姆和小秘书。

工业制造领域分析。目前,工业机器人在汽车、金属制品、电子、橡胶及塑料等行业已经得到了广泛的应用。随着性能的不断提升,以及各种应用场景的不断清晰,2013年以来,工业机器人的市场规模正以年均12.1%的速度快速增长,预计到2020年将达到230亿美元的销售额。随着人力成本的上升,工业制造领域的应用前景良好,将会保持快速增长的势头。同时,工业机器人需要拥有更高的灵活性、更强的自主避障和快速配置的能力,提高整体产品的易用性和稳定性。

消费服务领域分析。金准产业研究团队了解到,服务机器人虽然整体销售额低于工业机器人,但近几年一直维持着较高的年增长率,商用服务机器人在商场、银行、酒店、机场等应用场景有了更多的落地部署,主要提供导览、问询、送物等基础服务。同时,家用服务机器人悄然进入千家万户,扫地机器人销量在家用服务机器人销量中占主要份额,成为目前家务机器人中的主导品类。

从整个技术发展和市场环境看,机器人产业拥有以下发展推力:1、成熟的生态系统;2、老龄化人口趋势和新兴市场;3、更多智能产品互联和智能家庭建设;4、人工智能、自然语言理解能力的增强。

1.3机器人4.0的定义和发展机会

机器人将进入4.0时代,把云端大脑分布在从云到端的各个地方,充分利用边缘计算去提供更高性价比的服务,把要完成任务的记忆场景的知识和常识很好的组合起来,实现规模化部署。机器人除了具有感知能力实现智能协作,还具有理解和决策的能力,达到自主的服务。在某些不确定的情况下,它需要叫远程的人进行增强,或者做一些决策辅助,但是它在90%,甚至95%的情况可以自主完成任务。

要达到这一目标,首先需要利用人工智能和5G技术。利用人工智能技术提高机器人本体感知能力的同时,提升个性化自然交互能力。利用5G技术,大大缩短从终端到接入网的时间,带宽大幅度上升,很多东西可以放到边缘端,加入更多的计算能力,包括云端大脑的一些扩展,助力机器人规模化部署。

图片2.png 

二、云-边技术推动机器人结构创新

2.1云端大脑对机器人能力的增强

2010年提出的云机器人概念引入了云端大脑,机器人尝试引入云计算、云存储及其它云技术,达到机器人融合基础设施和共享服务的优点。相比于独立的机器人本体,连接云端大脑后的机器人拥有以下四个核心优势。

1、信息和知识共享:一个云端大脑可以控制很多机器人,云端大脑可以汇集来自所有连接机器人的视觉、语音和环境信息,经云端大脑智能分析处理后的数据信息可以被所有连接机器人使用。利用云服务器,各机器人本体获取和处理的信息可以保持最新,并安全备份。

2、平衡计算负载:一些机器人功能需要较高的计算能力,利用云端平衡计算负载可以降低机器人本体的硬件需求,在保证能力的同时,让机器人更轻、更小、更便宜。

3、协同合作:通过云端大脑,机器人本体不再独立工作,多机器人可以协同工作,例如共同搬运货物,配合完成一整套工作流程等。

4、独立于本体持续升级:借助云端大脑,机器人可以独立于本体持续升级,不再依赖于本体硬件设备。

2.2边缘计算对机器人服务的提升

IoT应用的快速发展,使得大量数据在网络边缘产生,推动了边缘计算的产生和发展。边缘计算的提出始于4G时代,将计算和存储资源部署到网络边缘,不仅可以减少核心网和互联网上的流量,还可以显著降低传输时延,提高网络可靠性。

金准产业研究团队分析,边缘计算的引入将解决终端能力受限和云计算的实时响应的问题,增强机器人云端大脑的实时响应能力,对于满足机器人4.0的要求十分关键,比如实时的推理、场景理解、操控等等。边缘计算和云计算的结合,将突破终端的计算能力和存储的限制,提高AI算法的训练和推理能力,比如提升精度和降低训练时间。同时将大部分机器人的智能布署在边缘和云端,通过协作和不断的训练,持续不断的提高机器人智能,比如通过边缘计算能更好的支持实时的多机协作,支持实时的知识图谱提取、理解和决策,持续不断的提高机器人的智能。边缘计算和云计算还可以解决机器人终端升级维护的困难,在机器人本体的生命周期内不断升级,提高机器人的能力,增强数据安全和隐私保护,充分利用摩尔定律带来的性能提升。

2.3--端一体化对机器人系统的支撑

–边–端一体化构建了一个通过机器人提供多样化服务的规模化运营平台。其中,服务机器人本体是服务的实施者,而实际功能则根据服务的需要无缝地在终端计算(机器人本体)、边缘计算和云计算之间分布和协同。金准产业研究团队认为,机器人系统类似现在智能手机上的各种APP,主要关注如何实现高性价比的多模态感知融合、自适应交互和实时安全计算。

多模态感知融合:为了支持机器人的移动、避障、交互和操作,机器人系统必须装备多种传感器(如摄像头、麦克风阵列、激光雷达、超声波等)。同时,环境里的传感器可以补足机器人的物理空间局限性。大部分数据需要在时间同步的前提下进行处理,并且调用不同复杂度的算法模块(例如SLAM,图像处理,人和物体的识别等)。机器人硬件系统和边缘计算需要协同来支持(可能来自多个机器人的)多传感器数据同步和计算加速,因此应该采用能灵活组合CPU、FPGA和DSA(Domain-Specific Accelerator)的异构计算平台。另一部分没有强实时性要求的感知任务(如人的行为识别、场景识别等),可以由云计算支持。

自适应交互:为了支持机器人的个性化服务和持续学习能力,需要将感知模块的输出与知识图谱结合对环境和人充分理解,并且逐步提取和积累与服务场景和个人相关的个性化知识。通用知识和较少变化的领域知识应该存放在云端,而与地域和个性化服务相关的知识应该存放在边缘或者终端。无论知识存放在哪里,在机器人系统中应该有统一的调用接口,并可以保证实时通讯。基于ROS2构造涵盖终端和网络侧的软件系统框架可以满足未来的需求。

实时安全计算:未来的服务机器人应用将有大量需要实时响应的情形(如语音交互、协同操作等),因此需要在边缘服务器部署相应的加速硬件。同时,机器人也将处理大量涉及用户隐私的数据(如视频、图像、对话等)。金准产业研究团队认为,云–边–端一体化架构需要构建隐私数据的安全传输和存储机制,并且限定物理范围。对于可以进行物理操作的机器人,要构建独立的安全监测机制,保证即使机器人系统被远程攻击劫持后也不会造成物理安全损害。

三、机器人4.0核心技术

在机器人3.0时代,服务机器人可以做到一些物体识别、人脸识别,在4.0时代需要加上自适应能力。因为用深度学习做物体识别、人脸识别的时候需要很多的数据来源,但是真正到家庭场景时没有那么多数据,这就要求机器人必须通过少量数据去建立识别能力,自己去找到不同的位置,不同的角度做训练。

这些就是机器人4.0要做的,首先对三维环境语义的理解,在知道它是什么的基础上,把看到的信息变成知识,让存储就变得更加合理,而且可搜索,可查询,可关联,也可推理。应用层可以根据这个知识和观测为现场场景做出智能的提醒,寻找物品,进行行为检测。例如,老人要出门,机器人的知识库告诉他,今天预报要下雨,但是检测到老人没有带伞,然后查询伞的位置,机器人就可以把伞送到老人手里。这都是结合内部知识和外部情况所做的决策。

知识图谱在整个学术界和工业界越来越受到重视。获得图灵奖的杰夫∙辛顿教授在加入谷歌的时候就说要建一个知识图谱给全世界用。阿里研究院发布2019年的十大技术趋势里面也专门提到了知识图谱的重要性。金准产业研究团队认为,这是人工智能迈向下一个阶段的必由之路,也是必做之事。

总结下来,机器人4.0主要有以下几个核心技术,包括云–边–端的无缝协同计算、持续学习、协同学习、知识图谱、场景自适应和数据安全。

 

图片3.png 

3.1--端的无缝协同计算

受制于网络带宽以及延迟的制约,当前绝大多数机器人3.0系统是以机器人本体计算为主,云端处理非实时、大计算量的任务为辅的系统架构。机器人的主要任务可以简单划分为感知、推理及执行三大部分。为了能够精准地感知理解环境以服务于人机交互,机器人系统通常集成了大量的传感器,因而机器人系统会产生大量的数据。比如采用了高清摄像头,深度摄像头,麦克风阵列以及激光雷达等传感器的机器人,每秒钟可以产生250MB以上的数据量。如此海量的数据全部传输到云端处理既不现实,也不高效。因此,需要将数据处理合理地分布在云–边–端上。

另一方面,完成感知和理解的AI算法也非常复杂。机器人所使用的AI算法通常需要很强的算力,例如Faster RCNN算法在GPU上可以达到5fps的处理能力,但是GPU的功耗达到200W以上,机器人本体很难承受,从计算成本而言同样也非常昂贵。虽然机器人本体计算平台的计算能力仍在不断提高,但是相对于AI算法的需求依然有限。为了完成机器人的计算需求,需要在云和边缘侧提供算力的支持,以实现在大规模机器人应用场景下,更有效、更经济的计算力部署。

随着5G和边缘计算的部署,机器人端到基站的延迟可以达到毫秒级,使得5G的网络边缘可以很好地支持机器人的实时应用。同时,边缘服务器可以在网络的边缘、很靠近机器人的地方处理机器人产生的数据,减少对于云端处理的依赖,构成一个高效的数据处理架构。

–边–端一体的机器人系统是面向大规模机器人的服务平台,信息的处理和知识的生成与应用同样需要在云–边–端上分布处理协同完成。例如,汇集来自所有连接机器人的视觉、语音和环境信息,加以分析或重构后,被所有连接的机器人所应用。

因此,在通常情况下,云侧可以提供高性能的计算以及通用知识的存储,边缘侧可以更有效的处理数据,提供算力支持,并在边缘范围内实现协同和共享,机器人终端完成实时的操作和处理等基本机器人的功能。然而由于机器人的业务需求多种多样,协同计算的部署也不是一成不变的,机器人4.0系统还要支持动态的任务迁移机制,合理的根据业务需求将不同的任务迁移到云–边–端,实现云–边–端的无缝协同计算。

3.2持续学习和协同学习

在机器学习方面,机器人3.0主要是采用基于大量数据进行监督学习的方法,这也是目前机器学习的主流方法,而在机器人4.0,还需要加上持续学习和协同学习的能力,才能使得机器人能够适应更复杂的应用场景。

3.0时代,服务机器人可以做到一些基本的物体识别、人脸识别,但由于机器人应用对感知识别的正确率要求很高,尽管这些方法在别的要求不高的领域已经可以满足应用需求(例如互联网搜索有80%的正确率就够了),但对于机器人应用而言则远远不够。第一是机器学习所固有的鲁棒性方面的问题,深度学习方法也不能幸免,识别结果可能出错,而且出错的时候系统也不知道自己错了,这样就可能造成服务的失败和错乱。

例如人需要机器人取东西A,而机器人却取了东西B,轻则闹笑话,引起用户不满,严重的可能会造成对用户的伤害(比如取错药品的情况)。鲁棒性的问题是目前所有机器学习方法自身的一个通病,因为训练数据中总是存在着长尾数据无法被准确识别,该问题很难通过现有的监督学习方法在部署产品前就解决。第二是数据不足,这也是现实应用中普遍出现的情况,例如用人体特征进行身份识别的时候需要大量的数据(几百张以上的不同人体姿态、角度的照片),而这些数据又无法事先获得。总结下来,这两方面的问题都和缺少数据直接相关。

要解决这些问题必须让机器人具有自主的持续学习能力。具体说来,机器人可以先通过少量数据去建立基本的识别能力,然后会自主的去找到更多的相关数据并进行自动标注(或通其他方式,例如与人交互来获得标注,但要注意尽量减少对用户的打扰)。用这些新的数据来对已有的识别模型进行重新训练以改进性能,随着这个过程不断进行,机器人可以把识别的性能不断提高。具体拿物体识别来说,机器人应该先通过少量数据来建立对该物体的基本识别能力,然后可以自己去找到不同的位置,不同的角度做训练,不断提高对这个物体的识别精度,在一段时间的持续学习后达到接近100%,

在实际应用中,一个机器人能接触到的数据是有限的,其持续学习的速度可能会受到限制。机器人4.0是一个云–边–端融合的系统,如果能够在机器人间或机器人与其他智能体间通过这个系统来共享数据、模型、知识库等,就能够进行所谓的协同学习。通过云端的模拟器来进行虚拟环境中的协同学习也是一种行之有效的方法,可以充分利用云的大规模并行处理能力和大数据处理能力。协同学习使得机器人的持续学习能力进一步增强,可以进一步提高学习的速度和精度。

3.3知识图谱

知识图谱在互联网和语音助手方向已经开始较为广泛的应用,尤其是百科知识图谱。机器人也有百科知识问答类的应用场景,对于这类的知识图谱可以直接加以应用。但不同于通常的百科知识类的知识图谱,机器人应用的知识图谱有一些不同的需求:

需要动态和个性化的知识。机器人往往需要对所在的环境和人进行更深入的理解才能进行更好的服务,而且不仅仅是当前的情况,要对过去发生的一些情况进行记录(例如要了解老人通常什么时候起床,某个物体一般放在什么位置)。因此,机器人需要记录环境里不同时间的人和物、发生的事件等相关信息,这些都是通用知识图谱所不能事先提供的,必须在环境里去获取。这些动态的个性化知识能很好的对人进行个性化的服务,例如通过对某用户的观察,机器人可以观察到该用户的一些喜好,或者一些行为模式,这些信息可以帮助对该用户提供更好的服务。

知识图谱需要和感知、决策紧密结合,并帮助实现更高级的持续学习能力。从人工智能发展的历史看,单一方法很难彻底解决AI问题,前面的介绍也提到不论符号方法还是统计方法都已经显现了瓶颈,而且目前在单一方法里都没有很好的方法解决这些瓶颈问题。按照明斯基的分析,未来需要多种方法结合的AI系统。从最近几年的研究进展看,这也是未来人工智能取得进一步突破的必经之路。所以不同于以往知识图谱和计算机视觉等统计方法基本是独立运作的做法,知识图谱必须和感知决策更深入、有机的结合。

具体来说,知识图谱的信息是从感知中获取的,通过基础的感知,加上场景理解,获得的信息可以存入知识图谱,然后这些知识可以进一步进行模式的挖掘(比如时间空间相关的模式)来获得更高层的知识。知识图谱的一些知识又可以作为环境上下文信息提供给感知算法来进行连续学习,从而实现自适应的感知算法。从某种意义来说,这已经不是传统意义上的纯符号方法的知识图谱,而是一种混合的知识图谱,即符号方法和统计方法结合的知识图谱。这也是未来很有潜力取得突破的一个方向。

由于云–边–端融合的需要,知识图谱会分别存放在机器人侧,边缘侧和云侧,其接口可以采用统一的接口以利于系统对知识图谱进行统一的调用。由于协同学习和实时处理的需要,知识和其他相关信息(如数据,模型等)还可以通过云侧、边缘侧来进行共享,通过一定的冗余备份来达到更高的实时性。这类似于计算机架构中的高速缓存机制(Cache),比如部分存储在云端的知识经常被调用,可以缓存到边缘端或机器人端提高其存取的速度。在5G网络下,延迟本身不是大问题,主要考虑更充分的利用边缘端和机器人端的计算能力,达到整体资源的最优利用。

3.4场景自适应

有了持续学习和知识图谱,系统在感知方面的鲁棒性大大提高,也在场景分析方面获得了丰富的信息并存在知识图谱中,这就使得机器人能够根据当前的场景进行相应的行动。

场景自适应技术主要通过对场景进行三维语义理解的基础上,主动观察场景里人与物的变化,并预测可能发生的事件,从而产生与场景发展相关的行动建议。例如在养老/助老应用中老人端着一碗汤走向冰箱,机器人可以通过以往的经验或知识预测老人是要去开冰箱放东西,就可以帮老人打开冰箱。再例如,机器人看到地上有一块果皮,预测可能会导致老人摔倒,这时机器人可以主动捡起果皮(机器人配备了手臂操控的情况下)或站到果皮边并警告老人。

这部分的关键技术是场景预测能力。场景预测就是通过对场景里的人、物、行为等的长期观察,并结合相关的知识和统计模型来总结出一些个人偏好或行为模式,并据此来预测目前场景要发生的事件。过去人工智能的符号方法中框架、脚本表示在这里可以作为知识表达的形式,但更关键的是需要把符号方法和统计方法结合起来,从而解决以往单独用符号方法无法解决的问题(比如缺少学习能力)。这部分的研究还处于比较初期的阶段,但相信在基于持续学习、知识图谱等技术充分结合的基础上,该方向在未来几年会有较大的突破。最终使得整个机器人的闭环系统,即感知–认知–行动,变得更加智能和人性化。

云端融合在这里起到非常重要的作用,尤其是知识的共享方面。例如前面的水果皮的例子,这方面的模式可能发生的不多,在单个机器人的情况下可能从来没见过这个情况,也就无法知道是危险的。如果通过云–边–端融合,只要有一个机器人看到过这个危险情况的发生,就可以把该知识分享给所有的机器人,所有的机器人就可以去预测这些危险情况了。除了通过在实际的物理世界中观察,在云端通过大规模的模拟来预演生活中可能发生的情况,可能也是另外一个有效的方法来获得更多的事件模式。

四、云端大脑

为了让机器人具备通用智能,包括类人的感知和认知能力,类人的动作行为和类人自然交互能力,并同时最大限度地保障机器人的运行安全,需要构建类人“大脑”的智能体。目前机器人本体计算能力有限,必须通过可以无限扩展的云端计算能力来提供智能机器人所需的能力。通过无线5G通信网络和一个安全高速骨干网络构成机器人“神经网络”,实现机器人本体和云端大脑的连接。云端大脑包括机器人视觉系统、对话系统、运动智能和极限现实系统等技术,其通过人工智能算法不断训练进化,使得前端机器人本体智能随之迅速提高。因此,采用云–网–端结合的智能机器人系统架构,具有更强的适应性和扩展性,如图所示。

图片4.png 

五、边缘智能支持多机器人协作

未来的多机器人边缘智能系统架构图如下,主要分为几个主要部分。

图片5.png 

数据采集。针对不同类机器人或智能设备的数据,搭建统一的数据信息集成平台,形成设备“纵向”(设备端——管理层)与“横向”(设备产业链各环节之间)的二维信息联通平台,筛选出真正有用的数据,重点是将“原始数据”变为“有用数据”。

边缘计算。利用网络计算资源,将知识镜像建模和知识挖掘,在网络层中形成实体的镜像对称模型和大数据环境,通过对实体运行历史数据中的关联性和逻辑性进行挖掘,产生能够支持决策的制造知识,重点是将对数据的洞察变为支持决策的知识,形成知识库。边缘计算设备作为边缘设备的输出端,需要较高的实时性与扩展性。面对复杂的IT与OT设备混连的环境,我们需要有按照优先级处理事件的方案或者协议,比如TSN。而作为云端的输入端则需要较高的稳定性。我们需要对边缘计算设备做冗余以避免整个生产线失控的场景,比如分布式架构。而其自身的边缘智能则需要较强的浮点运算能力以进行智能分析与决策,比如使用专用的加速芯片。

边缘智能。边缘智能部署在边缘计算设备上。与端设备,采用的TSN硬件协议与OPC应用协议,最大限度保证了IT与OT的通信实时性与效率。与云设备,则是采用了TCP传输数据与RPC进行远程调用,保证了数据传输的安全稳定性,降低云端与边端之间的通信开发难度,提高系统稳定性与扩展性。

(1)智能分析。将隐性问题显性化,通过设备端的智能分析,准确评估设备真实的健康状态(安全性,可靠性,实时性和经济性等多个维度)和未来趋势,并能够对潜在的故障和隐性问题进行预诊和定位,为设备使用、维护和管理的智能决策提供重要决策支持依据,重点是将“有用数据”变为“有用信息”。

(2)智能决策。对状态的识别和决策,以优化、协同为核心手段,基于装备真实健康状态和衰退趋势,结合用户决策的定制化需求,提供设备使用、维护和管理的最优决策支持,并达成任务活动与设备状态的最佳匹配,以保障生产系统的持续稳定运行(近零故障运行),将有用的信息变为最优决策。

边缘应用。形成工业的典型应用场景,不断对于智能系统的动态优化和重构,将智能优化后的决策同步到设备的运行和企业资源运营的执行系统中,实现决策与价值的闭环。

图片6.png 

(1)优化生产线工艺流程。针对生产线中多机器人协同作业存在的作业时间不一致、路径冲突等问题,基于多机器人协同工艺优化方法,挖掘多维工艺参数与作业效率、节拍之间的隐含关系,以生产作业效率、路径最优为目标,实现基于群体智能的多机器人协同作业工艺参数与运动轨迹优化。

(2)完善生产的运营管理数据,为更好的决策提供数据基础。依据机器人的设计工艺、应用工艺,在三维环境下对机器人进行轨迹规划、可达性分析以及干涉检验等仿真;通过机器人作业效率分析实现对工艺方案的评价及优化。根据机器人生产线工艺规划、多机协同作业规划、排产及物流控制方案,驱动三维模型进行生产过程模拟,依据仿真结果进行机器人及其所在单元的应用工艺设计或优化过程的校验与评估,实现机器人生产线运行效率、节拍平衡等目标优化。将仿真分析结果反馈至设计和应用环节进行验证;更新机器人工艺设计知识库,实现工艺操作透明化及工艺过程自主优化。

综上,边缘计算是扩展机器人个体智能的途径。金准产业研究团队认为,在未来的多机器人协作过程中,对于机器人的预测性维护,生产线的智能排产等方面也都是机器人在边缘智能的重要应用方向。边缘智能技术通过协同机器人设备与边缘服务器,利用深度学习模型优化,深度学习计算迁移等方法,使机器人在未来的使用中,能更好的自主决策,同时也让产线变得更智能,能够支撑生产计划灵活适应产线资源的变化,最终使产线变得柔性化、个性化、智能化,实现智能制造的升级。

结语

金准产业研究团队认为,边缘计算是最近几年提出的新概念,其推广和落地非常依赖于具体的应用,尤其适用于对实时性要求较高的场景。机器人应用正是非常合适的应用场景。边缘实时计算加上云计算的无限处理能力,可以大大提升机器人本体的人机交互和场景自适应能力,也会增强自主移动和感知能力。通过基于5G的云边端一体化,机器人本体的能力设计具有很大的弹性空间,从而解耦对机器人本体硬件能力的依赖,降低成本,推动大规模的部署就成为可能。