非常感谢中国指挥与控制学会的刘玉超副秘书长,提供了李德毅院士这篇报告的PPT,让大家都能分享他的智慧。今天的内容分两部分,第一部分是56页PPT,第二部分是李德毅院士的演讲实录。
以下为演讲实录:
各位来宾,各位同行,各位代表,今天我们又一次在这里相聚,世界上最浪漫的事情也许就是我们这些人在云计算、大数据中慢慢的变得成熟。今天我们就云计算再谈一点新的认识,讲三个方面的问题。
第一,天梯:云深不知处
大家知道云是一件很浪漫的事,大家都喜欢云,很多人的名字里面都有“云”。为什么喜欢云呢?在我的一本书里,曾经有这样一段诗意的描述,不多谈了。大家知道云是在天上的,充满了想象。我们既要脚踏实地,又要常常的仰望天空。涌起了多少云?老百姓搞糊涂了,私有云、混合云,到底怎么混合?我在第一届云计算大会上曾经提出云生态,说明云代表了服务的发布,水库可以是私有的,但是天上的云是五彩缤纷的。用户主导,依托互联网,按需服务,导致了无所不在的互联网的在线搜索,实时交互,时刻发生着即时的协同。从图灵计算到网络计算,云计算的交互性远远超过图灵机,我有一个题目叫超过图灵机的云计算,云计算不是一台虚拟的图灵机,交互导致众包。
水、电、交通等实现了社会化、集约化和专业化。后工业革命时期,云计算正在让信息服务实现社会化、集约化和专业化。信息技术成为全社会公共的基础设施,成为物联网的基石。
服务器托管和积累形成的服务器农场只是个暂时现象,我们现在到各大互联网公司去看一看他们的数据中心你会发现定制高端服务群,形成新的服务器群的新架构将成为高端服务器的产业链,满足大数据挖掘的需求。 云的最大特点是不确定。云计算最根本的问题处理不确定性,这正是云计算名称的由来所在。云和所有权无关,不是什么私有云、公有云、混合云,每朵云里都可能涉及到用户的隐私,或者行业的秘密。安全问题已不再是云计算的拦路虎,云安全、数据安全实际上是服务和被服务方与信任管理的问题,加强政府监管是最基本的保证。
我们在前几次会上,大家都关注到位置服务。我们有一句话叫做位置服务是最接地气的云计算,每个人现在都在享受摇一摇的生活,那就是一个很大的见证。上次会议上我曾经提到过计算机发展的这个世纪以来,存储导致我们的搜索时代,现在的互联网又导致了我们的交互时代。山不转,水转,大家还记得那一首歌。
物联网的代表是车联网,物联网的最高境界是机器人联网,有一个媒体把这两个字去掉了,我很遗憾。移动互联网和云计算环境造就了大数据时代,产业前沿延伸,新兴商业涌现,传统意义的学科兼并,产业兼并,商业兼并日趋模糊,包括机器人在内的许多四不象的产品,四不象的商业、产业正在成为我们的主要形态,正是它们造就了现代社会的时代特征。
于是,我们很高兴的看到国务院2015年的5号文件,七年时间,七次大会,白皮书年年修改,我们走过了概念清晰,操作模糊,八仙过海,云里雾里的阶段,我记得这16个字是我在华为的服务器发布会上的发言。SaaS已经成为每个人实实在在的感受,PaaS平台作为服务迎来了“互联网+”,导致产业的新形态形成的“大众创业、万众创新”的局面。基础设施正呼唤着国家基础信息设施的大跨步。宽带建设,再一次成为人人的呐喊,现在是我们总理在呐喊,已经不是我在呐喊。有人猛轰油门,有人猛挂空档,有人踩着刹车不放松,有人开着空调吹冷风,运营商发动机轰鸣,老百姓感觉没有挪地方。
总理提出“互联网+”成为我们现在的一个热词,“互联网+”的基础首先是移动宽带+,没有宽带城市,没有宽带的移动通信,没有3G、4G、5G的发展就不会有“互联网+”。5G的移动通信,我们更需要光网的宽带,没有光网的宽带,就没有移动的宽带。宽带是互联网的基础,有了“互联网+”,才有了软件即服务,平台即服务,基础设施即服务的核心基础的云计算+,有了云计算+,才有物联网,我曾经有一个报告,叫做云计算、物联网的基石,有了物联网,派生了更多更多的大数据,于是有了大数据+,有了大数据,改变了我们整个科学的时代,现在进入一个数据密集性的科学,所以我们运用大数据有了人工智能加。我想这坐天梯对我们的信息社会是多么的美好。我们搞IT的同志们,我们看到全社会各行各业都要面临需求,互联网+,+的是X,我们看到这样一个天气,一定要加强自身的建设。所以,我提议再加一个片子,叫做天梯须自强,只有这样我们才能不负重望,把这个“互联网+”承担起来。
我们曾经叫做体系,怎么解读这个体系呢?就是系统的系统,已有的系统常常是垂直系统,靠什么?靠云计算,这就是云计算的巨大特征。传统的服务是垂直行业的服务,有人把它叫做私有云,实际上应该叫行业云,通过云计算我们有了各种各样的虚拟服务,跨界的服务。我们说大数据,大数据哪儿来的?“互联网+”、云计算+,物联网,有了大数据,靠什么发现价值?我们靠大数据+,形成了一个价值,价值就是我们的资源。
第二,云计算盘活大数据资产发现价值
大数据认知,我们看看数据是怎么认知的。举几个例子,第一个例子,写诗。大家知道唐诗宋词一共48150首,总体就是35万字,看看数据认知是怎么写诗的。规矩越多,越适合计算机写,这个规矩就是形式化。我们搞计算机,搞程序,就是要搞程序化,对押韵有严格要求,比如把李白的一首诗碎片化,变成一个大数据,实际上不是一个大数据,因为才1010首诗,按照平平仄仄,仄仄平平。把李白的诗按照一定的结构把它结构化,形成一个缩影,X1,X2,X3,一直到X8,又可以让李白作为一个诗人,毛主席诞辰一百周年,把189326做索引,18,1是羞玉绕灵间,喜虎哀苦寒,凤楼留不住,夜郎醉不眠。如果毛泽东是12月27号生的,这首诗变成凤楼留不住,夜郎见苍山。
最近网上总是在说,雷军说了一句英语“I’m Very Good”。我要跟大家说How Are You很正常,如果打乒乓球的时候,对方摔倒了,我会说一句话,Are You OK?这时候你说I’ ok,这就是不确定性,这就是大数据的力量。英语900句,如果变成9000句,甚至变成更多的大数据,做野蛮翻译,按照语言学中的二八定律,讲80%的时间用20%的高频词汇量。所以,大数据造就了野蛮翻译。我们现在的科大讯飞,我们的百度大佬,都是在做这样的事情。当你拿着微信,把语言变声音,声音变语言的时候,充分利用了这样的一个频率分布。所以,大数据让我们思考一个深刻的问题,是形而上,还是形而下,是先有语言学,还是先有语言。
大数据标志着一个新时代的到来。这个时代的特征不只是追求丰富的物质资源,也不只是无所不在的互联网带来的方便的多样化信息服务,同时还包含区别于物质的数据资源的价值发现和价值转换,以及由大数据带来的精神和文化方面的崭新现象。
大数据来源于人类测量,记录和分析世界的渴望和无尽的追求。随着信息技术、尤其是传感器、通信、计算机和互联网技术的迅猛发展和广泛应用,人类获取数据的手段越来越多,速度大大加快,成本急剧降低,层次和尺度更为精细,这样大数据成为网络时代人类社会的重要资产。
所以,我个人认为,没有什么大数据科学,它还没产生呢?大数据仅仅是一个客观存在,就其本人而言,既不是科学,也不是技术,各行各业的大数据都以10的三次方的数量级网上增长。你要把这些大数据发现价值,你要看一遍吗?这是人类几千年来认知世界和社会的基本能力,是从大数据终发现价值必须面对的一个普遍性。认知科学要有所突破,首先要在大数据上,聚类上有所突破。大家还记得2008年的那篇文章,标题最大的是大数据,还有一个很重要的标题,ZB时代的科学应该怎么做?我认为互联网厂商应该关心这样一些基本的普遍性的问题,那就是聚类。
人类走过了几千年的实验科学,几百年的理论科学,几十年的计算科学之后,迎来了数据密集型的科学的新时代。适应科学,理论科学,计算科学时代,大定律,大模型,小数据,数据是围着模型和程序转的。今天模型和程序要围着数据传,现在是大数据、小模型、小定律交叉学科,即使是同一个癌症病,每个人身上也都不一样,所以要关注对小数据的研究,小群体的研究,因此创新表现在创新交叉学科的形式化理论上。要更多的关注小众,更多的关注由下而上,而不是做特例发表论文。
这张片子,我前几次用过,前面讲结构化数据用数据库,或者数据仓库来应对,半结构化数据用网页、搜索引擎等技术应对。非结构化数据用深度学习、网络交互和群体智能应对。云计算的性价比要充分确定大数据中不确定性和价值的隐蔽性,跨界构建基于统计的可变视角和可变尺寸的全新发展状态空间,大数据驱动云计算架构中心的演化和进化,满足及时发现大数据价值的需求,这个互联网企业就是高手。这是我对云计算和大数据关系的认识。
第三个,云计算支撑机器人认知和机器人联网
机器人老百姓想到的机器人一般是人形机器人,其实不一定是人形的,只要和人的功能相当就行了,有时候是形似,神不似,互联网、云计算、物联网和大数据可以有力的支撑机器人如何说,如何看,如何想,机器人需要工业革命3.0的支撑,这一点我们是要缺口要补的。认知就是外在表现如何说,如何看,怎么说?语言认知?怎么看,图像认知,怎么动?控制行为。关键是怎么想。图灵计算机,既然侧重于计算机,我们今年要创新开辟新的电脑系统,或者叫做真正的机器人脑系统。这种机器人脑系统,不但包括计算智能,还要包括记忆智能和交互智能。在“互联网+”、云计算+,大数据+的形态下,利用云+端的形态已经孕育太多的机器人之雏形。例如导航,我们用林志玲导航,郭德刚导航版,我们游戏机器人,这些机器人在动作方面都比较简单。英语学习机器人,这就是整个的服务。
所以,云服务机器人将来会更多的出现在社会的各个生活层面,例如是超市的语音导游导购机器人,微博健康助手机器人,论文投稿推荐机器人,高考机器人,机器人交警。机器人撰稿也已经发生了,机器人宠物是一个新的发现,养一个机器人,机器狗就换一个性格,多好。语言、文本、歌曲、剧本,如果都能通过机器人变得情感、动作、语音,我们就会发现研发语言和图像丰富,头脑复杂,四肢动作简单的特定认知域的云机器人,机器人的智商和情商容易取得小众的共识。比如人脸识别机器人,聊天机器人,机器人汪国真,机器人李白。草品喷淋机器人,是刚研发的,它还可以研发一个恋爱机器人,培养你谈恋爱的经验。
我们做了一件事情,做了一个不带情绪的轮式机器人,汽车的颠覆性创造,很可能就是轮式机器人。Google公司最近有一个报道,说Google无人驾驶汽车有上百万英里的测试经验,大致相当于人类75年的驾龄。汽车的工业100多年了,为什么人类是75年,我觉得没有讲清楚。如果我们汽车研发的结果,相当于一个人的75年驾龄,所以我觉得有一个问题,驾驶认知如何度量,认领75年驾龄的水平究竟是什么?
我们这十年来做了机器的价值脑的研发工作,把情绪扣除,把性格、长期记忆,动作、短期记忆,学习和思维,这主要部分进行物化,通过感知,通过加深脑的认知,再行动,再感知,再认知,再行动。我们提倡不单单要计算,如果一个人不能遗忘就没有智能的表现,没有遗忘就没有智能,遗忘是人类智能的表现。我们记忆中要进行抽象,要把记忆、计算和交互三位一体,我们的轮式机器人,包括四大类传感器,雷达的、摄象头的、汽车自身还有GPS接收机,我们利用人脑中的地图,根据动机检验路径规划,搁在当前的记忆时空,形成决策,控制小脑,小脑就是我们的控制。我们深深体会到IT行业一定要跟汽车行业紧密的结合,不要小看汽车行业,100多年汽车的驾驶已经搞得相当成功了,能够把方向盘,横向控制,或者纵向的速度控制,分离开来,做了很好的解耦。应该学习骑车人的经验。于是,我们构造了一个机器驾驶脑,这一块,长期记忆,短期记忆,动机,学习和思维,小脑,肢体,这部分叫感知。通过感知认知行动,再感知,再认知,再行动。这就是我们基本的智能驾驶方案。
在这个方案,我们逐步聚焦它的架构设计、模块划分。我们汽车有20几个传感器,他们按照他们拿到的大数据进行数据的检阅和数据的挖掘,最后变成一个感知的理解,变成一个认知的理解。正常的理解,感知的理解,认知的理解,分别代表瞬间记忆,工作记忆以及长期记忆。形成的驾驶图纸,我们发明了一个自主的认知箭头,用认知箭头实行自动控制,我们希望取代现在汽车的探头系统,经过控制控制这个汽车的双驾双控,驾驶人如果想开车,还可以踩油门实现驾驶的乐趣。这样我们通过双驾双控的功能,这个智能车可以作为教练车,也可以作为自学习车,这就是我们驾驶的方案。我们模块化的功用模块,还有底下这些。
这样的驾驶脑跟云计算怎么结合?我们最近成立了云计算组,板卡组。云计算组我们希望将来汽车上装一个无人机,假如前面挤,或者一个东西看不清楚,我们叫这个无人机看看有多深。我们还可以通过云感知,感知更大的空间,通过云搜索,得到更好、更新的地图,通过云计算和群体智能,可以得到事故险情、路口记忆等。所以,就一个特定的事情来说,在某一个方面,一个特定的人群,人工智能是可以做到的。
这是我们课题组在上海汽车博览会研发的无人驾驶汽车演示,这个车离那个标只有几厘米,人都做不到这么好,有一点驾驶智能的水平。我们还在公交车上做了试验,我们的大车,最小一步原来提20公分,我们的结果最小是5公分,所以你停车的时候,最小步可以做到5公分,让我们很兴奋。这是公交车在一个厂区正式环境下怎么过路口,过马路的。这个道路,红绿灯我们通过路网系统来解决,其他的车子在周边照样开,这是一个厂区的厂内班车。
我们还在想,怎么研发新兴云机器人研究脑认知。能不能研发机器人再现老年如何痴呆?能不能研发机器人再现老年痴呆如何康复等。同时我总结一下,云计算的产业链将曾经相隔的微电子、计算机、通信、软件、家电、穿戴设备、汽车、机器人等产业融合为三大板块。云上形形色色的数据中心、计算中心各服务中心;异构层叠的网络;以产品为中心的产业链方式,已经转变为以服务为中心的利益攸关方的相互渗透,协商共赢方式,云服务提供商成为产业链的主角。我们要更加关注客户体验和大数据价值发现,更加关注以车联网为代表的物联网,更加关注机器人认知,或机器人联网,谢谢大家!
更多阅读: