2018中国国际大数据产业博览会于5月26日~29日在贵阳举行,本届数博会的主题是“数化万物 智在融合”。会议期间,数位院士围绕区块链、大数据、量子科学、人工智能等前沿话题发表讲话,剖析先进技术最新进展。他们具体都说了啥?
中国科学院院士梅宏:分层次推进大数据治理体系建设
随着大数据的价值和潜能为全社会所认知、关注,大批的企业、开源基金以及风险投资纷纷进入大数据领域。到2017年,随着领域应用不断深入,数据作为基础性战略资源的地位也日益凸显。数据质量、数据安全、隐私保护、流通管控、共享开放等问题日益受到高度关注,大数据治理成为产业生态系统的一个新的热点。
大数据治理仍存缺陷
近年来,各界学者纷纷开展了大数据治理研究和实践,已经看到不少成功的经验。比如,在国家及政府层面,围绕促进数据共享开放、保障数据安全和保护公民隐私等方面陆续出台了相关的政策;有很多针对企业组织、机构如何改善数据管理能力成熟度的模型陆续出现;技术上,面向数据质量保证的方法与技术,促进数据互操作的技术和规范标准,有很多研究成果,特别是近几年,数据质量、方法和工具受到了广泛关注。
然而,分析当前现状,我们也看到大数据治理还存在若干问题和不足。
第一,大数据治理概念比较狭义。大都以企业或组织为对象,仅仅是从一个企业或组织的角度来考虑大数据治理相关问题。然而,目前的现状是,多元数据的聚集和跨组织、跨领域数据深度融合挖掘,才是展现大数据价值的前提。在价值的驱动下,各界普遍存在着对突破数据的组织边界进行流动的需求。我们可以看到,随着数据开通流通技术以及相关渠道逐步建立和完善,已经出现数据跨组织流动的现象,而且呈现日益普遍的趋势。这就需要大数据治理突破企业或组织编写,应从行业内到跨行业,从区域内到跨区域,从全国乃至到全球多个层次进行考虑。
第二,对大数据治理内涵的理解还没有形成共识。不同的研究者、不同的组织机构,从组织业务和管理流程设计、信息治理规则、数据管理应用等不同视角都在尝试给出治理的不同定义。有的人认为大数据治理就是IT治理的延伸,是它的一部分;有的人认为大数据治理需要独立于IT治理,是数据管理的延伸;有的着重于大数据相关制度优化、隐私保护和数据变现政策。
第三,大数据治理相关的研究实践多条线索并行,关联性、完整性和一致性不足。比如,在国家层面,政策法规和法律制定等较少被学者纳入大数据治理视角。数据作为一种资产的地位还没有通过法律法规予以确立,这就给它的流通带来很大影响。大数据的管理已经有不少可用的技术与产品,但是缺少多层级管理的体制和高效管理机制,怎样有效结合相关技术和标准规范,建立大数据共享开放环境仍然在探索之中。除了不断完善相关技术应对各种安全问题、新兴攻击和挑战之外,企业安全保障制度、行业自律监管机制和国家通过法律确定的强制手段方面还需要完善。
全面系统考虑大数据治理
我认为需要构建一个大数据的治理体系。大数据治理体系必须要跳出单个组织的边界,从营造国家大数据产业发展环境的视角来进行全面和系统化的考虑。
我理解有四个方面主要内容,一是数据资产地位的确立,二是数据的管理体制和机制,三是促进数据共享和开放,四是要保障数据安全。这四大方面内容涉及每一个组织层面,是一个多层级的事情,具体的手段可以通过制度的建立,法律法规、标准规范的制定,大量的应用实践,以及相应技术支撑体系的建设。
从政府层面,我们需要明确数据的资产地位,在法律法规的层面确立它的资产地位,从管理体制机制方面兼顾现状并看到未来的发展,建立适合国情的、良好的数据管控体制和相应的管理机制。我们也需要促进共享开放,需要制定促进数据共享开放的政策法规和标准规范,实现政府部门间的数据共享,规范市场主体间的数据流通和交易,建设政府主导的数据开放平台,促进政务数据和行业数据的融合应用。同时,要出台数据安全和隐私保护的法律法规,保障国家、组织和个人的数据安全。
从行业层面,需要在国家相关法律框架的约束之下,考虑本行业中企业的共同利益和长效发展,构建相应的行业大数据的治理规则,建立规范行业数据管理的组织机构,制定行业内的数据管控制度,制定行业内数据共享和开放的规则和相应的技术规范、数据规范,构建行业内的数据共享交换平台,为本行业的企业提供数据服务,促进行业内数据的融合应用,制定行业内数据安全保障制度,确保行业内每一个成员单位的数据安全、权益以及相应的商业秘密。
从组织层面,每一个组织都需要考虑通过组织内部的规章,把数据确定为它的核心资产,这样才能有效地管理和应用,提升企业对数据的全生命周期管理能力,也需要促进企业内部的数据共享。特别是很多大企业,大到一定程度后,企业内部的数据孤岛越来越多,需要加强对外的数据流通和交换,这是一个商业行为,要充分盘活大家掌握的数据的价值。在安全隐私保护上,企业既要保护自身的数据安全,还要保护客户的数据安全和客户的隐私信息,所以任务也是很重的。
在以上三个层面如何发挥作用?在国家或者政府层面,需要制定大数据上位法来指导和监管行业和组织层面的大数据治理。行业层面,通过行业自治模式,在自愿原则下形成行业联盟,在国家法规政策指导下,制定行规行约,以及各类标准,监管企业行为,同时也积极向政府传达行业的共同需求。每一个单位和每一个企业要在国家和行业框架下确立自己的目标,优化对大数据资源管理,将大数据带来的利益最大化,并为行业和国家大数据发展不断贡献自己的成功案例,这三个环节是相互依存、互相促进的,是一个治理体系不可或缺的三个层次。
大数据治理体系建设是我们国家实施大数据战略的重要保障,是发挥大数据作用,做大做强大数据产业的重要因素,也是关键基础。当前还处于发展雏形阶段,分层次、多维度推进大数据治理体系建设仍然任重道远,需要各界的共同努力。
中国科学院院士潘建伟:量子科学催生现代信息技术
上世纪初,随着量子力学的建立,催生出以信息技术为代表的第三次产业变革,X射线、能源科学、信息科学、生命科学、材料科学都跟量子科学紧密相关。从某种意义上,我们可以说,正是量子科学催生了现代信息技术发展。
随着技术发展,目前遇到两个问题。第一,信息安全。为了实现信息安全,人们用尽了各种方法,但历史经验告诉我们,依赖于计算复杂度的经典加密算法,随着人们计算能力的提高,它都会被破解。
第二,计算能力问题。随着大数据和人工智能的发展,人们对计算能力的需求日益增大。大数据要把里面的有效信息提取出来需要做大量的计算。发展计算能力,传统的手段就是把计算机集成度提高,并发展更好的软件。但是,目前摩尔定律已经面临着终结。尽管摩尔定律告诉我们,单位面积集成电路上可容纳的半导体晶体管数目每18个月就会增加1倍,但是不到10年,这个规律就会停止,会达到原子的尺寸,到原子的尺寸后,数据就不能被很好地定义什么是0、什么是1。
量子科技的发展催生了信息技术,它经过近100年的发展,也为解决上述问题做好了初步的准备。
量子保密通信可以提供一种在原理上无条件安全的通信方式,所以它能够让网络和信息传输更安全;利用量子计算我们可以得到一种超快的计算能力,实现更快的计算速度。利用单位量子,我们可以在原理上实现一种无条件分发,利用没有窃听的密钥进行安全通信。量子计算机有比较好的性能,它可以用在大数据和人工智能方面,比如求解1024变量构成方程组的话,用目前最快的超级计算机大概需要100年左右的时间,但是利用万亿次量子计算机只需要0.01秒便完成了。某种意义上讲,量子科学可以算信息时代的“核武器”,所以它的发展非常重要。
我们国家很早就布局了量子科学研究计划。所以,在国际上,我们在量子通信方面走得比较靠前,2012年量子通信系统已经在北京投入使用。但量子通信存在一个问题,虽然其信号是安全的,但是不能被放大,远距离通信是个瓶颈,所以实现100公里或者几百公里通信非常难。为了解决这个问题,我们开展了基于自用空间的量子通信技术研究。从2003年开始,经过十多年的努力,我们于2016年发射了世界首颗量子科学实验卫星,并开展了相关工作。去年已经取得了比较好的成果,比如点对点的量子密钥分发,去年我们完成的结果是每秒发送1000个密钥,之后是10万个,最近已经达到了50万个,也就是说在下一代量子通信卫星中我们很快可以实现每秒1兆点对点密钥分发量。我们与奥地利同事合作,于2017年9月实现了北京、乌鲁木齐、维也纳之间视频加密的量子通信。目前,我们正在与德国、意大利、加拿大、俄罗斯、美国、新加坡同事合作,希望能在全球范围内开展探索构建洲际量子通信的可行性。
在量子计算方面,我们国家也取得了比较好的成果。2012年,我们让量子计算的容错率由原来的10-5提高到10-2,很好地推动了量子计算的发展。去年,我们在国际上首次实现了光量子计算的原型机,它超越了早期的经典计算机。估计到今年年底,我们利用光量子计算和超导计算的计算能力,在某些特定计算功能上将达到目前最快的商用CPU处理速度。从这个角度讲,它可能在不久的将来能够比较好地用于优化网络、优化治疗、理解图像。我们希望通过10到15年的努力,一方面,能够构建全球化量子网络;另一方面,在量子计算方面,希望能够实现数百个量子比特相关操纵,这样对某些问题的求解大概就能达到目前全球计算能力总和的100万倍。
中国工程院院士邬贺铨:大数据及AI构筑数字安全新秩序
中国特色互联网所建立的数字新秩序——中国电子商务、互联网金融发展速度全球领先,但随之而来的是个人信息泄漏风险和金融监管难度的增加。
移动支付中国全球领先,发展规模是美国的70倍。移动支付使用非常便捷,但便捷伴随着的就是风险。如果不重视信息安全的保护,黑客可以从网络、邮件、电子商务、家庭地址搜集用户数据。
利用大数据技术和人工智能技术,可以有效提升数据安全能力,为数据安全的新秩序提供有力支撑。通过运用数据安全技术,国家可以进行相关制度法规建设,以数据集中共享为途径,推动技术融合、业务融合、数据融合,打通信息壁垒,形成覆盖全国、统筹利用、统一规划的数据共享大平台,构建全国信息资源共享体系,保障数据的有效利用。
中国科学院院士张钹:人工智能技术变成产业取决于四个因素
人工智能就是研究和设计智能系统,而这个智能系统能够感受周围的环境,能够思考,能够做决策,最后还能对周围世界产生作用。如何把人工智能的技术变成产业,创造价值,取决于四个因素。
首先是数据。现在大家认为到处都是大数据,实际上不然。网络上的数据虽然多,但跟你这个任务有关系的、合法可以拿的、能够保证的数据,不见得是大数据。另外,数据质量也是一个问题。有人统计,网络上的数据只有34%有用,7%经过标记,1%经过分析。换句话讲,只有1%的数据有用和好用。要把人工智能技术转化为产业,创造价值,就必须要解决数据的数量和质量问题。其次是人工智能的算法。现在社会上用得最多的人工智能算法是深度学习,但是深度学习的应用场景又有诸多限制。再次是计算资源。目前对大多数人来说,计算资源还是足够多的,但是某些条件下,这个资源还很紧张。最后,应用场景是最重要的问题。如果没有选好应用场景,就不可能发挥人工智能算法的作用。
中国工程院院士沈昌祥:只有可信计算才能解决区块链安全
区块链是一种利用密码学技术,将系统内的有效交易进行编码的可附加账本。区块链的安全与其他重要信息系统是相同的,因为它是一个典型的信息应用系统。我们说要实行网络安全等级保护制度,那么它的需求要做到交易有效,达成共识。
这几年区块链发展过程中发生了很多重大的安全事件。2010年8月就曾发生利用整数溢出漏洞凭空造出1840亿个比特币的事件。
我们应从以下几方面考虑,一是计算资源可信。区块链是在互联网基础上的应用,下面的计算资源网络不可信是不行的。二是交易数据要可控。无中心化是不错的,是理想状态,我们必须说人人平等,不要一个人说话算数,相当于仲裁的影响。我们应该做到比特币等区块链数据能够安全可信地存储与传输。三是交易过程可靠。交易过程真实可信,不可伪造,可信共管。只有可信计算才能解决区块链的安全。