中工网首页时政评论国际军事社会财经企业工会维权就业论坛博客理论人物网视图画体育汽车文化书画教育读书娱乐旅游绿色建设社区打工

理论

科技

数字替身:探索人生的无数可能

佩德罗·多明戈斯(Pedro Domingos)
2018-10-17 08:23:03  来源:光明日报

   我们对于未来化场景的大多想象都是基于高度的自动化,但是每个人的生活习惯不同,所以每个人需要的自动化程序都不一样。那么,美好的未来生活怎么才能让每个人的自动化程序都合你的心意呢?

  也许,你需要的仅仅是一个数字替身,它是“电子化”的你,了解你的一切生活习惯。这个替身会成为你的助手和管家,把你的工作和生活中按部就班的部分安排得井井有条。

  事实上,人工智能最可能导致的情景就是“数字替身”的大量出现。“数字替身”是我们自身的虚拟模型,这些模型可以在各种各样的模拟中互动,帮助我们在日常生活中做出更快速、更全面的决策。如今的各种语音助手音箱已经是这个替身的雏形。人工智能将服务于人类,而不是控制人类。

  1.从制造机器到机器学习

  人类是唯一可以制造机器的动物。通过这种方法,我们扩展了自身的能力,超越了我们的生物极限。工具使我们的双手变得万能。汽车让我们行进得更快,飞机给了我们翱翔的翅膀。计算机赋予我们更强大的智力和记忆力,智能手机为我们安排日常生活。而现在,我们正在创造一项全新的技术,用代码赋予它通过数据和练习进行学习的能力,使其可以实现自我进化。它会最终取代我们吗?还是将以史无前例的方式提升我们的能力,增强我们的人性?

  机器学习源于20世纪50年代部分科学家的开创性工作,如弗兰克·罗森布拉特(Frank Rosenblatt)设计了一种能够识别数字的电子神经元,阿瑟·塞缪尔(Arthur Samuel)开发了一种跳棋程序,可以通过和自己对弈来学习,并最终击败人类选手。但也仅仅是在过去十年,机器学习领域才开始真正腾飞,为我们带来了自动驾驶汽车、能(在一定程度上)理解我们指令的虚拟助手等各式各样的应用。

  每年,我们都会开发数以千计的新算法。所谓的算法,就是用来指导计算机完成某些操作的指令序列。而自我学习机器的核心特点是,我们不需要为它们编写具体的程序,只需要给它们一个诸如“学习如何玩跳棋”的宽泛目标,接下来,机器就可以像人类一样,通过积累经验而不断优化。

  对人工智能的追求可以看作是人类自我进化的一部分。自动化技术发展的下一阶段是发明出所谓的主算法,将把当前的5种机器学习方法整合为统一的框架。技术只是人类能力的拓展。除了达成我们给予的任务目标,机器并没有自由意志。我们应该担心的是人类对技术的滥用,而非被机器夺走了控制权。

  现在机器学习算法大致可以分为5个大类,每一类都是从不同的学科领域获得了灵感。并不让人意外的是,有一种机器学习方法就是在模拟自然选择,我们称这样的算法为进化算法。例如,在哥伦比亚大学的创新机器实验室(Creative Machines Lab)中,有许多雏形机器人在尝试爬行或飞行,其中表现最优异的结构将定期融合和变异,产生新一代的3D打印样机。一开始这种随机组装的机器人几乎无法运动,但经历了数千次的迭代后,这种方法已经产生了类似蜘蛛或蜻蜓的机器人。

  但这种进化是低效的。当前应用最广泛的机器学习方法是深度学习,它的灵感来自大脑。这种方法从模拟单个神经元功能的高度简化的数学模型出发,构建出包含数千个神经元的网络,并通过学习不断调整不同神经元之间的连接。如果两个神经元在处理数据时同时放电,它们之间的连接就会加强。这样的神经网络能以极高的准确度识别人脸、理解语音和翻译语言。机器学习也会借鉴心理学。与人类相似,这种以类比为基础的算法通过在已有的数据中寻找近似的问题来解决新的问题。这种特性可以实现自动化的客户服务,也可以让电商网站基于用户个人习惯推荐商品。

  2.努力创造一个主算法

  通过自动执行科学方法,机器也可以实现学习。为了引入新的假设,所谓的符号学习会进行逆向推理演绎:如果我知道苏格拉底是人类,要推断出他会死,我还需要知道什么信息?知道人会死或许就足够了,而且这个假设可以通过检查样本中其他人类是否会死来进行确认。英国曼切斯特大学的生物机器人Eve便是通过这种方法发现了一种有可能治疗疟疾的新药物。根据疟疾的相关数据和基本的分子生物学知识,Eve提出了什么样的药物可能具有疗效的假设,还设计了实验并在机器人实验室进行测试,然后修改或放弃一些假设,不断重复上述过程直到取得满意的效果。

  最终,机器学习可以完全构建于数学原理之上,其中最重要的是贝叶斯定理。按照这个定理,我们可以基于现有知识,先给不同假设指定初始概率,然后提升与数据相符的假设的概率,并降低与数据不符的假设的概率,最后计算所有假设的加权平均值,就可以作出预测:概率越高的假设,权重也越高。基于贝叶斯定理的机器在某些医疗诊断中的准确率要高于人类医生,也是很多垃圾邮件过滤系和谷歌个性化广告推荐系统的核心技术。

  这5类机器学习算法,每一种都既有优势,也有不足。例如,深度学习在解决视觉或语音识别等感知任务上性能卓越,但无法处理常识的获取和推理等认知任务。而符号学习则与之相反。尽管相比于神经网络,进化算法可以解决更为困难的问题,但解决这些问题要耗费大量的时间。类比方法可以从少量的数据实例中学习,但面对过多信息时却容易陷入混乱。贝叶斯学习是处理少量数据的最有效方法,但处理海量数据时却代价高昂。

  因为不同的方法各有利弊,所以机器学习研究者一直致力于把各种方法的优势结合起来。就如同一把能打开所有锁的万能钥匙,我们也在努力创造一个所谓的主算法(master algorithm)——这个算法可以从数据中学习到一切特征,提取出所有可能得到的知识。

  当前,机器学习领域面临的挑战和物理学家面临的挑战类似:量子力学可以在微观尺度上很好地描述宇宙,广义相对论则适用于宏观尺度,但这两个理论却是不相容的,有待调和。在粒子物理学的标准模型建立起来之前,詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)首先统一了光、电和磁;与此类似,包括我和华盛顿大学的同事在内,很多研究团队都提出了将两种或多种机器学习方法统一到一起的思路。但科学进步是断断续续、非线性发展的,因此很难预测这个大一统的主算法什么时候才能实现。不管怎样,这一目标的实现并不会导致一个全新的、强大的机器种族出现,相反,它会促进人类的进步。

1 2 共2页

编辑:张苇柠

书库

工运

  • 深化北京工运史研究的思考

    北京地区工人运动在中国共产党历史上具有十分重要的地位。长辛店留法勤工俭学预备班学员涌现出一批党的早期领导骨干。党的十八大以来,中国特色社会主义进入新时代,北京工运史的研究和宣传必须跟上新时代的步伐,开辟新境界。

  • 新时代应充分发挥工会作用

    中国共产党领导下的工会发展历史,经历了民主革命、社会主义革命和建设以及改革开放新时期3个历史阶段。其间经历了两次重大的历史转折:第一次转折是1949年新中国建立第二次转折发生于1978年改革开放之后,改革开放改变了过去的单一公有制和计划经济。随着市场经济的建立

  • 工人阶级作用的回顾与展望

    回顾我国改革开放40年伟大历程和所取得的巨大成就,总结我们党和党领导的工人运动走过的极不平凡的道路,特别是作为改革开放和现代化建设主力军——中国工人阶级的奋斗历程和巨大贡献工人阶级是改革开放的坚定支持者。工人阶级是社会先进生产力和先进生产关系的代表。在改革的不同时期,工人阶级都义无反顾地站在最前沿

  • 担当加强中国工运史研究重任

    中国工人运动史是一门研究中国工人运动发生和发展历史的学问。加强新时代中国工运史的研究,对于推进新时代工运事业的发展中国劳动关系学院建校近70年来,工运史研究薪火相传,集聚了一批工运史研究方面的学者,形成了一批有影响力的成果。

访谈

文献

  • 84年前这份不起眼的文件,竟是长征胜利的重要原因

    长征是历史记录上的第一次,长征是宣言书,长征是宣传队,长征是播种机。这是一份84年前由红军总政治部下发的文件,题目是《关于准备长途行军与战斗的政治指令》。这份文件的签发日期是1934年10月9日,文件要求各部队“必须在沿途进行对群众的宣传工作......广泛的进行口头宣传

  • “抗战文献平台”与抗战史研究的新境

    习近平总书记在中央政治局第25次集体学习时,对抗日战争研究作出一系列重大指示,强调要加强资料收集和整理这一基础性工作。对史料的掌握,是史学研究的根本之一。然而,史料收藏的不平衡造成了学术研究的不平衡,实际上也限制了学术的均衡、自由发展。

排行

新闻日历
关于我们 | 广告服务 | 联系我们 | 本站地图 | 投稿邮箱 | 版权声明 | 违法和不良信息举报电话:010-84151598 | 网络敲诈和有偿删帖举报电话:010-84151598
Copyright © 2008-2018 by www.workercn.cn. all rights reserved
扫码关注



工人日报
客户端
苹果版
安卓版