【微软】AI+时代 人工智能的未来及其社会角色
今天,我们正跨入第四次工业革命的时代,人工智能、自动驾驶、物联网、混合现实等成为了这次革命的热点。在这个时代里,全球每18个月数据就会翻倍,预计到2020年,全球数据量将达到40ZB(相当于4万亿GB);在这个时代里,技术将越来越直观,能与人对话,并变得更加智能;在这个时代里,计算机协助人类进行智能工作,企业能用以往难以想象的方式更好地了解、服务客户,并最终解决世界上最棘手的挑战。
纵观人类历史上的诸多创新,汽车、印刷术、蒸汽机、载人飞行、火箭和卫星……它们无不成为推动人类在浩瀚无垠的各领域里迅猛发展的加速器。这一次,人工智能或将成为最大的加速器。大型机、个人电脑、互联网、移动电话、云计算……这一切都是人工智能的前奏。它不仅使人类的能力得以延展,还让我们的脑力变得更加强大;它不仅仅是数字时代的一个进步,还是包括图灵在内的技术先知们,在电脑诞生前就梦想到的终极目标。
1956年夏天,达特茅斯学院举行了一场特殊的会议。与会研究人员探讨的主题是,如何才能开发出像人一样,有能力从经验中自主学习的计算机系统。这场会议标志着人工智能开发的纪元时刻。尽管如此,对机器智能概念的探索早在此之前已经开始,到达特茅斯会议召开时,已有十余年的历史。其中最典型的即为阿兰·图灵提出的图灵测试:如果人类在与一台机器进行交互时(在当年,交互的方式限于文本),无法辨别对方是人还是计算机,那么,这台机器就可以视为是“智能的”。
自达特茅斯会议召开以来,研究人员仍在数十年如一日地推进人工智能技术的进步。机器视觉、自然语言理解、推理、规划和机器人学等分支学科的发展,带来了源源不绝的创新,其中许多已经成为我们日常生活的一部分。导航系统的路线规划功能、从互联网海量信息中检索并排列内容的搜索引擎,以及邮递服务中使用的自动识别手写地址并将物件送达的机器视觉功能,无一不是通过人工智能来实现的。
人工智能是赋予计算机感知、学习、推理及协助决策的能力,从而通过与人类相似的方式来解决问题的一组技术。在过去,计算机只能按照预先编写的固定程序开展工作,而具备该等能力以后,计算机理解世界以及与世界交互的方式,将比以前大为自然和灵敏。
就在不久以前,我们还只能通过命令行界面与计算机进行交互。图形用户界面向前迈出了重要的一步,而在不久的将来,我们将可以直接通过对话与计算机进行日常交互,就像与人交流一样。实际上,为了实现该等新功能,我们正在教计算机观看、倾听、理解和推理。关键技术包括:
视觉:计算机通过识别图片或视频中的内容来“看”的能力。
语音:计算机通过理解人们所说的话来“听”并将其转录成文字的能力。
语言:计算机把握语言中的诸多微妙差异和复杂性(例如俚语和惯用语),“理解”话语含义的能力。
知识:计算机通过理解人、事物、地点、事件等等之间的关系来进行“推理”的能力。例如,当我们搜索某部电影时,便会得到关于演员阵容以及该等演员参演的其他电影的信息,或者在工作中,在开会的时候,你会自动收到最近曾和对方分享的几份文件。这些都是计算机通过推理而就信息得出相关结论的例子。
计算机正在像人一样学习,即通过经验学习。计算机的经验是以数据的形式获得的。例如,计算机会结合一天中的时段、季节变化、天气状况以及该区域的重大事件(例如音乐会或体育赛事),再根据历史交通流量数据,来对交通状况进行预测。从更广泛的角度而言,丰富的信息“图表”是计算机理解人、实体及事件之间的相关关系和交互的基础。在开发人工智能系统时,可以利用多个信息图谱,其中包括关于世界、工作以及人的知识图谱。
过去几年,由于可用数据的大幅增加及其他原因,研究人员在这些技术上取得了重大进展。2015年,微软的研究人员使用标准ImageNet 1K图像数据库进行了一项测试,并宣布,他们已经教会计算机识别照片或视频中的客体,其准确度与人无异。2017年,微软的研究人员宣布,他们已经开发出一个语音识别系统,能够像专业的转录团队一样准确地理解口语;使用标准Switchboard数据集进行的测试显示,出错率仅为5.1%。实质上,人工智能增强型计算机在大多数情况下可以像人一样准确地看和听。近日,微软研究团队宣布其研发的机器翻译系统在通用新闻报道测试集newstest2017 的中-英测试集上达到了人类水平。机器翻译是自然语言处理领域最具挑战性的研究任务之一。