目前人工智能研究方向有哪些
专访微软沈向洋:感知和认知是人工智能研究方向
微软执行副总裁沈向洋在主题演讲阐述人工智能
在西雅图开幕的Build全球开发者大会上,微软首次没有在首日主题演讲提到Windows,将最重要的位置留给了云服务和人工智能。微软CEO萨提亚·纳德拉(SatyaNadella)更明确提出,微软要用人工智能重新定义微软的所有业务。
如果说人工智能是贯穿未来微软所有业务的血液,那么领导微软未来核心竞争力的重任就落在了微软全球执行副总裁、人工智能及研究事业部负责人沈向洋的肩上。大会首日的主题演讲,正是由沈向洋来最后进行压轴技术展示。
在主题演讲之后,沈向洋接受了包括新浪科技在内的中国媒体群访。虽然已经在台上演说了将近一个小时,但在近一个小时的采访过程中,沈向洋一直站着侃侃而谈。谈到人工智能未来发展的时候,这位美国科技巨头公司职位最高的华人脸上挂着一种自然的兴奋。
AI重新定义微软
谈到如何具体实施“人工智能重新定义微软业务”时,沈向洋表示,微软所有的产品都必须要人工智能化。举例来说,所有的Office产品都正在进行人工智能化,很多技术都还是刚刚开始。Powerpoint不仅加入了自动翻译功能,还添加了图片自动说明的功能。Word里面也使用了人工智能技术,其中最激动人心的技术就是机器阅读。
他介绍称,微软刚刚收购了一家加拿大人工智能创业公司Maluuba,后者就是用自然语言和深度学习的方法来做机器阅读功能。这方面的技术会给Office带来巨大的影响。目前微软人工智能部门和Office部门正在密切协作。
而在微软的转型重点云服务,微软在努力用人工智能的云帮助企业用户,其中包括Azure云服务中的认知服务,这会是Azure未来的重中之重。而Windows部门和Hololens也加入了很多计算机视觉和计算机语音方面的人工智能技术。
对话交互AI是方向
对话交互人工智能(ConversationalAI)的概念是过去一年各大人工智能公司都在推崇的概念。沈向洋介绍称,计算机最早是指令界面,后来是图形交互界面,但这些还是需要人类学习计算机的语言。到了对话交互人工智能的阶段,则是计算机来学习人类的语言。
但他强调,目前对话交互人工智能的产品研发还处在早期阶段,还远远没有达到通过对话实现人机交互。微软的Cortana和苹果的Siri都还是计算机根据人类指令完成一些任务。
沈向洋表示,自己比较看好聊天机器人的发展方向,微软在中国推出了小冰,在日本做了Rinna,在美国推出了Zo,这些都是计算机试图理解人类情感的尝试。他提出,人工智能只有智商IQ是远远不够的,还需要拥有情商。而且目前人工智能的水平甚至还没有达到一个四五岁孩子的能力。
感知和认知是AI研究方向
沈向洋提到,人工智能这个词汇是上世纪六十年代美国计算机教授约翰·麦卡锡(JohnMcCarthy)最先提出的。人的智能分为感知和认知两个部分。在感知方面,最大的一部分是视觉感知,然后是听觉,之后还是其他感知。
在这方面,计算机进展很大。他预计,未来五年计算机语音识别可以达到识别人类的水平,未来十年计算机视觉也可以达到这一点。实际上,今天计算机视觉在人脸识别方面已经超过了人类,但到一个新地点,看到一个新东西就可以识别和理解,这大概需要十年的时间。
但谈到认知,计算机却远远没有达到和人类相比的水平。首先是自然语言处理,然后是知识获取。在自然语言处理方面,目前的深度学习方法虽然带来了一些帮助,但解出来的效果还不是足够好。
沈向洋继续阐述说,深度学习是目前最大的突破,但也存在一个问题——虽然效果非常好,但却没有办法解释。人类可以分析出为什么一二三,但深度学习和人工智能目前都做不到。
共同推进行业发展
在谈到人工智能未来发展的规范时,沈向洋介绍微软刚刚成立一个“人工智能伦理委员会”,由人工智能研究院和微软法务部门的负责人担任联席主席,微软每一个大业务和产品部门都会派代表参加委员会。
此外,去年12月,微软还联合谷歌、Facebook、亚马逊、IBM五家人工智能领域的巨头成立了人工智能合作组织(PartnershiponAI),共同制定人工智能行业未来的发展规范。据沈向洋介绍,目前这个组织已经有100多家公司加入其中。
他提到,微软会提供一个平台和工具,向科研人员开放;同时也做垂直领域,包括OfficeAI和在云里面的应用。作为一家商业公司,微软和其他平台竞争很正常。谷歌和亚马逊都在积极推进人工智能的研究,但大家作为一个社区,应该聚集一些力量。
“这方面可以从当初Android的兴起中学习一些经验。深度学习下一波浪潮中,我们怎样可以做到更好。我也不觉得微软一家公司就可以做出这些东西。现在微软已经是非常开源了,包括完全开源的CNTK。开源对这个世界的科技发展产生了巨大的深远影响,微软会完全拥抱开源。”
如果说人工智能是贯穿未来微软所有业务的血液,那么领导微软未来核心竞争力的重任就落在了微软全球执行副总裁、人工智能及研究事业部负责人沈向洋的肩上。大会首日的主题演讲,正是由沈向洋来最后进行压轴技术展示。
在主题演讲之后,沈向洋接受了包括新浪科技在内的中国媒体群访。虽然已经在台上演说了将近一个小时,但在近一个小时的采访过程中,沈向洋一直站着侃侃而谈。谈到人工智能未来发展的时候,这位美国科技巨头公司职位最高的华人脸上挂着一种自然的兴奋。
AI重新定义微软
谈到如何具体实施“人工智能重新定义微软业务”时,沈向洋表示,微软所有的产品都必须要人工智能化。举例来说,所有的Office产品都正在进行人工智能化,很多技术都还是刚刚开始。Powerpoint不仅加入了自动翻译功能,还添加了图片自动说明的功能。Word里面也使用了人工智能技术,其中最激动人心的技术就是机器阅读。
他介绍称,微软刚刚收购了一家加拿大人工智能创业公司Maluuba,后者就是用自然语言和深度学习的方法来做机器阅读功能。这方面的技术会给Office带来巨大的影响。目前微软人工智能部门和Office部门正在密切协作。
而在微软的转型重点云服务,微软在努力用人工智能的云帮助企业用户,其中包括Azure云服务中的认知服务,这会是Azure未来的重中之重。而Windows部门和Hololens也加入了很多计算机视觉和计算机语音方面的人工智能技术。
对话交互AI是方向
对话交互人工智能(ConversationalAI)的概念是过去一年各大人工智能公司都在推崇的概念。沈向洋介绍称,计算机最早是指令界面,后来是图形交互界面,但这些还是需要人类学习计算机的语言。到了对话交互人工智能的阶段,则是计算机来学习人类的语言。
但他强调,目前对话交互人工智能的产品研发还处在早期阶段,还远远没有达到通过对话实现人机交互。微软的Cortana和苹果的Siri都还是计算机根据人类指令完成一些任务。
沈向洋表示,自己比较看好聊天机器人的发展方向,微软在中国推出了小冰,在日本做了Rinna,在美国推出了Zo,这些都是计算机试图理解人类情感的尝试。他提出,人工智能只有智商IQ是远远不够的,还需要拥有情商。而且目前人工智能的水平甚至还没有达到一个四五岁孩子的能力。
感知和认知是AI研究方向
沈向洋提到,人工智能这个词汇是上世纪六十年代美国计算机教授约翰·麦卡锡(JohnMcCarthy)最先提出的。人的智能分为感知和认知两个部分。在感知方面,最大的一部分是视觉感知,然后是听觉,之后还是其他感知。
在这方面,计算机进展很大。他预计,未来五年计算机语音识别可以达到识别人类的水平,未来十年计算机视觉也可以达到这一点。实际上,今天计算机视觉在人脸识别方面已经超过了人类,但到一个新地点,看到一个新东西就可以识别和理解,这大概需要十年的时间。
但谈到认知,计算机却远远没有达到和人类相比的水平。首先是自然语言处理,然后是知识获取。在自然语言处理方面,目前的深度学习方法虽然带来了一些帮助,但解出来的效果还不是足够好。
沈向洋继续阐述说,深度学习是目前最大的突破,但也存在一个问题——虽然效果非常好,但却没有办法解释。人类可以分析出为什么一二三,但深度学习和人工智能目前都做不到。
共同推进行业发展
在谈到人工智能未来发展的规范时,沈向洋介绍微软刚刚成立一个“人工智能伦理委员会”,由人工智能研究院和微软法务部门的负责人担任联席主席,微软每一个大业务和产品部门都会派代表参加委员会。
此外,去年12月,微软还联合谷歌、Facebook、亚马逊、IBM五家人工智能领域的巨头成立了人工智能合作组织(PartnershiponAI),共同制定人工智能行业未来的发展规范。据沈向洋介绍,目前这个组织已经有100多家公司加入其中。
他提到,微软会提供一个平台和工具,向科研人员开放;同时也做垂直领域,包括OfficeAI和在云里面的应用。作为一家商业公司,微软和其他平台竞争很正常。谷歌和亚马逊都在积极推进人工智能的研究,但大家作为一个社区,应该聚集一些力量。
“这方面可以从当初Android的兴起中学习一些经验。深度学习下一波浪潮中,我们怎样可以做到更好。我也不觉得微软一家公司就可以做出这些东西。现在微软已经是非常开源了,包括完全开源的CNTK。开源对这个世界的科技发展产生了巨大的深远影响,微软会完全拥抱开源。”
唇语识别成人工智能研究新方向市场有待深入挖掘
牛津大学研究员YannisAssael表示:“我们相信AI唇读是一种非常实用的辅助性技术,比如更智能的助听器,不便出声的公共场合,以及在嘈杂环境下精准的语音识别等。”举例而言:通过唇语识别,让无法开口说话的残障人士“开口说话”;让听力障碍者和不少老年人更清晰地听懂他人;而在军事情报领域,唇语识别让远距离获取情报成为可能。
人工智能技术方兴未艾。在大数据分析、云计算等基础上已经发展起来众多的实际应用技术,比如人脸识别、图像识别、语音识别等等,不断挑战着人们对科技的新认知。最近,另一种应用技术——唇语识别技术,让人们看到人工智能又给人们开了一扇窗。
据介绍,唇语识别技术,简单地说即终端设备通过大数据技术,捕捉说话时的嘴部动作,来解读说话人所要表达的内容。其最直接的现实应用场景就是,帮助听力、发音障碍者实现与他人的顺畅交流。
其实早在2003年,英特尔公司就曾推出一款名叫视听说识别系统的软件,电脑开发者可以在此基础上研制读懂“唇语”的计算机。而国外技术最纯熟的当属谷歌,其旗下公司DeepmindAI系统的唇语识别正确率在去年已经达到46.8%。
在国内,BAT这些互联网巨头虽未涉足这一领域,但也有一些创新公司在唇语识别技术方面取得了突破。6月20日,《重庆新闻联播》节目就用长达两分多钟的时间,对海云数据的唇语识别技术进行了报道。据报道,该公司唇语识别技术的中文识别率已高达71%,英文识别率达到80%,一度超过了谷歌Deepmind去年的成绩。
唇语识别将成人工智能研究新方向
人们总是对新鲜的事物保持着好奇心,因此比较成熟的唇语识别技术一经曝光就引发了广泛关注。
媒体曾对Google的唇语识别技术进行过多频次、长篇幅的报道,并预测了这项技术的应用场景。比如,可以在嘈杂的环境中向手机发送文字信息,对无声电影进行配音等等。
在刚刚结束的2017数博会上,海云数据唇语识别技术与海尔、360等企业的技术一起入选“数博会2017十大黑科技”,引发国内大数据、人工智能行业从业者的广泛兴趣。中国媒体还将唇语识别技术和武侠小说中的“唇读术”相提并论,为该技术平添了一层神秘色彩。
目前,全世界涉及唇语识别技术研发的企业除了英特尔、谷歌、海云数据之外,还有微软。早在2011年,欧洲游戏媒体就声称微软第二代Kinect体感外设非常强悍,足以“读懂”唇语,还能够检测玩家的愤怒情绪。除了企业,研究唇语识别的还有一些机构,比如英国东英吉利大学等。
据了解,此前各企业和机构对于唇读有不同的称呼,比如lipreading(唇读)、speechreading(视话),visualhearing(视觉来听),hearingbyeye(用眼来听)等,但技术思维理念是一致的。
有分析人士认为,在人工智能即将大范围落地的前夜,唇语识别技术虽然相比其他技术冷僻一些,但也让业内看到了新的方向,相信今后会有更多的公司进入这个领域。
唇语识别当前应用场景相当广阔
基于唇语识别技术开发的产品绝不是一个小众产品。海云数据创始人、CEO冯一村介绍说:“除公共安全领域外,唇语识别还可应用到移动支付、军事情报、残疾人教育等领域。”
比如在公共安全领域,遍布街头的摄像头为安全部门提供了大量的无声视频资料,利用唇语识别技术可以对拍摄到的违法分子的口型进行识别,进而获取有价值的侦查信息。这将是一个巨大的2B市场。
再比如以2C为主的移动支付领域,唇语识别技术也可为支付安全提供更大的保障。尤其是在军事情报领域,随着技术的发展,远距离获取情报获将成为可能。
来自牛津大学唇语技术研究LipNet团队的YannisAssael说:“我们相信,机器唇语解读器有非常大的应用前景,比如改进助听器,公共场所的无声指令(Siri再也不必听到你的声音了),嘈杂环境下的语音识别等。”
有报道认为,人工智能未来将会出现一个数万亿美元的巨大市场,在面对具体乃至细碎的应用场景时,人工智能的细分程度势必如百年前的电力那般触角庞杂。广袤的嫁接空间意味着,从真实应用场景出发,人工智能领域会出现不少蓝海市场,被国内巨头忽视的唇语识别也是其中之一。
国内唇语识别市场有待深入挖掘
相较于国外唇语识别技术“多企争流”的情况,在国内研发该项技术的企业少之又少——在BAT等纷纷布局眼下大热的图像识别、语音识别、人脸识别、无人驾驶技术的大背景下,仅仅有海云数据少数创新公司在该项技术上进行了布局并初步形成研究成果。
究其原因,其一是人工智能细分领域纷繁复杂,这些巨头不可能事无巨细面面俱到;其二是图像识别、语音识别等技术相对成熟,可以较快地投入市场,在逐利的驱使下,肯定要首先进军这些领域。不过,这也从侧面帮助像海云数据这样的创新公司在BAT巨头未涉足的领域获得站稳脚跟的机会,甚至是提前建立起技术壁垒。
业内人士认为,唇语识别虽还未迎来爆发的阶段,但网上随处可见、海量的视频资源已经为其做好大数据方面的准备,随着技术的不断进步,这项技术与将获得越来越快速的发展。
数据显示,DeepMind与牛津大学的研究者使用总长超过5000小时的节目对人工智能唇语识别系统进行训练,正确率已经达到46.8%,比专业读唇人士高出了大概3倍。而海云数据以长达1万多小时的新闻素材为“语料”模板,将中文的识别率提升到了71%。“未来随着‘语料’越来越多,识别率也将稳步提升。”冯一村介绍说。
技术的不断进步也将推动市场的深入挖掘。目前,唇语识别还没有到商用的地步(一般识别率高于95%即可达到商用标准),但随着技术的不断进步和识别率的提升,唇语识别市场或将迎来爆发,其对应的安防、军事、支付等行业也将发生巨大的变化。
浙江大学获微医集团捐赠1亿元成立睿医人工智能研究中心
从上世纪50年代技术萌芽到70年代正式参与到医学诊断中,医学人工智能已经快成为医疗科技进步的代名词。人工神经网络和深度学习领域的不断进步,以及在医疗领域不断兴起的创业潮,都在对现代医学的发展进程产生重大影响。
近年来,人工智能领域大事件不断。IBM自2006年开始研发Watson、2014年谷歌成立收购DeepMind,而在2016年,又因AlphaGo和李世石对弈、Google、Facebook、Amazon、IBM和Microsoft宣布成立AI合作组织等产生的大事件效应,都为人工智能领域的发展有着深远意义,也促使该领域迎来了一波又一波的创业潮。
据CBI报告显示,2016年550家人工智能初创企业共获得50亿美元投资。Gartner副总裁TracyTsai则进一步预测,到2020年,人工智能将产生3000亿美元的商业价值。人工智能+医疗健康的创业项目数量在逐年增加,中国出现了数家值得关注的初创公司,甚至知名高校也跨入这个领域。
名校构建中国首个开放式医学人工智能平台
2017年3月25日,中国著名学府浙江大学宣布成立睿医人工智能研究中心,中国人工智能科学带头人、浙江大学校长吴朝晖教授带头成立专家委员会,并在浙江大学和杭州湾信息港同时挂牌。中心宣布将通过“产学研”一体化模式,构建中国首个开放式医学人工智能平台。
浙江大学在医学人工智能方面有着足够的底气,其计算机学院下设的人工智能研究所是中国最早的人工智能研究机构之一。在2016年国家科技奖评选中,浙江大学有9项获奖位列全国高校第一,在医药学、工学及信息科学等领域的能力国内领先,医学部各附属医院是国内临床医学的佼佼者。
据动脉网(微信号:vcbeat)了解,睿医人工智能研究中心将依托浙江大学计算机学院、信息学院、医学院、药学院、生仪学院等相关院系及附属医院的科研实力,提升人工智能在医疗健康领域的整体水平。
重点研究在临床大数据、影像学和基因组学上的医学人工智能共性关键技术,重点搭建医学人工智能服务平台,培育医学人工智能产业生态环境和第三方医学人工智能服务企业,建立多学科多机构协同创新机制,形成相关行业规范标准,打造医学人工智能高等教育体系等。
为了支持睿医人工智能研究中心的发展,浙江大学校长吴朝晖成立专家委员会、计算机学院吴健教授为中心负责人成立核心研发团队,并配备相应运营和管理辅助人员,同时为中心提供一定数量的博士及硕士研究生名额,推进医学人工智能领域的人才培养。
与此同时,睿医人工智能研究中心同时具备科研平台属性和产业转化平台属性,它不仅是医学人工智能科研中心,还面向浙江大学附属医院及全国医疗机构和学科带头人开放技术合作和应用合作,实现与医疗机构诊疗经验、学术研究、临床数据的对接,寻求科研成果向产业成果的转化,并以产业发展反哺科研工作,实现产学研的协同。
“我们会利用浙江大学基础优势,以开放姿态和各大医疗机构及学科带头人合作,打通数据源,建立多学科、多机构协同机制,争取早日在医学人工智能的关键性技术上取得突破。”吴朝晖校长表示。
优化医疗服务体系,应用场景广阔
人工智能正在成为全球竞争的技术制高点,并于2017年首次进入全国两会政府工作报告。人工智能在医疗领域中的大规模应用始于2011年,目前在虚拟助理、医学影像、药物挖掘、营养学、生物技术、急救室/医院管理、健康管理、精神健康等领域均有涉及。
由此可见,医学人工智能拥有巨大发展前景。以睿医人工智能研究中心为蓝本的高校机构,对于加速人工智能技术在医疗健康领域的应用,加快重大疾病防控技术突破、占据生物医学相关新兴战略性产业发展的主导权、保护医疗健康数据安全、优化医疗服务体系均具有真实价值。
而医学人工智能的应用,将有助于改善医疗服务体系面临优质医疗资源配置不均衡、基层医疗机构和医生服务能力不足、以疾病治疗为中心的“被动医疗”服务模式等诸多现状,优化医疗服务体系。
在睿医人工智能研究中心的发布会现场,我们又见到了一个熟悉的身影——微医。微医向浙江大学捐赠1亿元人民币支持睿医人工智能研究中心发展。
微医为什么会向浙江大学捐赠,支持浙江大学创建睿医人工智能研究中心?微医董事长兼CEO廖杰远向动脉网记者道出了背后的原因。
廖杰远认为,许多人对医学人工智能的理解是碎片性的。医学人工智能的核心有三要素:数据源、技术能力和应用场景。不少医学人工智能企业都是从技术开始,但是技术和算法模型,都是通用的,关键还在于后天的“教育”。
首先,有没有大数据源,不断训练它,让它越来越智能。从一个病种、病程、病点开始,到能够成为医生的助手,这就不是单点行为,一定是一个系统。这个系统的后端,数据源在医院,在各种电子病例里;
其次,医学人工智能形成的医学能力,要有各个医学学科的能力,这样才能形成真正的服务体系;
最后,要有不同的应用场景。医院、医生、患者都是不同的应用场景,三者打通才能成为真正的医学人工智能平台。
如果这个平台只依靠一家企业,或者只依靠某一家机构都比较困难。而浙江大学的条件是绝无仅有的,浙江大学的医、工、信的能力都很强,1981年就开始做人工智能研究,有深厚的底蕴。其校长吴朝晖教授更是人工智能的专家,1991年曾到德国人工智能研究中心深造两年,一直从事相关领域的研究。
因此,从条件上来说,浙江大学可以牵头筹建人工智能研究中心,但高校的每笔经费运用都有指向性,浙江大学要集中大力量来专注医学人工智能,也很需要人力和资金的支持。微医捐赠的1亿万,正是从资金上推动了睿医人工智能研究中心的发展。
当然,仅仅是微医捐的钱是不够的,国家也需要有相应的配套,还需要更多的机构参与,才会形成足够的力量推动这件事。
形成医学人工智能的“中国力量”
在中国面临大专家、大医生稀缺,基层医疗资源薄弱的现状下,医学人工智能的大跨步前进给我们憧憬了一个可期待的未来。睿医人工智能中心出现在这个时间节点,有它的必要性和必然性。正如浙江大学校长吴朝晖所想,我们也期待类似睿医人工智能中心这样的高校科研机构承担起建立自主知识产权的医学人工智能核心的能力,以此创建中国自主知识产权的医学人工智能引擎,并与各大医疗机构、各学科专家及产业界合作,形成医学人工智能的“中国力量”。
本文由大比特资讯收集整理(www.big-bit.com)
人工智能研究的基本对象是知识
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。
可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。
从实用观点来看,人工智能是一门知识工程学:以知识为对象,研究知识的获取、知识的表示方法和知识的使用。
新一代人工智能的三个发展领域是
人工智能是一门新兴的技术学科,它研究和开发用于模拟人类智能的扩展和扩展的理论、方法、技术和应用系统。
人工智能研究的目标是让机器执行一些复杂的任务,这些任务需要聪明的人来完成。也就是说,我们希望机器可以代替我们来解决一些复杂的任务,不仅仅是重复的机械活动,而是一些需要人类智慧才能参与的任务。在本文中,我将解释人工智能技术的三个主要方向,即语音识别,计算机视觉和自然语言处理。