首先,让我们探讨深度学习是什么。
深度学习是指由许多层组成的人工神经网络。“深”是指层数多。相比深度学习,其他的许多机器学习算法是浅的,例如 SVM,因为它们没有多层的深架构。多层的架构允许后面的计算建立在前面的计算之上。目前的深度学习网络已经有10+甚至100+层。
多层的存在使得网络能够学习更多的抽象特征。因此,网络的较高层可以获得建立在来自较低层的输入上的更多抽象特征。深度学习网络可以被视为特征提取层(feature extraction layer),其顶部是分类层(Classification layer )。深度学习的能力不在于它的分类,而特征提取。特征提取是自动(没有人为干预)而且多层的。
通过向网络展示大量有标记的示例来训练网络,通过检测误差并调整神经元之间连接的权重以改进结果。重复该优化过程以创建微调后的网络。一旦部署之后,可以利用优化的网络来评估没有标记的图像。
特征工程(Feature engineering)包括找到变量之间的连接并将它们包装到一个新的变量中。深度学习执行自动特征工程。 自动特征工程是深度学习的主要特征。特别是对于图像等非结构化数据来说自动特征工程很重要,因为人工的特征工程非常缓慢而且耗费劳力,并且对执行执行工程的人的领域知识有很大依赖性。
深度学习适合目标函数复杂且数据集较大的问题,但有正例和负例的例子。深度学习也适合涉及层次和抽象的问题。
抽象(Abstraction)是一个概念过程,通过抽象从一般规则和概念中衍生出具体例子的使用和分类。我们可以将抽象视为一个“超级类”(super-category)的创建,包括描述特定目的的示例的共同特征,但会忽略每个示例中的“局部变化”(local changes)。例如,“猫”的抽象包括毛,胡须等。对于深度学习来说,每个层涉及对一个特征的检测,并且随后的层以先前的层为基础。因此,在问题域包括抽象和分层概念的情况下可以使用深度学习。图像识别属于此类别。 相比之下,垃圾邮件检测问题可以被建模为一个spreadsheet,可能就不是需要使用深度学习的复杂问题。
在探讨AI的应用类型之前,我们需要了解三个术语之间的差异,即 AI、深度学习、机器学习。
AI 意味着能够推理的机器(a machine that can Reason)。AI 的更多特征如下(来源自 David Kelnar):
◆ 推理(Reasoning):通过逻辑推理来解决问题的能力。
◆ 知识(Knowledge):呈现有关世界的知识的能力(理解世界上存在某些物体,事件和状态;理解这些要素具有属性;以及理解这些要素可以分类)。
◆ 规划(Planning):设立目标及实现目标的能力
◆ 交流(Communication):理解书面语言和口语的能力。
◆ 感知(Perception):从视觉图像,声音以及其他感官输入推断有关世界的事物的能力。
AI的终极目标是通用的人工智能,它允许机器在普通的人类环境中独立运行。我们今天看到的主要是狭隘的AI(例如NEST恒温器)。AI正在快速发展。目前已有一系列的技术在驱动AI。这些技术包括:图像识别和自动标记,面部识别,文本 – 语音,语音 – 文本,自动翻译,情感分析和图像、视频、文本、语音的情感分析。资料来源:Bill Vorhies。
深度学习算法的进步推动了AI。深度学习算法可以在没有特征的先前定义的情况下检测模式。它们可以被看作是一种混合形式的监督学习,因为仍然需要使用大量的示例训练网络,但不需要预先定义示例的特性(features)。深度学习网络由于算法本身的改进和硬件能力的提升(尤其是GPU)而得到了巨大的进步。
最后,从广义上说,机器学习这个术语意味着可以应用于数据集以找到数据中的模式的任何算法应用。包括有监督,无监督,分割( segmentation),分类或回归等算法。
在上述背景知识的基础上,我们现在讨论12种类型的 AI 问题。
1. 领域专家:涉及基于复杂知识体系的推理问题
包括基于学习法律、金融等知识体系的任务,然后构想在该领域中机器可以模仿专家的过程。
2. 领域扩展:涉及对复杂知识体系进行扩展的问题
在这个问题中,机器学习一个复杂的知识体系,如有关药物的信息,然后向这个领域本身提出新的见解——例如治疗疾病的新药。
3. 复杂计划者:涉及计划的任务
当前的算法(非AI)能够完成许多物流和调度任务。但优化变得越来越复杂,AI可以解决这个问题。一个例子是在物联网中使用AI技术处理稀疏数据集。在这个场景下AI的优势是,因为数据集非常大而且复杂,人类无法检测到数据中的模式,但机器可以很容易做到。
4. 更好的沟通者:设计改善现有的沟通任务
AI 和深度学习对多种沟通模式有帮助,如自动翻译,智能代理等。
5. 新的感知:设计感知的任务
AI和深度学习使更新的感知形式成为可能,如自动驾驶车辆。
6. 企业 AI:AI与企业再造相符合。
AI将被部署在几乎所有的经济部门,例如自动驾驶车辆等得到了媒体的大力关注。有一个原则能适用各种场景,即通过深度学习,AI将被用于自动特征检测(automatic feature dection)以得出新的洞见,这将有助于优化、改进或改变业务流程(比传统机器学习带来的改变更大)。从更广泛的意义来说,这是令AI与企业再造(Re-engineering the Corporation)相符合。
7. 企业AI将非结构化的数据和认知能力添加到ERP和数据仓库
非结构化数据为深度学习和AI提供了巨大的机会。正如 Forbes 在对2017年的技术趋势进行预测时所说:“绝大多数组织能得到的数据是非结构化的,例如通话日志、电子邮件、会议记录、视频和音频数据,虽然这些数据很有价值,但不容易进行一致的格式化以供直接进行定量分析。随着图像识别、情感分析和自然语言处理等领域的进步,这些信息开始开放,因此挖掘这些数据中的信息将是2017年的越来越大的业务。”我非常同意这个观点。在实践中,这意味着通过认知系统增强 ERP 和数据仓库(Data warehosing)系统的功能。
8. 由于AI的二阶后果影响领域的问题
MMC Ventures 投资总监 David Kelnar 在有关第四次工业革命的文章中写道:“机器学习的二阶后果(second-order consequences)将超过其直接影响。深度学习改进了计算机视觉,例如,使得自动驾驶使车辆成为可能。但这些进步带来的影响是什么呢?今天,全英国90%的人和80%的货物通过公路运输。自动驾驶车辆将影响:安全(90%的事故是由于驾驶员注意力不集中引起的);就业(全英国有220万人从事运输和物流行业,年薪约为570亿英镑);保险(自动驾驶车辆将导致预期的汽车保险收入降低63%);部门经济学(消费者可能更多使用按需运输服务来代替私家汽车);车辆吞吐量;城市规划;规章制度等。”
9. 在不远的将来可能从改进的算法中受益的问题
得益于更好的算法或更好的软件,在不远的将来,过去不可能的一些事物将变得可能。例如,语音识别的准确度将继续提高,目前语音识别已经达到人类的最高水平了。2012年谷歌使用LSTM驱动安卓系统上的语音识别。一个半月前,微软的工程师发布报告说,他们的语音识别系统的错误率已经降到5.9%,这个数字恰是人类的最佳水平。
10. 专家系统的演变
专家系统已经存在很长时间了。得益于 AI/深度学习算法,专家系统的大部分能力可以在不久的将来得到实现。如果了解过 IBM Watson 的架构,你可以看到 Watson 的方案带来了专家系统愿景。当然,相同的想法如今可以在 Watson 身上独立实现。
11. 超长序列模式识别
AI技术在序列模式识别中的应用仍然处于早期阶段(还没有得到例如CNN那般的关注),但在我看来,这将是一个快速扩展的空间。有关序列模式识别的背景,可以阅读 Pooyan Safari 的 thesis “Technische Universitat Munchen(TUM)”,以及 Jakob Aungiers 的博客文章“ LSTM Neural Network for Time Series Prediction”。
12. 使用AI扩展情感分析
AI和情感分析之间的相互作用也是一个新的领域。目前在AI和情感分析之间已经有很多协同作用,因为AI应用的许多功能需要情感分析。
AI和情感分析的协同作用可以从四个方面来看,分别是物体识别(object identification),特征提取(feature extraction),定位分类(orientation classification)和集成(integration)。现有的解决方案或可用的系统仍然不完美,或不能满足终端用户的需求。主要的问题是,情感受许多概念化规则(conceptual rules )的支配,而且有更多的线索(也许无限多)可以将这些概念从领会转换为到人类的言语表达。
结论
总结而言,AI 是一个快速发展的领域。虽然 AI 不仅仅是深度学习,但 AI 大部分是由深度学习的进展驱动着的。自动特征学习是 AI 的主要特点。AI 需要许多详细、实用的策略,本文中没有涵盖。好的 AI 设计者应该能够提出更复杂的策略,如预训练和迁移学习(transfer learning)。
AI 也不是万能药。AI 需要高成本(技能、开发和架构),但能带来指数级的性能提高。因此,AI 最终将是有钱的大公司的游戏。但 AI 也是一个“胜者全胜”的游戏,能带来极大的竞争优势。