人工智能就是人脸识别?
深度学习和机器学习有什么区别?
大家都在谈的迁移学习到底讲了些啥?
看个新闻都要查字典怎!么!破!
极视角白金科普系列之——AI高频词汇TOP15(入门版)
特!别!放!送!啦!
01/15
计算机视觉 Computer Vision
计算机视觉(Computer Vision,简称 CV)是人工智能学科中发展最快、应用最广的领域之一。
与自然语言处理、语音识别这些不同的是,它是一门研究如何使机器「看」 的科学,其主要任务是通过对采集的图片或视频进行处理以获得相应场景的信息;更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。常见的图片识别、视频识别、人脸识别 等都属于这个领域。
02/15
自然语言处理 Natural Language Processing
自然语言处理(Natural Language Processing,简称NLP)是一门融合语言学、计算机科学、人工智能于一体的科学,它解决的核心问题是「如何让机器/计算机理解人类的自然语言」。
广义的NLP既包括文本,也包括语音;狭义的NLP单指文本处理。文本处理的成熟代表有机器翻译、搜索引擎分词 等;语音处理的成熟代表有语音识别与合成、聊天机器人等。
NLP的「处理」机制涉及自然语言理解(NLU)和自然语言生成 (NLG)两个流程,除了刚才说到的机器翻译、语音识别等领域,还包括:文本分类、信息抽取、自动摘要、智能问答、话题推荐、主题词识别、知识库构建等等。在 NLP 的帮助下,大量模糊而非结构化的人类自然语言将能够被机器解析,信息的理解与处理变得更为高效,人机沟通成为可能。
03/15
语音识别 Voice Recognition
语音识别(Voice Recognition)是指机器/程序接收、解释声音,或理解和执行口头命令的能力。与说话人识别、情感识别、语种识别、语音合成、语音转换、语音分离、语音增强 等同属「语音处理」的范畴,广义来讲同样隶属于NLP领域,如今随着技术应用的发展成熟已愈趋独立。
随着人工智能和智能助手(如亚马逊的Alexa,Apple的Siri和微软的Cortana)的崛起,语音识别已经得到了广泛应用。国内著名的语音识别公司有科大讯飞、思必驰、云知声等。
04/15
知识图谱 Knowledge Graph
知识图谱(Knowledge Graph)在2012年由Google正式提出,可以理解为一种结构化的语义知识库,它以符号形式描述了物理世界中的概念及其相互关系,是人类独有「认知能力」的具象体现。
现有的机器智能更趋向于以深度学习为代表的「感知智能」,它们在诸如语音识别、机器翻译、图像识别 等方面的感知力上已接近或超过人类,但若涉及到像司法判案、医疗诊断、投资决策 等需要复杂背景知识和前后上下文推理的「认知智能」时,机器智能远无法满足要求。
知识图谱作为人类认知的重要表现形式,对现有AI研究从“感知”智能到“认知”智能的跨越奠定了十足的基础。现已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。
05/15
数据挖掘 Data Mining
数据挖掘(Data Mining)一般指从大量繁杂的数据中搜索提取出有着特殊关联性信息的过程。其核心目的在于精炼数据,从而后期服务于未来机器学习和AI的数据使用。
需要注意的是,数据挖掘不仅是「统计分析」,它还包括了:机器学习、情报检索、专家系统(依靠过去的经验法则)和模式识别 等方法。(注:数据挖掘会使用大量机器学习的算法,但是其特定的环境和目的和机器学习不太一样。)现常与「知识发现」(Knowledge discovery in database,简称KDD)一词混用。
06/15
机器学习 Machine Learning
机器学习(Machine Learning,简称ML)是「数据挖掘」领域的一个分支,如今在大数据的带动下逐渐成为了当下显学和主流。它涉及了概率论、统计学、逼近论、凸分析、算法复杂度理论 等多门学科,目的在于研究计算机怎样模拟或实现人类的学习行为,从而获取新的知识技能,重组知识结构,并不断改善自身的性能。
实践上来讲,它是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
机器学习是使计算机具有智能的根本途径,应用遍及计算机视觉、自然语言处理、智能机器人、专家系统、模式识别 等人工智能各个领域。
07/15
深度学习 Deep Learning
深度学习(Deep Learning,简称DL)是「机器学习」领域的一个分支,其概念源于对人工神经网络的研究,指的是机器通过由层叠信息层组成的人工神经网络自主模仿人类思维模式的能力。
「深度」是相对浅层学习而言:一个神经网络被分层来理解数据中的复杂模式和关系。将低层的神经网络特征组合叠加,由此形成更抽象的高层表示属性类别或特征,产生的神经网络就是深度了。
到了当下,经过深度学习技术训练的机器在识别图像方面已不逊于人类,比如识别猫、识别血液中的癌细胞特征、识别MRI扫描图片中的肿瘤。在谷歌AlphaGo学习围棋等等领域,AI已经超越了人类目前水平的极限。
08/15
监督学习 Supervised Learning
监督学习(Supervised Learning)是「机器学习」领域内现有成熟度最高、已成功商用的算法学习方式。(另外几种算法学习方式还包括无监督学习、半监督学习、强化学习 等,如后文)
「监督学习」是指通过已有的训练样本训练得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,将这些预测结果与原「训练数据」的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。
09/15
强化学习 Reinforcement Learning
相比其他学习方法,「强化学习」更接近生物学习的本质,它关注的是智能体如何在环境中采取一系列行为,从而获得最大的累积回报。是从环境状态到动作的映射。
不同于监督模型将输入数据仅作为检查模型对错的方式,在强化学习下,输入数据会直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统 、机器人控制等。
10/15
迁移学习 Transfer Learning
「迁移学习」同样是「机器学习」的一种方法,是指把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域),使得目标领域能够取得更好的学习效果。前百度首席科学家、斯坦福教授吴恩达(Andrew Ng)曾经说过:「迁移学习将会是继监督学习之后的下一个机器学习商业成功的驱动力」。
迁移学习解决了目标领域中仅有少量有标签样本数据甚至没有数据的学习问题,它能够将适用于大数据的模型迁移到小数据上,发现问题的共性,从而将通用的模型迁移到个性化的数据上(比如将饮料的推荐模型成功迁移到无样本数据的糕点领域)。
迁移学习现常用于NLP和计算机视觉领域,如语音识别中应对不同地区的口音,通过电子游戏的模拟画面前期训练自动驾驶汽车等。
11/15
算力
「算力」即计算能力,它与「数据」「算法」并称为AI崛起的三大要素。
2007年以前,受限于当时的算法及数据,通用CPU芯片即可提供足够的计算能力;如今随着AI技术的应用发展,我们对各种硬件设备的算力要求也大幅提高:如Alpha GO 需要1920个CPU+280个GPU才能完成计算;2015年起人工智能的大规模爆发,其中一个主推因素就是(GPU的广泛应用)硬件算力的提升。
现阶段的AI算力芯片主要有:CPU、GPU(通用芯片)、FPGA(半定制化芯片)、ASIC(全定制化芯片),类脑芯片。主要代表公司有IBM、高通、英伟达、英特尔 等。国内则以百度、寒武纪、深鉴科技为代表。
12/15
目标分类 Image Classification
计算机视觉领域的经典任务有三种:分类、检测和分割。
「目标分类」解决「是什么」的问题,一般给定一组已被标记为单一类别的图像(如人、车、物等),我们基于此对一组新的测试图像的类别进行预测,并测量预测的准确性结果。
13/15
目标检测 Object Detection
计算机视觉领域三大经典任务之二——目标检测。
「目标检测」解决「在哪里」的问题,它通常涉及到识别各种子图像,并且围绕每个识别的子图像周围绘制一个边界框。
14/15
目标分割 Object Segmentation
计算机视觉领域三大经典任务之三——目标分割。
「目标分割」解决「各目标对象分别在哪里」的问题,包括语义分割 和实例分割 ,是目标检测更进阶的任务。
「语义分割」在框出每个目标的包围盒(边界框)后,还需要进一步判断图像中哪些像素属于哪个目标。但语义分割不区分属于相同类别的不同实例。例如,当图像中有多只猫时,语义分割会将两只猫整体的所有像素预测为“猫”这个类别。
与此不同的是,「实例分割」需要区分出哪些像素属于第一只猫、哪些像素属于第二只猫。
15/15
图灵测试 The Turing Test
图灵测试(The Turing test)是用来测试AI是否真正具有人工智能这一概念的标准。由被称为人工智能之父的艾伦·麦席森·图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。
进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。
▌参考资料
-计算机视觉-维基百科
-《2017-2018年NLP行业发展趋势分析报告》
-《知识图谱与认知智能》肖仰华
-《数据挖掘/机器学习/人工智能的区别是什么?……》Donx
-《AI技术说:人工智能的相关概念与发展简史》个推
-《深度神经网络算法研究及应用》刘宇宁
-《从机器学习到迁移学习》杨强
-《人工智能芯片:发展史/CPU/FPGA和专用集成电路》SIMIT战略研究室
-《图像分类/目标检测/图像分割……一文计算机视觉全分析》Shravan Murali