「机器学习」等于「神经网络」吗?人工智能基础概念梳理
最后更新于
最后更新于
「机器学习」等于「神经网络」吗?人工智能基础概念梳理
“人工智能,机器学习,神经网络……它们是同义词么?彼此之间是什么关系?”
1955 年,时任达特茅斯学院数学系助理的约翰·麦卡锡开始筹措一场学术会议。
和他一起发起倡议的是来自贝尔实验室的克劳德·香农,来自 IBM 的尼尔·罗切斯特,和时任哈佛大学数学系和神经学系初级研究员的马文·明斯基。
「人工智能」这个词,就诞生在四人起草的提案书里。
第二年夏天,达特茅斯会议顺利召开,人工智能元年由此开启。尽管这场会议并未解决有关人工智能和机器思维的任何具体问题,却为人工智能这个新学科的发展指出了方向。这个包罗万象的新技术领域,试图让机器来解决那些以往只能由人类来解决的问题,比如使用语言,框定概念,并不断自我改进。如今 65 年过去了,最初的一些设想已然实现,另一些则仍然遥遥无期。
人工智能,机器学习,神经网络……这些词语日渐频繁地出现在人们的视野中,也被实际应用于生活的方方面面。它们之间的关系是什么?又各自包含哪些内容?
人工智能与机器学习的关系图 | 译自 Levity
人工智能与人类智能相对,是计算机科学的一个分支,其定义随技术发展阶段的不同而有所区别。简而言之,人工智能就是以机器为载体的人类智能或生物智能,因此也被称为机器智能(吴飞)。
其中,第 3 个定义最接近人工智能的真实发展方向和目标,即创造出像人一样有智能、甚至超人类智能的机器。人工智能研究的首要目的是代替人类智能完成某一个具体领域内的任务,以此为由的分类方法,将人工智能的研究内容划分为计算智能、感知智能、认知智能、行为智能等诸多具体方向。我们常说的机器学习和神经网络,只是这些方向中的一部分。
人工智能主要研究内容 | 莫宏伟,徐丽芳《人工智能导论》
而这些仅能用于解决单一领域内问题、不能将经验泛化到其他领域的人工智能,不论是简单的计算数字,还是复杂的理解语言,都只能算作弱人工智能。它们不具备人类所拥有的综合感官认知能力,比如,能击败世界围棋冠军的AlphaGo,却无法进行简单的算术计算。而科幻作品中更常出现的、甚至会给人类造成种种威胁的人工智能,则属于强人工智能,也叫通用人工智能。它们是人工智能研究的终极目标,能够思考,具有知觉和自我意识,可以达到甚至全面超越人类的智能水平。
如果说人工智能是一种机器的终极状态,那么机器学习就是达到这个状态的方法之一。
从广义上来说,机器学习是一种能够赋予机器学习的能力,以此让它完成直接编程无法完成的功能的方法;但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法(王东云, 刘新玉, 2020) —— 毕竟,在计算机系统中,人类学习时所需要的「经验」,是以「数据」的形式存在的。
依据训练时使用的数据的特点,机器学习的训练方式主要被分为四类:监督式学习,半监督学习,无监督学习,强化学习。《一个人工智能的诞生》中用于识别手写数字、分类鳄鱼与蛇的神经网络,使用的都是监督式学习,你可以在课程中看到具体的训练过程。
监督式学习与人类学习知识的过程很相似,通过老师教给学生知识、学生记住知识的方式进行学习。
在监督式学习中,每个用于训练的数据都被预先标记好理想的输出值 Y,对于同样的输入,为减少理想输出 Y 与模型实际输出 y 之间的差别,机器会对模型进行调整或修改。这个过程是在「老师」的监督下(根据正确的样本进行学习)完成的,因此是监督式学习。
监督式学习常被用于解决分类和回归问题。决策树、支持向量机、朴素贝叶斯、K-近邻算法、逻辑回归算法、线性回归算法等,都是典型的监督式学习算法。
与监督式学习相反,无监督式学习没有「老师」,没有「正确答案」,机器要自己摸索规律,进行自主学习。
在无监督式学习中,训练数据没有被标记出理想输出,机器通过研究数据特征和对数据进行处理分析,获得一个结果。这通常用于没有已知标准的场景,如发现异常数据,划分用户群体等。现在各大电商所使用的个性化推荐,也用到了无监督学习。
无监督学习最常解决的两个问题,是寻找事物共同特征的聚类问题,和降低计算复杂程度的降维问题。
常见的聚类算法有:k-Means算法,Apriori 算法,最大期望演算法(Expectation Maximisation),近邻传播算法(Affinity Propagation),层次聚类(Hierarchical Clustering)。
常见的降维算法有:主成分分析算法(PCA算法),局部线性嵌入(Locally linear embedding)。
在半监督式学习中,只有少量输入数据被打上标签,更多的数据则没有自己的「正确答案」。它常用于获取标记数据的成本较高的情况,例如,在用计算机辅助医学影像分析时,专家没有精力将所有造影中的病灶全部标记出来;在网页上进行商品推荐时,也只有很少的用户会主动标记「我喜欢」和「不感兴趣」。
支付宝的风控与微信「扫一扫」的识物,都已经在使用半监督学习来节省成本,并提升识别效果。将来在机器学习的隐私问题上,半监督学习也可能大有作为,因为它不需要模型接触全部的用户数据。
常见的半监督学习方法有简单自训练、协同训练、标签传播算法等,也包括一些监督式学习算法的延伸,如半监督支持向量机,半监督生成对抗网络。
与以上三种给定样本的训练方法不同,源于行为主义心理学的强化学习是动态的,与时刻变化着的具体环境进行交互。这种方法把学习看作试探评价过程,类似现实生活中的绩效奖励机制,更为接近人类的学习方式。监督和非监督学习更多地应用了统计学,而强化学习则更多地结合了离散数学、随机过程这些数学方法。
强化学习希望智能体在与环境的交互过程中,通过学习策略以获得最佳回报,其目标是学习实现目的的最佳策略。强化学习效果的评价来自环境提供的反馈,而非已经确定的正确动作。因此,强化学习系统必须靠自己的经历进行学习,改进行动方案以适应环境,常应用于动态系统、游戏,和机器人控制。 AlphaGo 的训练过程就使用了强化学习。
典型的强化学习算法包括 Q-learning 和时间差学习(Temporal Difference Learning)。
而神经网络,在机器学习领域中更准确的说法是人工神经网络,「是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经对真实世界物体所作出的交互反应」 (周志华, 2016)。它由很多人工神经元互相连接而成,从结构、实现机理和功能上模拟人类神经网络,不同神经元之间的连接被赋予了不同的权重,而这些权重是可以被计算和学习的参数。
神经网络是实现机器学习任务的方法之一,不同的神经网络可用不同的学习方式进行训练。它起源于试图从结构角度模拟人类智能的联结主义思想 。《一个人工智能的诞生》中讲解的感知器模型,就是一种浅层神经网络。而当一个神经网络中含有至少一个隐藏层时,它就「进化」成了深度神经网络,如卷积神经网络,可以被用于深度学习。
此外,深度学习还可以采用其他模型,如深度信念网络使用的就是一种概率图模型。
人工智能、机器学习和深度学习的关系图 | 译自 Levity
总而言之,机器学习和神经网络都是人工智能得以实现的重要推力,而人工智能所涵盖的研究领域,又不仅局限于这两处。《一个人工智能的诞生》可以带你打开机器学习的大门,理解从简单到复杂的神经网络,但人工智能的世界还很广博,并且仍在延伸发展。
希望你航向更远之地。
(1) McCarthy, J., Minsky, M. L., Rochester, N. and Shannon, C. E. (2006). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence, August 31, 1955. AI Magazine, 27(4).
(2) 周志华. (2016). 机器学习. 清华大学出版社.
(3) 徐丽芳. (2020). 深度学习. 人民邮电出版社.
(4) 王东云, 刘新玉. (2020). 人工智能基础. 电子工业出版社.
(5) 莫宏伟(主编), 徐丽芳(副主编). (2020). 人工智能导论. 人民邮电出版社.
(6) 邱锡鹏. (2021). 神经网络与深度学习. 机械工业出版社.
(7) 杨晓凡. (2019). 从聊胜于无到可堪大用,半监督学习革命悄悄来临. 雷锋网. https://www.leiphone.com/category/academic/hJk7ZcPYtuzgSP7Y.html
(8) Andre Ye. (2020). Supervised Learning, But A Lot Better: Semi-Supervised Learning. Towards data science. https://towardsdatascience.com/supervised-learning-but-a-lot-better-semi-supervised-learning-a42dff534781
(9) 打不死的小强. (2019). 强化学习-Reinforcement learning | RL. easyAI. https://easyai.tech/ai-definition/reinforcement-learning/
(10) easyAI-人工智能知识库. (2019). 什么是无监督学习?概念、使用场景及算法详解. easyAI. https://easyaitech.medium.com/%E4%BB%80%E4%B9%88%E6%98%AF%E6%97%A0%E7%9B%91%E7%9D%A3%E5%AD%A6%E4%B9%A0-%E6%A6%82%E5%BF%B5-%E4%BD%BF%E7%94%A8%E5%9C%BA%E6%99%AF%E5%8F%8A%E7%AE%97%E6%B3%95%E8%AF%A6%E8%A7%A3-190b6f4a7d8d
(11) WPR. (2017). 机器学习:开启智能创新之门. 微信. https://mp.weixin.qq.com/s/kj70R2FRy7Zq_j7aT6tBGQ
(12) 糯米稻谷. (2018). 半监督深度学习小结. https://zhuanlan.zhihu.com/p/33196506
(13) 吴飞. 人工智能:模型与算法. 学习强国. https://www.xuexi.cn/dd763e2ac67da9d9f1c1306e737f9b3c/9b0f04ec6509904be734f5f609a3604a.html
(14) Ruiying Cai. 半监督学习. 机器之心. https://www.jiqizhixin.com/graph/technologies/11fab423-a92b-48d5-8212-79b1ecb46551
(15) Arne Wolfewicz. (2021). A beginner’s guide to how machines learn. https://levity.ai/blog/how-do-machines-learn
(16) Arne Wolfewicz. (2021). Deep learning vs. machine learning – What’s the difference?. https://levity.ai/blog/difference-machine-learning-deep-learning