第45期:《动手学机器学习》|已结束

最近,彪悍的上海交大 ACM 班俞勇教授团队推出了一本重量级新书——《动手学机器学习》这对于技术人来说是难得的福音,因为它一次性讲明白了机器学习这回事。

​上海交大 ACM 班到底有多彪悍?看看它的杰出校友们吧。

科研领域有在斯坦福任教的杨笛一,有在卡耐基梅隆大学任教的陈天奇,他也是 XGBoost 作者、TVM发起人。企业界则有依图科技联合创始人林晨曦,第四范式创始人戴文渊。MXNet 的作者大神李沐,其所著的《动手学深度学习》更是诸多技术人的必读经典。

因此 ACM 班在业界享有中国 AI 人才的“黄埔军校”之称。了不起的成就背后是伟大的愿景,ACM 班的创立者俞勇教授一直在为培养中国的图灵奖得主而努力。颁发图灵奖的机构就是 ACM(美国计算机协会),可见俞勇教授给 ACM 班取名时就寄予了多么深切的期望。

《动手学机器学习》的内容来自于 ACM 班的一线教学实践本书作者之一张伟楠根据自己讲授机器学习课程的体会与学生反馈,将理论知识与练习代码进行体系化整理形成初稿。

弄懂机器学习要学会什么

《动手学机器学习》的定位是在引领初学者入门,在内容设置上是从讲解基础理论算法开始,逐渐进入有监督学习模型与无监督学习模型的论述,力求让学习者系统化掌握机器学习的主干知识。
本书的主创团队有三位作者,除了总教头俞勇教授,还有将教学成果整理成书的张伟楠副教授,他在强化学习、数据挖掘、知识图谱等领域颇有建树。作者赵寒烨也在强化学习、机器学习方面有着深入的研究。
实力如此强劲的技术天团,为本书在业界树立了权威的标杆。

下面对书中四个主要部分的内容进行说明。

机器学习基础

在基础部分,主要是帮助学习者抓住最核心的概念和原理,讲解了最基础的两个算法:KNN(K 近邻算法)和线性回归。基于这两个算法讨论了机器学习的基本思想与实验原则。
扎实掌握好这部分内容,就具备了在大部分机器学习场景中上手实践解决问题的能力。

参数化模型

本部分主要是讨论监督学习任务的参数化模型,包括逻辑斯谛回归、双线性模型、神经网络与多层感知机、卷积神经网络、循环神经网络等内容。

这些方法的共通特征,主要是基于数据的损失函数对模型参数求梯度,进而更新模型。

非参数化模型

这部分聚焦在监督学习的非参数化模型上,包括支持向量机、决策树、集成学习与梯度提升决策树等内容。

之所以将非参数模型单独作为一个部分,是为了让学习者从原理和代码方面更好地体会与参数化模型的区别、优劣。

无监督模型

本部分讨论了对于没有标注的数据进行处理的无监督学习方法,包括 K 均值聚类、主成分分析、概率图模型、EM 算法、自动编码器等内容。
对无监督学习进行了不同任务、不同技术角度的讨论,让学习者可以充分体会与监督学习的区别。

image

现在知道了要学什么,接下来再说怎么学。
03

动脑也要动手

《动手学机器学习》的最大亮点就是为动手实践提供了傻瓜式的体验环境,主创团队将 ACM 班的实践成果精炼出来,理论与代码相结合,让学习者可以平滑上手。
书中包括机器学习的概念定义、理论分析和算法过程和可运行代码。学习者可根据自己的学习状况,灵活选择想要阅读的内容。
不过,毕竟不是零基础入门,在动手之前学习者要具备两项基础能力,一是数学概念和数理统计知识,包括矩阵运算、概率分布和数值分析方法等;二是基本的 Python 的编程能力,能看懂代码并调试运行。
本书丰富的技术案例涵盖了基础算法、监督学习的参数化模型与非参数化模型,以及非监督模型。对于书中提到的知识点,学习者都可以亲手实践。主创团队对代码示例进行了精心选择,力求功能简洁且易修改。
所有示例代码按章节分类,生成为 ipynb 格式,学习者可从https://github.com/boyu-ai/Hands-on-ML地址下载。
书中提供的代码都是基于 Python 3 与 PyTorch 框架实现,可用任意支持 ipynb 格式的在线或本地工具运行。
示例中用到的 Python 工具库都有简要说明,每一份示例代码中都包含可以由学习者自行设置的变量,学习者可以实时修改并运行观察结果。
以下是在 Visual Studio Code 环境中运行 KNN 算法的实例。

image

image

是不是意犹未尽?那就来参与本次的赠书活动吧!当然也可以直接点击《动手学机器学习》收入自己的书架,赶紧学习起来!

社区赠书

本次福利将送出《动手学机器学习》* 5本,点击链接也可直接半价优惠购买

截止时间:还需要支付积分,就还有赠书额度,先到先得

领取方式

  1. 支付积分即可兑换,复制“ 积分支付订单号 ”
  2. 在本站中私信我这些内容:积分支付订单号、活动书名、快递信息(姓名、电话、地址)

没有积分怎么办?

社区鼓励高质量的技术交流,所以只要发布有价值内容均可获得积分!

哪些内容算高质量?

1. 高质量的技术分享,原创、翻译、转载均可

2. 高质量的提问与回答,注意阅读《提问的艺术》

3. 分享优质Java与Spring的相关开源项目

另外,内容不错,获得精华贴、或者热门帖还有额外加分哦

THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容