原文链接:
最近,很多同学都渴望尝试AI,但却不知道如何开始。 其中,人工智能的核心是机器学习(Machine Learning),它是使计算机智能化的根本途径吉祥物设计,其应用涵盖了人工智能的各个领域。
今天我们将分享一份来自EliteDataScience专门针对想要入门机器学习的自学者的教程,一步步教你如何从基础新手进阶为ML大师。 来吧,别找金币了,这趟旅程是免费的!
您正准备自学机器学习,但不知道如何学习吗?
今天在这篇文章中,我们将教您如何免费获得世界一流的机器学习教育。 您不需要拥有博士学位或成为技术专家。 无论您想成为一名数据科学家还是在开发中使用机器学习算法,您实际上可以比您想象的更快地学习和应用机器学习。
本文告诉你机器学习之路上的几个步骤,确保你不会迷失方向。 开始我们的表演吧。
第一步:首先了解什么是机器学习
在重点学习机器学习之前,最好先明确什么是机器学习,了解机器学习的基本概念。
简而言之,机器学习是教计算机如何从数据中学习卡通形象,然后做出决策或预测。 对于真正的机器学习,计算机必须能够学习识别模型而无需显式编程。
机器学习是计算机科学和统计学的跨学科学科。 它以不同的形式出现在许多领域。 例如,你应该听说过这些术语:数据科学、大数据、人工智能、预测分析、计算机统计、数据挖掘……
尽管机器学习和这些领域之间有很多重叠之处,但它们不应该混淆。 例如,机器学习是数据科学中的一种工具,也可用于处理大数据。
机器学习本身也分为多种类型,例如监督学习、无监督学习、强化学习等。例如:
邮件运营商利用机器学习中的监督学习将垃圾邮件广告信息分类到垃圾桶中; 电子商务公司通过分析消费数据,利用机器学习中的无监督学习对消费者进行分类; 当人类驾驶的汽车中的计算机和摄像头与道路和其他车辆交互并学习如何导航时,就会使用强化学习。
如果你想了解机器学习的入门知识,可以查看一些在线课程。 对于那些想要对机器学习领域的关键概念有基本了解的人来说,Ng Enda 教授的机器学习入门课程绝对是必读的:点击此处。
而“自动驾驶汽车之父”Sebastian Thrun 的《机器学习入门》课程则提供了机器学习的详细介绍,辅以大量的编程操作,帮助你巩固所学知识:点击这里。
当然,季志军整理制作的免费专栏也是必不可少的。 在这里您可以免去安装环境的麻烦,直接投入简单的机器学习训练:
机器学习简明教程,您可以一边观看一边练习
这些课程全部免费!
大致了解了机器学习之后,我们就来到了知识准备阶段。
第二步:初步了解
如果没有基础知识,机器学习确实会显得令人生畏。 要学习机器学习,您不必是数学专业人士或出色的程序员,但您确实需要掌握这些领域的核心技能。
好消息是,一旦你完成了预备工作,剩下的就很容易了。 事实上,机器学习基本上是将统计学和计算机科学的概念应用到数据中。
这一步的基本任务是确保你在编程和统计知识方面不落后。
2-1:数据科学的 Python 编程
如果你不懂编程,就无法使用机器学习。 幸运的是,这里有一个免费教程,教您如何学习用于数据科学的 Python 语言:单击此处。
注:精略集智新增三个资源:
【Python入门】01基本规则
从头开始学习 Python 数据科学完整指南
以及40多个Python学习资源汇总
2-2:数据科学的统计知识
统计知识,尤其是贝叶斯概率,是许多机器学习算法的基本要求。 这里有一个关于数据学习中统计知识学习的教程:点击这里。
2-3:需要学习的数学知识
研究机器学习算法需要一定的线性代数和多变量微积分知识作为基础。 单击此处获取免费学习教程:单击此处。
第三步:开启“海绵模式”,尽可能多地学习原理知识
所谓“海绵模式”,就是像海绵吸水一样,尽可能多地吸收机器学习原理和知识。 这一步和第一步有些类似如何自学ai技术,但不同的是第一步是对机器学习有一个初步的了解。 这一步是要掌握相关原理。
有的同学可能会想:我又不想做基础研究,那我为什么要掌握这些原理呢? 只要会使用机器学习工具包还不够吗?
有这个问题很正常,但对于任何想要在工作中应用机器学习的人来说,学习机器学习的基础知识很重要。 例如,您在应用机器学习时可能会遇到以下问题:
要回答机器学习研究中的这些问题,必须掌握机器学习的知识原理。 这里推荐两门世界一流的机器学习课程如何自学ai技术,一定会让你受益匪浅:
哈佛大学的机器学习课程让您了解从数据收集到数据分析的整个过程:点击这里。
(提示:本课程与Ng Enda教授的课程结合使用效果更佳)
斯坦福大学的机器学习课程清楚地解释了机器学习的核心概念:点击这里。
还有两本参考书值得一读:《统计学习导论》和《统计学习基础》
这两本书英文原版下载地址:
《统计学习简介》
《统计学习的要素》
注:无法阅读英文原版的同学可以阅读这两本书的中文版。
集智还建议您访问 Reddit 上的机器学习论坛:
机器学习第 1 节
机器学习第二节
机器学习第3节
当然,Quora 上的机器学习部分也非常丰富:点击这里。
通过访问论坛来看到高层次的知识并不容易。 你不能停留在新秀阶段。 如果你想升级,你需要阅读专业论文。 arXive 是一个好去处。 它是一个收集物理、数学、计算机科学和生物学论文预印本的网站。
人工智能板块
机器学习部分
如果您觉得自己搜索论文太麻烦,您可以在网站上注册一个帐户,它可以根据您感兴趣的标签向您推送 arXive 上的最新论文。
第四步:有针对性的实践练习
开启“海绵模式”后,你应该已经掌握了机器学习的基本概念,接下来就是实践的时候了。 实际工作就是通过具体的、经过深思熟虑的实际工作来增强你的技能。 这一步有三个目标:
完成此步骤后,您就可以开始进行更大规模的项目了。
4-1 九个基本部分
机器学习是一个非常广泛和丰富的领域,几乎在每个行业都有应用。 因为要学的东西太多,初学者很容易惊慌失措,面对众多模型时很容易迷失方向,看不到大局。
因此,我们将机器学习大致分为九个部分:
机器学习整体学习:
基本的机器学习原理,例如方差权衡知识。
优化:
一种发现模型最佳参数的算法。
数据预处理:
处理缺失数据、偏态分布、异常值等。
采样和分割:
如何分割数据集以调整参数并避免过度拟合。
监督学习:
使用分类和回归模型从标记数据中学习。
无监督学习
使用因子和聚类分析模型从未标记的数据中学习。
模型评估
根据不同的绩效指标做出决策。
集成学习
组合不同的模型以获得更好的性能。
商业应用
机器学习如何帮助不同类型的商业企业。
4-2 实用工具
对于初学者,我们建议使用现成的算法,这样您就可以花时间熟悉机器学习过程,而不是编写算法。 根据您使用的编程语言,有两种很棒的工具:
Scikit-Learn for Python:Poke 教程
R 语言中的插入符号:教程
4-3 使用数据集的实际操作
在这一步中,您需要使用数据集进行模型构建和调试的实际操作,即将您在“海绵模式”阶段学到的理论转换为代码。 我们建议您选择 UCI Machine Learning Repo、Kaggle 和数据集来启动:
UCI 机器学习存储库
Kaggle 数据集
DataGov数据集
第五步:机器学习项目
终于到了最后一步,这也是非常有趣的一步。 到目前为止,我们已经完成了:知识存储、基本原理掌握、针对性练习等。现在我们准备探索更大的项目:
此步骤的目标是练习将机器学习技术应用于完整的端到端分析。
任务:按从易到难的顺序完成下列项目。
5-1:《泰坦尼克号》幸存者预测
泰坦尼克号幸存者预测是练习机器学习的热门选择,并且有许多可用的教程。
Python教程1
Python教程2
R语言教程1
R语言教程2
5-2 从头开始编写算法
我们建议您从一些简单的方面开始:逻辑回归、决策树、k近邻算法等。
如果你遇到困难,这里有一些提示可供参考:
5-3 选择一个感兴趣的项目或感兴趣的领域
事实上,这应该是机器学习最好的部分。 您可以使用机器学习来实现您自己的想法。
如果你实在想不出什么好主意,这里有8个适合初学者的有趣的机器学习实践项目:点击这里。
结论
如果你按照这个步骤,一步步学习,相信你最终会在机器学习方面取得一些成功!
我们还为初学者学习机器学习提供了 10 个技巧:
最后祝愿同学们学业有成!
注:原文为英文,因此列出的大部分学习资源都是英文的。 如果你担心自己英语不好,其实也没关系,因为学习思路都是一样的,找对应阶段的中文学习资料就可以了。
- 本文固定链接: https://wen.nuanque.com/jiaocheng/23457.html
- 转载请注明: nuanquewen 于 吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计 发表
- 文章或作品为作者独立观点不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。本文之内容为用户主动投稿和用户分享产生,如发现内容涉嫌抄袭侵权,请联系在线客服举报,一经查实,本站将立刻删除。本站转载之内容为资源共享、学习交流之目的,请勿使用于商业用途。