我们精选的 25 门数据科学课程,涵盖哈佛到 Udemy 等众多院校。
训练营和专项课程
Python课程
Udemy机器学习和数据科学课程
自动化和运维 Python
YouTube教程和“课程”
数据可视化课程
我们最近最喜欢的课程
AWS 安全直播!
原文发布 于此处
学习数据科学的方方面面都需要时间。我们之前也写过一些关于不同资源的文章。但我们这次想重点介绍课程,或者类似YouTube上的视频课程。
选择太多了,最好能有一份值得上的课程清单。
我们将从免费的数据科学选项开始,以便您可以决定是否要开始投入更多资金学习课程。
提示:Coursera 可能会让你觉得只有购买课程才是唯一选择。但其实页面最底部有个旁听按钮。如果你喜欢 Coursera,当然应该购买他们的专项课程,但我个人对购买专项课程的感受还不太确定。不过,我确实很喜欢在 Coursera 上课。
选择旁听课程选项,即可免交课程费用。
声明:本文包含联盟链接;如果您通过本文提供的链接购买产品或服务,我可能会获得佣金。
训练营和专项课程
1. 概率与数据导论
本课程将向您介绍数据抽样和探索,以及基础概率论和贝叶斯定理。您将学习各种抽样方法,并探讨这些方法如何影响推断的范围。课程将涵盖多种探索性数据分析技术,包括数值汇总统计和基础数据可视化。您将学习如何安装和使用 R 和 RStudio(免费统计软件),并使用这些软件完成实验练习和最终项目。本课程中的概念和技术将为专项课程中的推断和建模课程奠定基础。
2. 完整的统计学课程
在本专项课程中,您将学习使用 R 分析和可视化数据并创建可重现的数据分析报告,展示对统计推断统一本质的概念理解,进行频率学派和贝叶斯统计推断和建模以理解自然现象并做出基于数据的决策,在不依赖统计术语的情况下正确、有效地、有针对性地传达统计结果,批判基于数据的主张和评估基于数据的决策,以及使用 R 包进行数据分析并处理和可视化数据。
3. 数据科学家的工具箱
本课程将教授如何使用 R 语言进行编程,以及如何利用 R 进行高效的数据分析。您将学习如何安装和配置统计编程环境所需的软件,并了解通用编程语言概念在高级统计语言中的实现方式。课程涵盖统计计算中的实际问题,包括 R 语言编程、数据导入 R、访问 R 包、编写 R 函数、调试、R 代码性能分析以及 R 代码的组织和注释。统计数据分析方面的主题将提供实际案例。
Python课程
4. 人人都能学会的编程(Python入门)
本课程旨在教授所有人使用 Python 进行计算机编程的基础知识。我们将讲解如何使用一系列简单的 Python 指令构建程序。本课程没有先修要求,并且只涉及最简单的数学知识。任何具备一定计算机经验的人都应该能够掌握本课程的内容。
5. Python for Everybody 专业化课程
本专项课程建立在“Python for Everybody”课程的成功基础上,将使用Python编程语言介绍数据结构、网络应用程序接口和数据库等基础编程概念。在毕业设计项目中,您将运用本专项课程所学的技术,设计并创建用于数据检索、处理和可视化的应用程序。
6. Python 数据结构
本课程将介绍Python编程语言的核心数据结构。我们将超越过程式编程的基础知识,探索如何使用Python内置的数据结构(例如列表、字典和元组)来进行日益复杂的数据分析。本课程涵盖教材《Python for Everybody》的第6至10章。本课程使用Python 3。
7. 哈佛大学数据科学专业证书
哈佛大学的这项认证项目将教授您数据科学的关键基础知识,包括 R 语言和机器学习,并通过真实案例研究助您开启数据科学职业生涯。该项目包含 9 门课程,是领先的在线学习平台 edX 上评价最高的在线硕士项目之一。课程内容包括 R 语言基础、可视化、概率论、推断与建模、效率工具、数据整理、线性回归和机器学习,最后还有一个毕业项目,让您有机会检验和实践课程中所学的一切。
8. Python 数据科学和机器学习训练营
这门课程被描述为速成班,但价格却远低于速成班的1.8万至3万美元。当然,这并不能完全取代速成班。然而,对于那些已经具备计算机科学或技术背景,只需要快速掌握数据科学概念的人来说,这门课程是一个非常好的入门选择。
我们推荐这门课程给希望帮助内部员工顺利过渡到新岗位的公司。您可以快速提升工程师或科学家的技能,使他们成为更全面的数据专家。而且,这比聘请顾问来培训团队要便宜得多(我们之前也开设过类似的课程,收费通常在每人每天100美元左右)。这门课程相当于两周的课程。
是的,面授通常效果更好、更全面,因为它可以提问并举出更具体的例子。不过,对于自学者来说,这也不失为一个绝佳的机会,他们可以借此快速入门。
9. 麻省理工学院数据科学与统计学认证(edX平台)
这套包含五门课程的系列课程将帮助您夯实数据科学、统计学和机器学习的基础。您将学习如何分析大数据,并了解如何通过统计推断和概率建模进行数据驱动的预测,从而提取有意义的数据以辅助决策。课程将从概率和统计学的基础知识入手,逐步深入到数据分析技术和机器学习算法。为了更好地完成此认证,建议您具备大学水平的微积分、数学推理能力和Python编程基础。完成此认证后,您可以申请多种职位,例如数据科学家、数据分析师和系统分析师等。
10. 斯坦福大学的机器学习
谷歌大脑和百度人工智能集团前负责人吴恩达与斯坦福大学的其他教授共同创建了这门课程。它是目前最热门的机器学习在线课程和认证之一。您将学习监督学习、无监督学习以及其他关键领域,课程包含多个案例研究和应用实例,帮助您学习如何运用算法构建智能机器人。这绝对是您不容错过的最佳数据科学课程之一。
11. 微软数据科学专业课程
微软的这项专业课程包含9门课程和一个项目,每门课程大约需要16-32小时。这是一个包含10门课程的综合项目,您也可以根据需要选择单门课程。您将学习如何使用Microsoft Excel探索数据,使用Transact-SQL查询关系数据库,使用Excel或Power BI创建数据模型,将统计方法应用于数据,以及使用R或Python探索和转换数据。您将学习数据科学方法论。该项目分为4个主要单元,每个单元包含10门课程。所有课程结束后,您都需要完成一个项目,以帮助您应用在课程中所学的知识。
Udemy机器学习和数据科学课程
12. 机器学习 AZ™:数据科学中的 Python 和 R 实战
这门课程内容全面,涵盖 Python 和 R 语言。它不仅专注于 Scikit-learn,还涉及机器学习的各个方面。此外,这门课程的创建者同时也是 SuperDataScience.com 的所有者,这是一个非常棒的网站,提供播客、课程等丰富资源。所以,即使您不想付费购买课程,也可以随时免费收听播客!
当然,Python并不是数据科学的唯一语言。另一种流行的语言是R(而且,这也不是仅有的两种语言,还有其他一些人们喜欢使用的语言……除了Matlab……我们就不讨论Matlab了)。
评测:机器学习课程 Ml-az 是一门优秀的机器学习入门课程。它全面讲解了大量算法,使学生熟悉 scikit-learn 和其他一些软件包……对于初学者来说,Ml-az 是一门能够激发他们深入学习机器学习兴趣的理想课程。
13. 使用 Python 进行机器学习、数据科学和深度学习
弗兰克·凯恩就此主题开设了另一门精彩的课程,内容比上面提到的书更加丰富。他还会探讨集成学习和偏差权衡。此外,如果您是视觉型学习者,这门课程可能对您更有帮助。课程中还有一个专门章节讲解如何使用 Apache Spark 进行机器学习,这使您能够将这些技术扩展到在计算集群上分析“大数据”。
14.5. 数据科学道场及其 YouTube 频道
Data Science Dojo 在其 YouTube 频道上提供大量优质免费内容,并提供数据科学和Python 培训课程。此外,过去五年里,他们已为全球 1600 多家公司的 6000 多名学员提供数据科学培训。他们的内容涵盖了用于企业培训的实际案例,以及行业专家的演讲和讨论。他们不仅教授技术,还教授如何运用从各种培训中学到的技能来解决不同的业务问题,并进行批判性思考。
14. 数据科学 AZ™:包含真实数据科学练习
我们之前 提到的Kirill Eremenko 的 课程更侧重理论,内容也更全面,但并没有深入讲解数据科学的具体流程。而这门课程则着重介绍数据科学家和商业智能工程师常用的几种工具。虽然这门课程也包含一些商业智能方面的内容,但实际上,很多“数据科学”岗位都需要商业智能技能。因此,根据你所申请的公司和职位,这门课程可能非常适合你。
评测:对于对数据科学充满热情的人来说,这是一门非常棒的课程。但我认为这门课程应该包含一些 R 或 Python 的练习。数据可视化、数据准备和数据通信部分都很出色,但数据建模部分略显薄弱,因为它与实际问题关联性不大,这部分内容需要改进。不过,这门课程引人入胜,完成之后你会受益匪浅。
15. 深度学习 AZ™:动手实践人工神经网络
好,假设你真正感兴趣的是深度学习而不是数据科学,那么这门课程总体来说非常适合你。
正如文章所述,人工智能正在呈指数级增长,这一点毋庸置疑。自动驾驶汽车的行驶里程已达数百万英里,IBM Watson 的诊断能力甚至超过了众多医生,而谷歌 DeepMind 的 AlphaGo 更是在围棋——一项直觉至关重要的游戏中——击败了世界冠军。
但随着人工智能的不断发展,它需要解决的问题也变得越来越复杂。只有深度学习才能解决这些复杂的问题,因此它才是人工智能的核心。
在本课程中,我们将使用真实世界的数据集来解决实际的商业问题。(绝对不是那种每门课程里都会遇到的枯燥乏味的虹膜或数字分类数据集)。本课程将解决六个实际挑战:
- 利用人工神经网络解决客户流失问题
- 用于图像识别的卷积神经网络
- 利用循环神经网络预测股票价格
- 利用自组织映射调查欺诈行为
- 利用玻尔兹曼机创建推荐系统
- 堆叠式自编码器*将接受挑战,角逐 Netflix 100 万美元奖金
自动化和运维 Python
并非所有对数据科学感兴趣的人都想成为研究人员。有些人更想成为开发人员或工程师。这可以说是两种截然不同的数据科学家类型,有些人更喜欢构建、自动化和开发。作为一名数据科学家,这是一种非常宝贵的特质,因为你可以在团队中发挥重要作用,自动化许多需要完成的工作。
为此,你需要对一种脚本语言有扎实的了解。
16. 面向所有人的 Python 自动化 || 学习 Python 3
本课程专为零基础学员或有一定编程经验并希望学习Python的人士设计。Python是IT行业雇主最需要的技能之一。本课程的独特之处在于它既快速又详尽。课程提供足够的细节,帮助您设计和开发自己的Python解决方案。与其他许多Python课程不同,本课程简洁明了,您可以在一个周末内完成学习。
17. 掌握编程面试:数据结构与算法
类似 Python 的东西,但不是之前提到的那种侧重于 Pandas 和 Scikit-learn 等库的 Python。我们指的是操作型 Python。这通常需要对哈希表、循环、文件系统管理等数据结构有一定的了解。下面的课程正能帮到你,它将为你的编程技能打下良好的基础。
YouTube教程和“课程”
假设你不想付费上课,这完全没问题。再次强调,这些课程永远无法取代经验,它们只是为你打下良好的基础。有些人似乎需要付费才能有动力完成课程。但YouTube上有很多很棒的资源。所以我们想列出一些免费的学习资源。
现在,我们想提醒大家一点,前谷歌技术主管帕特里克在他的 YouTube 频道上也提到过这一点:不要把所有时间都花在学习新的教程上。先学习一两个教程,掌握基础知识,然后再开始寻找项目。在做项目的过程中,你应该学习如何利用 API 文档和针对特定问题的视频等资源来提升技能。
否则,你的技能将永远无法真正提升。你基本上只会一遍又一遍地重复学习字母表,而永远无法学习单词、句子、段落、文章等等。
18. Python面向对象编程教程1:类和实例
我们稍后会提到一个涵盖类似主题的 Udemy 课程。不过,如果您正在寻找一套讲解面向对象编程以及数据结构和算法的视频,不妨看看 Corey Schafer 的 频道。他制作了一套非常全面的视频,几乎涵盖了 Python 库前几页所能学到的所有内容。这对于学习如何构建自动化系统非常有帮助。
19. CS Dojo Python 及其他
YouTube 上另一个很棒的频道是 CS Dojo,它不仅提供教程,还会提供一些针对特定问题的视频(而非通用教程)。这个频道涵盖了面试、编码、设计等方方面面。如果你真的想学习编程并找到一份工作,CS Dojo 是一个很棒的频道。当然,并非所有数据科学家都需要掌握 Python 和编程,但有些数据科学家确实需要。如果你想成为一名数据科学家,那么掌握 Python 和编程知识是有价值的。
20. R语言数据科学入门——数据分析(第一部分)
这是一门深入浅出的R语言数据科学入门教程。视频提供完整的数据科学培训,涵盖数据探索、数据整理、数据分析、数据可视化、特征工程和机器学习等各个方面。视频中使用的所有源代码均可在GitHub上获取。
21. R 和 ggplot2 数据可视化入门
最棒的是,David Lagner 在 Data Science Dojo 频道上还有更多完整的教程。
本次网络研讨会中,Dave Langer 将介绍如何使用 ggplot2 包进行数据可视化。研讨会的重点是使用 ggplot2 对数据进行可视化分析,尤其侧重于发现业务的潜在信号/模式。
与会者将学习如何:
- 使用 ggplot 绘制可视化图表,包括自定义渲染输出。
- 根据数据类型和分析性质选择最佳可视化方式。
- 利用 ggplot2 强大的分割功能实现“数据可视化钻取”。
- 从 RStudio 导出 ggplot2 可视化图表,以便在文档和演示文稿中使用。
22. 如何在 R 语言中实现泰坦尼克号 Kaggle 竞赛 --- 第一部分
现在,有些人可能对 Kaggle 感兴趣,想了解更多关于 Kaggle 的信息,以及如何创建能够在该平台上参与竞赛的模型。好消息是,数据科学道场 (Data Science Dojo) 又来帮你了。下面的视频是完整教程的第一部分,它通过一个实际问题的示例,出色地讲解了整个教程。
数据可视化课程
23. Tableau 10 高级培训:精通 Tableau 数据科学
本课程包含数小时的专业 Tableau 视频培训,采用多年行业经验设计的独特数据集,以及既有趣又能让您体验真实世界分析的互动练习。
本课程你将学习:
- 如何利用分组和集合将工作效率提升 10 倍
- 表格计算及其在分析中的强大功能详解
- 如何在 Tableau 中执行分析和数据挖掘
- 如何在 Tableau 中创建动画
- 还有更多精彩内容!
24. 使用 D3.js 和 Firebase 构建数据可视化
我们第一次接触D3是在大学课堂上,当时D3库的联合创始人之一 Jeffrey Heer 向我们演示了它的使用方法。我们当时在华盛顿大学修读生物信息学课程。
D3.js 是一个功能强大的 JavaScript 库,可用于轻松创建数据可视化图表。在本课程中,我将教你如何利用 D3 的强大功能创建各种不同的数据驱动型可视化图表,例如条形图、饼图、折线图、气泡图和树状图。
我们将学习D3选择器、更改SVG属性和样式、比例尺、坐标轴、过渡效果、层级数据等等……
我们最近最喜欢的课程
25. 数据科学与商业分析统计学
现在,这门课程主要是为数据分析师设计的,它并不侧重于 Python,而是使用 Excel。很多人觉得 Excel 的功能不够全面。Excel 和 R 是 Jupyter Notebook 的最初版本,它们帮助分析师和统计学家展示他们的研究成果。因此,我们仍然认为它对一些数据科学家来说非常实用。
统计学是你想要进入的行业的核心驱动力吗?你想成为市场分析师、商业智能分析师、数据分析师还是数据科学家?
那么,你来对地方了!
数据科学和商业分析统计学教材已上线,并附有 Excel 模板!
这就是你的起点。这是一个完美的开始!
很快,你就能掌握基本技能,从而能够理解复杂的统计分析,并将其直接应用于现实生活中。
当然,作为数据科学家、数据工程师或数据分析师,你还可以选择许多其他很棒的课程。但我们只想介绍我们自己上过的课程。目前我们暂且略过Hadoop,正在撰写一篇博文,最终会涵盖我们最喜欢的Hadoop相关资源。不过,Frank Kanes在Udemy上的Hadoop课程非常出色,也是一个不错的选择。
请在评论区告诉我们您最喜欢的课程,如果您想看到更多类似内容,请订阅。
此外,如果您想了解更多关于数据科学、数据工程、商业等方面的知识,请查看以下文章。
你对数据科学或技术感兴趣吗?
文章来源:https://dev.to/seattledataguy/our-25-favorite-data-science-courses-from-harvard-to-udemy-cmf


