95后数据科学家教你从零自学机器学习,这有3本入门必看书籍

发表时间:2019-11-15 17:26


文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。




来源 | 量子位(id:QbitAI)

发自 | 凹非寺


厌倦了现在的工作,想转行做数据科学,但是却没有计算机专业的相关学历,应该怎样才能入门?


这类的教程已经有很多。最近一位22岁的数据科学家Dario,以自学经历中用到的资源告诉你,如何从零开始学习数据科学。



所谓从零开始自学,是针对那些可以自主学习在线课程和阅读书籍,却没有上班之余接受课堂教育的人士。


在学习之前,如果你对线性代数、微积分、概率论与统计学、程序设计都不太熟悉,Dario建议先去学习一下这几门数学课程,然后再学习Python。


在学完以上内容后可以进入下面的学习。


01
看书还是看视频


如果想进入数据科学领域,每天一两个小时的学习是必不可少的,是看书还是选择看视频?


很多人都不想在每天工作8小时后还看书,因此视频教程是个不错的选择,而且可以在通勤路上观看。


Dario首先推荐的是Udemy的《数据科学与机器学习Python训练营》,这是他第一次接触数据科学的时候学习的课程。



课程中用Pandas和Numpy进行数据分析,并用Matplotlib和Seaborn进行一些数据可视化。虽然内容不多也不深入,但已经足够入门数据科学了。


Dario还推荐了Coursera上由吴恩达主讲的《机器学习》课程,学习时长大概十多个星期。课程以英文讲述,但是提供中文字幕。


这门课程的质量绝对有保障,大约12万名用户平均评分为4.9(满分5),人气也超高,共有260多万用户注册。



02
三本优秀的入门必看书


如果你更喜欢读书,Dario还推荐了3本入门数据科学的优秀教材。


第一本是《Python数据科学手册》,这本书从Jupyter Notebook入手,内容涵盖了Numpy、Pandas,、Matplotlib和Scikit-Learn等数据科学中最重要的部分。


该书的中文版去年已经出版,网上评分9.3,网友都说这是本优秀的入门级教材,非常适合非计算机专业的学生。



第二本是《统计学习导论》,它的内容会有点数学,但是也很容易阅读。


对于机器学习这样一个广泛的领域,这本书能将篇幅控制在400页左右很不容易。唯一的缺点是代码是用 R语言而不是Python编写的。


这本书的英文版提供免费下载(地址见文末),评分为9.5分,中文版8.3分。



第三本是《Scikit-Learn与TensorFlow机器学习实用指南》,这本书能帮助你深入了解机器学习的概念和算法。目前,该书的英文影印版和中文版都已经出版。



03
下一步


学完所有课程后,Dario建议初学者建立一个GitHub存档,并寻找5个数据集来练手,在这个过程中写出自己的结论和思考过程。


对于你未来要投递的公司来说,让他们看到你的工作很重要。因为你没有相关学位,因此需要以某种方式展示自己在数据科学中的工作,而GitHub是一个不错的选择。



数智物语征稿启事.png


星标我,每天多一点智慧



文章分类: 数智物语
分享到:
关注信数

联系我们


电话     : 021-50196198

E-mail  :   contact@xinshucredit.com

地址     :上海市杨浦区昆明路739号

              文通大厦1209室