如何从零起步学习AI

数据科学家的成长之路兼学习路线:如何学习ML/DL


前言

    我从2012年一直以一个业余研究者的身份开始学习机器学习,参考了诸多资料写了篇SVM模型的学习笔记。在一直想继续写但每每错不开时间的反复纠结中,于14年年底终于腾出时间,又开始写最大熵、adaboost、聚类、贝叶斯、LDA等模型的学习笔记。当然,很多很多的知识点和模型,还是了解的太浅,所以能有机会就继续学习。

    2015年年初正式创业,我们坚信好的内容依托于在线这个形式,一定可以让千千万万的人从中受益,践行我这几年来始终不变的唯一理想:创造价值 助千万人 领导行业 推动文明。所幸虽然15年全年一年磕磕绊绊,但最终还是所有问题都一一解决了。当然了,原本就没有达不成的目标、没有解决不了的问题、没有沟通不好的事情。然创业之累唯亲身经历创业之人才能真切体会,15年全年,基本没啥时间更新博客,除了终于把拖延了近3年之久的新书《编程之法:面试和算法心得》给出版了。我爱这本书,不管咋样 我付出了心血 对一些人起了帮助、对一些人有用。

    2016年,创业第二年。如在那篇CNN笔记中所写的那样:“我虽不参与讲任何课程,然由于公司在不断开机器学习、深度学习等相关的在线课程,耳濡目染中,总会顺带着学习学习。”于是以一个学员之一的角度开始重写技术博客,谁叫我就是能“用最最小白的方式 把一些初看复杂的东西抽丝剥茧的通俗写出来”呢?写完CNN笔记之后,我们的深度学习课程也即将开始第二期,DL课程一期一期开,我当时想,除了上课听课之外,是不是可以和大家一起做点什么事情?这个时候,市场同事提议,我们可以做一些深度学习方面的实验,于是就有了利用DL学梵高作画、利用DL自动玩flappy bird等一系列有趣的深度学习实验,最终带动近1000人跟我们助教团队一起玩,不亦乐乎!

    迈入到今年2017年,刚好创业两年整。公司的学员从0到2万,讲师团队从1人到现在的总计21人,课程种类从2类到现在的11类,算是取得了一些成绩。在这两年过程中,我们始终坚持品质第一、内容第一,并时刻敢为人先,包括去年11月份国内首家推出GPU云实验平台,后来市场同事再次提议,何不在今年整个全年GPU呢,于是最近,我们推出了2017年会员:¥2999包揽全年全套数据课程和全年GPU云服务。


    回顾过去几年,从在博客里开始整理面试题,然后研究学习数据结构、算法,到后来开始学习机器学习、深度学习,及至15年创业,算是一直在与数据这个东西打交道,虽然自始至终始终是一个从门外窥探门内的业余研究者的身份,但到底是与数据科学渊源很深。

    借助公司七月在线越发的强大,依托它强大的讲师资源,和课程资源,我特意在新的一年给想学数据科学、机器学习、深度学习的朋友,整理一份《数据科学家的成长之路兼学习路线》,祝所有朋友新年再上新巅峰。



数据科学家的成长之路兼学习路线

    上面扯了一堆,现在直入主题。所谓万丈高楼平地起,搞数据科学、机器学习或深度学习,一开始至少得学会跟计算机打交道吧,怎么跟计算机打交道呢?编程。

第一步:学习编程

    实话说,计算机体系很庞大,除了语言、数据机构、算法之外,计算机体系结构、操作系统、网络、数据库等等领域庞大。但不管怎样,学习如何编写代码、如何编程是必需的。学完语言、数据结构、算法等基础知识后,如何更进一步提高编程能力呢?上LeetCode刷题成为很多人的不二之选。
推荐教程:《面试求职算法班》、《LeetCode直播刷题班》

第二步:扎实数学

    数学是搞数据科学的必备基础,数学不扎实,机器学习里很多原理、推导、公式便无法理解透彻,比如单单一个SVM就涉及到求导、凸优化等数学知识。所以如果数学忘了,很有必要复习并重新扎实数学基础。
涵盖内容:微积分、数理统计与概率论、矩阵、凸优化
推荐书籍:数理统计学简史、矩阵分析与应用by张贤达、凸优化(Convex Optimization)
推荐课程:《机器学习中的数学班

第三步:掌握适合数据科学的Python

    python在当今的数据分析很热,广泛应用于金融、电商等领域的大数据分析,也非常适合数据工作者利用它处理数据,所以Python在数据领域应用的越来越广泛。
推荐教程:《Python基础入门班》、《Python数据分析班》、《Python爬虫项目班》

第四步:开始学习机器学习

    机器学习技术在很多领域应用广泛,包括在数据挖掘、搜索、推荐、广告、自然语言处理等等中。所以学好机器学习,是搞更多应用领域的前提条件。此外,学习机器学习,不单单只是学习一个个模型、算法就足够,因为实际的机器学习工作中,分析问题、处理数据、处理特征占绝大部分工作。所以不要以为看到一个课程涵盖许许多多的模型/算法就以为捡到了宝,看一个ML课程有没有工业实战,最快速的判断标准之一就是看它讲不讲以及是否能讲好特征工程、模型调优等工程点。
推荐书籍:PRML
推荐课程:《机器学习班

第五步:再进一步之学习DL

    得益于计算机越发强大的计算能力,神经网络的加强版深度学习(权且容许我这么不专业的叫法)越发火热,从AlphaGo、无人驾驶再到最近的AlphaGo 2.0横扫中日韩顶级棋手,AI可谓出尽了风头,在这个人工智能与大数据的时代,不学点AI,都不好意思出门跟人打招呼说我是搞计算机技术的了。
推荐课程:国内首家提供GPU云平台实战的《深度学习课程


第六步:做实验及上kaggle实战

    纸上得来终觉浅、绝知此事要躬行。理论学习再多最终还是要实战。为降低门槛起见,你可以从做一个一个有趣的深度学习实验开始,比如学梵高作画、自动玩flappy bird等等。然后,在kaggle上多刷刷一些数据竞赛项目
推荐课程:除了上面本身便有实战的机器学习、深度学习课程之外,还推荐《kaggle案例实战班》、《机器学习项目班》、《深度学习项目班》

第七步:实习或工作

    如果你是想做数据挖掘、计算机视觉、自然语言处理,可以继续学相关的课程:https://www.julyedu.com/route。此外,很多经典最新论文值得一读。如果足够了,那就正式出山到实际江湖上闯一闯吧:找份工作,干一把!
推荐公司:有资源、有数据的偏大型一点的公司



参考文献



后记

    关于我所在公司七月在线,有三句话可以介绍之:1 国内最早、最专业、同时也是规模最大的数据教育机构,2 唯一一家拥有数据科学完整课程体系,3 全球首家提供全年GPU云服务。
    另,关于学习数据科学难不难,一句话可概括之:只要你想学、你想做,没有你学不好、做不成的事情。
    七月在线July、二零一七年一月十五日。
阅读更多 登录后自动展开

扫码向博主提问

v_JULY_v

博客专家

结构之法 算法之道博主,七月在线CEO
去开通我的Chat快问
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页