『机器学习』入门教程汇总

640?wx_fmt=jpeg

这是我们老师根据现有资源整理的一个机器学习路径。涵盖了Numpy,Scipy,Pandas,Scikit-learn,Matplotlib 等开源工具的学习,并完成从数据清理、数据分析、模型构建,到最终的预测评估及可视化呈现。


“成为编程大牛要一门好语言加一点点天分。一门好语言,一点点天分,再加一份坚持。要是天分少,光靠坚持也行。”


入门知识

  1.  Linux 基础入门(新版)

  2. Github 快速上手实战教程

  3. Python3 简明教程

  4. NumPy 百题大冲关

  5. Pandas 百题大冲关

  6. 使用 Matplotlib 绘制 2D 和 3D 图形

本教程的正确食用姿势:区别于目前所有主流教程,这类教程的核心就是动手!跟着文档说明,在在线的Linux系统中一步一步地敲出基础知识,各种有趣项目;走出只看书、看视频却不动手的禁区,你会比别人学的更快的,放心。


算法基础

1. 基于SVM的猫咪图片识别器

SVM(支持向量机)是一种常用的机器学习分类算法。教程使用HOG+SVM算法和OpenCV实现一个图片分类器,通过自己训练分类器,达到可以判断任意图片是否是猫咪的效果。

2. K-近邻算法实现手写数字识别系统

从电影题材分类的例子入手,详细讲述 k-近邻算法的原理。在这之后,我们将会使用该算法实现手写数字识别系统,书籍教程配套实验练习,帮助您更好得实战。

3. Spark 基础之使用机器学习库 MLlib

你将可以学习到 Spark 的机器学习库—— MLlib 的相关知识,了解 MLlib 与 ML 之间的区别和联系,掌握 MLlib 中的几个基本数据类型。同时,还将通过一个电影推荐的实例,讲解如何利用机器学习算法解决实际问题。

4. 决策树实战项目-鸢尾花分类

了解决策树的基本概念,学习决策树生成过程中的 ID3, C4.5 及 CART 算法及原理。最后通过 scikit-learn 提供的决策树算法完成鸢尾花分类实验。

640?wx_fmt=jpeg


5. 使用逻辑回归预测IPO市场

在20世纪90年代末,获得了对的IPO(首次公开募股)就像赢得彩票一样。通过对一系列数据进行清洗、建模、分类,来获一个可以预测IPO市场的简单模型。

6. 《Python 贝叶斯分析》- 利用逻辑回归实现鸢尾花分类

讲解逻辑回归模型的概念,以及由线性回归扩展为逻辑回归的逆连结函数概念,并利用逻辑回归对鸢尾花进行分类。

640?wx_fmt=jpeg


中场休息......笑一个吧!

640?wx_fmt=jpeg


基础项目

1. 人机对战初体验:Python基于Pygame实现四子棋游戏

利用Python模拟AI和玩家进行四子棋游戏,利用游戏实验Pygame库,为游戏提供界面和操作支持。AI算法借用蒙特卡洛搜索树思想。通过设置AI的难度系数,即AI所能考虑到的未来棋子的可能走向,从而选择出最佳的方案和玩家对抗。

2.Python 实现英文新闻摘要自动提取

新闻摘要提取就是除去新闻中冗余的部分,只保留关键的语句。教程将通过两个实验来为大家介绍两个不同的提取摘要算法,并通过python语言完成英文新闻摘要的自动提取。

640?wx_fmt=jpeg



3. 使用 Python 实现深度神经网络

教你使用 Python 实现一个深度神经网络,让你在实际动手的过程中理解深度学习的一些基本原理,带你真正入门深度学习。

4. 使用卷积神经网络进行图片分类

卷积神经网络特别适合于处理图像相关问题,教程一边讲解卷积神经网络原理,一边带你动手使用caffe深度学习框架进行图片分类。

640?wx_fmt=jpeg


5. 基于卷积神经网络实现图片风格的迁移

基于卷积神经网络,使用Caffe框架,探讨图片风格迁移背后的算法原理,手把手教你实现和Prisma一样的功能,教计算机学习梵高作画。


开源工具学习

1. scikit-learn 实战之非监督学习

机器学习中,除了常见的监督学习之外,还有一个非常重要的分支 —— 非监督学习。本教程将带你了解非监督学习,并学会使用 scikit-learn 解决非监督学习问题。

2. scikit-learn 实战之监督学习

监督学习是机器学习中最为常见、应用最为广泛的分支之一。本教程将带你了解监督学习,并学会使用 scikit-learn 提供的各类监督学习方法解决实际问题。

640?wx_fmt=jpeg


3. 深度学习初探--入门DL主流框架

通过8个实验,带领同学们入门TensorFlow、Theano、Keras 及 Caffe 几个主流的深度学习框架,通过项目实践使同学了解如何利用这些框架搭建自己的深度学习神经网络。


中场休息......要么面带桃花,要么面带微笑。

640?wx_fmt=jpeg



进阶项目

1. Python 应用马尔可夫链算法实现随机文本生成

应用马尔可夫链算法,实现根据给定训练文本,输出随机生成的中/英文文本。使用 Python 实现一个类,封装可供使用的方法。

2. 神经网络实现人脸识别任务

利用基于无监督学习的自编码器对人脸数据进行特征提取,进行图片降维,利用降维后的结果作为有监督学习分类器的输入,最终利用一个三层神经网络实现人脸识别的任务。

640?wx_fmt=jpeg

3. 基于无监督学习的自编码器实现

介绍一种基于无监督学习神经网络数据降维的一种应用——自联想存储器。

4. NBA常规赛结果预测:利用Python进行比赛数据分析

利用NBA在2015~2016年的比赛统计数据进行回归模型建立,最终在今年2016~2017的常规赛中预测每场比赛的输赢情况。

640?wx_fmt=jpeg

5. Python 气象数据分析:《Python 数据分析实战》

先会对数据进行清洗,然后运用 Python 中 matplotlib 模块的对数据进行可视化处理,最终从清晰的图表中得出我们的结论。

6. Twitter数据情感分析

使用Spark MLlib对Twitter上的流数据进行情感分析,并且利用Python的工具包basemap可视化美国不同的州对于曾经的总统候选人情感分析结果。

640?wx_fmt=jpeg

7. Ebay 在线拍卖数据分析

利用 eBay 上的拍卖数据进行数据分析,实现通过数据判断拍卖最终是否可以成功交易和预测最终成交的价格。

8. 大数据带你挖掘打车的秘籍

基于某市的出租车行驶轨迹数据,带你学习如何应用Spark SQL和机器学习相关技巧,并且通过数据可视化手段展现分析结果。

640?wx_fmt=jpeg


9. 使用 Spark 和 D3.js 分析航班大数据

在航班数据分析实验中,可以学习到如何使用 OpenRefine 进行简单的数据清洗,以及如何通过 Spark 提供的 DataFrame、 SQL 和机器学习框架等工具,对航班起降的记录数据进行分析。


如果你看到这里,你已经超过91.23%对机器学习感兴趣的人啦噢嘿嘿。你知不知道,有句话是这样说的:一件事,1000人想去做,100人开始做了,最终,只有1个人坚持到了最后。

话虽没有绝对,但想想看,今天确实是你生命中最年轻的一天啦,所以,想要做的事,勇敢捡起来做吧!祝你学习顺利。

640?wx_fmt=png

今日推荐

点击图片查看详情

640?wx_fmt=jpeg


第一弹:超全Python学习资源整理(入门系列)

第二弹:超全Python学习资源整理(进阶系列)

8个爽滑如丝的Windows小软件,不好用你拿王思葱砸死我

60人,42天,死磕“高薪却高难度”的机器学习,结果如下。

武侠版编程语言...Java像张无忌还是令狐冲?



640?wx_fmt=jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值