机器学习
__Fang Wei__
这个作者很懒,什么都没留下…
展开
-
机器学习入门(一)科学计算库Numpy
1、概述因为搬家和结婚的事比较忙,好久没更新博客了,TensorFlow的学习进度到了人脸识别,但是,总感觉自己都没写多少代码,这样跟学习Linux只会ls和cd命令有何区别?所以,我打算,更深入的学习机器学习,毕竟深度学习的一些算法也是从机器学习中来的。学习TensorFlow的时候,经常用到Numpy库,当时也没去深入的学习这个库,现在就从这个库开始新的征程。2、Numpy简介Nu...原创 2018-10-04 23:07:56 · 904 阅读 · 0 评论 -
机器学习入门(十一)聚类算法
--------韦访 201811181、概述这一讲,我们来学习聚类算法。我们之前学习的算法中,数据都是有标签的,属于有监督学习,如果数据没有标签,那怎么办?这就属于无监督学习了,而聚类算法就是用来解决无标签数据的分类问题。这一讲,我们主要学习两个聚类算法:K-MEANS算法和DBSCAN算法。下面分别来讲。2、K-MEANS概述先来看K-MEANS算法的几个基本概念,K值:K...原创 2018-11-19 11:38:01 · 509 阅读 · 0 评论 -
机器学习入门(八)sklearn
--------韦访 201811011、概述这一讲我们来学习机器学习中常用的一个库sklearn,用sklearn中的线性回归、逻辑回归和随机森林来预测泰坦尼克号人员获救情况。2、安装sklearn第一步,先安装sklearn库,如果还没安装sklearn库的话,使用下面的命令进行安装,sudo pip install -U scikit-learn 再执行下面的命令安装...原创 2018-11-12 20:50:00 · 903 阅读 · 0 评论 -
机器学习入门(九)贝叶斯算法
--------韦访 201811121、概述最近公司的事太多,累成狗,晚上都不想学习了,没办法,自己选的路,爬也要爬下去。前几天网购了gtx1080ti,比之前的950快多了,不过如果训练的batch稍大也会内存溢出。这些都是题外话了,继续机器学习,这一讲就学贝叶斯算法。2、贝叶斯定理下面通过一个实例来说明贝叶斯算法是个什么鬼。假设一个班级里,男生占60%,女生占40%,男生...原创 2018-11-14 15:00:26 · 555 阅读 · 2 评论 -
机器学习入门(七)集成学习
--------韦访 201811011、概述这一讲,我们来看看集成算学习。集成学习通过构建并结合多个学习器来完成学习任务。目前集成学习大致分为两大类,一类是个体学习器之间不存在强依赖关系,可以同时生成的并行化方法;另一类是个体学习器之间存在强依赖关系,必须串行生成的序列化方法。第一类的代表是Bagging和随机森林,第二类的代表是Boosting。下面一一讲解。2、Bagging模型...原创 2018-11-02 11:16:44 · 384 阅读 · 0 评论 -
机器学习入门(六)决策树
--------韦访 201810301、概述这一讲,我们来看看决策树。2、概念决策树(decision tree)是一种常用的分类与回归方法,其模型为树状结构,如下图所示, 其中,最顶部的圆点为根节点,其他圆点为内部节点,方形为叶子节点。决策树一般分为三步:特征选择、生成决策树、修剪决策树。下面分别说明。3、特征选择特征选择的主要目的是选择对训练数据集具有...原创 2018-11-01 11:58:11 · 649 阅读 · 0 评论 -
机器学习入门(五)回归算法实战一
--------韦访 201810231、概述这一讲,我们来学习怎么使用逻辑回归解决实际问题。假设现在我们有100个学生两次考试成绩以及是否通过考核的历史数据,我们来建个逻辑回归的模型来对以后学生的考试成绩进行预测是否通过。2、查看数据示例数据的下载链接为:https://download.csdn.net/download/rookie_wei/10749893我们先来查看原...原创 2018-10-28 23:51:27 · 581 阅读 · 1 评论 -
机器学习入门(三)可视化库Matplotlib
--------韦访 201810081、概述Matplotlib是Python的一个可视化库,我们在学习TensorFlow的课程中也接触过,说白了,它就是一个画图的工具。下面来简单介绍。2、显示空白的“画板”如果还没安装Matplotlib库,可以使用以下命令安装,sudo apt-get install python-matplotlibsudo apt-get in...原创 2018-10-10 21:42:18 · 936 阅读 · 0 评论 -
tesseract 中英文混合识别
原图如下,要识别上图中的字符,用命令tesseract 05.png 05 -l chi_sim只能很好的识别中文,英文就没那么准了,结果如下,换个字库文件看看,运行命令如下,tesseract 05.png 05_en -l eng运行结果,这下英文识别准确了,中文又掉链子了。有没有什么方法能同时支持这两个字库呢?字库之间用加好"+"连接就可以了,命令...原创 2018-10-18 17:39:50 · 9793 阅读 · 6 评论 -
机器学习入门(二)数据分析处理库pandas
--------韦访 201810051、概述上一讲我们简单学习了Numpy库,这一讲我们继续学习Python的数据处理库Pandas。2、安装Pandas库由于系统是新装的,还没安装Pandas库,所以得先安装,执行以下命令即可,sudo apt-get install python-pandas3、读取CSV数据CSV其实就是用逗号做分隔符的文本文件,可以用exce...原创 2018-10-08 21:47:00 · 3802 阅读 · 0 评论 -
机器学习入门(四)回归算法
--------韦访 201810101、概述现在开始学习算法了,从线性回归和逻辑回归开始。2、线性回归概念关于回归和分类的概念,我们在TensorFlow入门笔记第八讲有说过,这里直接复制过来,分类问题:分类问题希望解决的是将不同的样本分到事先定义好的类别中,比如判断一个零件是否合格的问题就是一个二分类问题。手写体数字识别问题是一个十分类问题(0~9十个数字)。回归问题:...原创 2018-10-17 21:11:33 · 811 阅读 · 0 评论 -
机器学习入门(十)支持向量机
--------韦访 201811141、概述继续学习,支持向量机在传统的机器学习的地位还是很高的,不过,现在风头已经被神经网络盖过了,但是,还是得学习的。2、概念先来看一下,为什么需要支持向量机? 如上图所示,这是一个二分类问题,有三条直线,都能将红点和黄点分开,那么,哪条直线更优?直观上看,中间的那条直线应该是最优的,因为另外两条直线都更接近样本的边界。用另一张图来...原创 2018-11-18 09:15:48 · 777 阅读 · 0 评论