自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小赵的博客

机器学习笔记

  • 博客(3)
  • 资源 (7)
  • 收藏
  • 关注

原创 机器学习笔记(6)——C4.5决策树中的剪枝处理和Python实现

1. 为什么要剪枝还记得决策树的构造过程吗?为了尽可能正确分类训练样本,节点的划分过程会不断重复直到不能再分,这样就可能对训练样本学习的“太好”了,把训练样本的一些特点当做所有数据都具有的一般性质,从而导致过拟合。这时就可以通过剪枝处理去掉一些分支来降低过拟合的风险。剪枝的基本策略有“预剪枝”(prepruning)和“后剪枝”(post-pruning):预剪枝是在决策树的生成过程中...

2018-10-26 14:21:27 20680 61

原创 机器学习笔记(5)——C4.5决策树中的连续值处理和Python实现

在ID3决策树算法中,我们实现了基于离散属性的决策树构造。C4.5决策树在划分属性选择、连续值、缺失值、剪枝等几方面做了改进,内容较多,今天我们专门讨论连续值的处理和Python实现。1. 连续属性离散化C4.5算法中策略是采用二分法将连续属性离散化处理:假定样本集D的连续属性有n个不同的取值,对这些值从小到大排序,得到属性值的集合。把区间的中位点作为候选划分点,于是得到包含n-1个...

2018-10-18 17:05:20 23395 135

原创 Python学习笔记(5)——字典的定义和操作方法

1. 什么是字典字典是Python中唯一的一种内置映射(mapping)类型的数据结构,就像日常生活中的字典一样,可以轻松的找到特定的单词(键),以获悉其定义(值)。字典由键(key)和其相应的值(value)组成,键-值对成为项(item)。例如:dataType = {'string': '字符串', 'list': '列表', 'dict': '字典'}在之前的文章ID3决策树...

2018-10-11 15:30:28 1875

OpenCV Haar Cascade分类器XML文件

Python版本的OpenCV库中,人脸识别Haar级联(Haar Cascade)的XML文件下载。

2020-07-28

apriori关联分析算法python代码

资源中包含apriori关联分析算法的Python代码,python的版本为3.6,使用pycharm平台运行即可。

2020-01-06

HCluster.py

资源中包含层次聚类算法的Python代码,不含测试数据,python的版本为2.7,您运行代码前,将测试文件路径修改为您本地的存储路径,使用pycharm平台运行即可。请自行准备测试数据。

2020-01-02

Logistic算法(随机梯度下降法)的Python代码和数据样本

资源中包含随机梯度下降逻辑回归算法的Python代码和测试数据,python的版本为3.6,您运行代码前,将测试文件路径修改为您本地的存储路径,使用pycharm平台运行即可。

2019-03-12

Logistic回归算法的Python代码和数据样本

资源中包含逻辑回归算法的Python代码和测试数据,python的版本为3.6,您运行代码前,将测试文件路径修改为您本地的存储路径,使用pycharm平台运行即可。

2019-01-28

C4.5决策树算法的Python代码和数据样本

资源中包含完整的C4.5决策树算法Python代码和测试数据,其中有4个文件:C45.py是算法的实现代码,treePlotter.py是绘制决策树代码,PlayData.txt是样本数据,C45test.py用来构建、绘制并测试决策树,您可以运行该文件来依次进行决策树的构建、剪枝、绘制树型图,并对测试样本进行分类。

2018-12-21

朴素贝叶斯算法的邮件数据

《机器学习笔记(2)——使用朴素贝叶斯算法过滤(中英文)垃圾邮件》 一文中的邮件数据

2018-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除