自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小赵的博客

机器学习笔记

  • 博客(6)
  • 资源 (7)
  • 收藏
  • 关注

翻译 Python学习笔记(4)——Matplotlib中的annotate(注解)的用法

在上一篇博文ID3决策树算法中,绘制决策树时,使用了Matplotlib的注解工具annotate,借此机会系统学习一下annotate的用法。annotate用于在图形上给数据添加文本注解,而且支持带箭头的划线工具,方便我们在合适的位置添加描述信息。参数说明:Axes.annotate(s, xy, *args, **kwargs)s:注释文本的内容 xy:被注释的坐标点,二维...

2018-09-30 11:25:18 96643 8

原创 机器学习笔记(4)——ID3决策树算法及其Python实现

决策树是一种基于树结构来进行决策的分类算法,我们希望从给定的训练数据集学得一个模型(即决策树),用该模型对新样本分类。决策树可以非常直观展现分类的过程和结果,一旦模型构建成功,对新样本的分类效率也相当高。最经典的决策树算法有ID3、C4.5、CART,其中ID3算法是最早被提出的,它可以处理离散属性样本的分类,C4.5和CART算法则可以处理更加复杂的分类问题,本文重点介绍ID3算法。举个...

2018-09-27 16:07:37 38034 53

原创 Python学习笔记(3)——列表的索引、切片、增删改和排序

列表是由一系列按顺序排列的元素组成,列表的元素可以是字母、数字或任何东西,它们之间没有关系,用方括号([ ])表示列表。>>> numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]>>> numbers[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]1. 索引从0开始与大多数编程语言一样,列表的索引从...

2018-09-18 17:20:52 3131

原创 机器学习笔记(3)——使用聚类分析算法对文本分类(分类数k未知)

聚类分析是一种无监督机器学习(训练样本的标记信息是未知的)算法,它的目标是将相似的对象归到同一个簇中,将不相似的对象归到不同的簇中。如果要使用聚类分析算法对一堆文本分类,关键要解决这几个问题:如何衡量两个对象是否相似 算法的性能怎么度量 如何确定分类的个数或聚类结束的条件 选择哪种分类算法下面就带着这几个问题,以我工作中的一个业务需求为例,来学习一下怎么对中文文本进行聚类。(此文略长...

2018-09-14 11:37:13 52359 230

原创 Python学习笔记(2)——字符串常用方法(对齐、替换、拆分、合并)

1. 字符串对齐——center、ljust、rjust通过在两边填充字符(默认空格)让字符串居中、左对齐、右对齐。2. 查找子串——find、index、countfind:查找子串,返回子串第一个字符的索引,如果没找到返回-1。index:查找子串,返回子串第一个字符的索引,如果没找到引发异常。count:计算子串出现的次数。注意:以上三个方法均可指定起点和终点,但...

2018-09-04 16:55:15 3295

原创 Python学习笔记(1)——字符串拼接、长字符串、原始字符串r、格式设置%

1. 单引号和双引号字符串可以用单引号或双引号括起来,含义是一样的。但是当字符串中有引号时,可以将单引号和双引号结合使用,或使用反斜杠转义。>>> "Hello world!"'Hello world!'>>> 'Hello world!''Hello world!'>>> "Let's go.""Let's go

2018-09-04 16:55:04 2050

OpenCV Haar Cascade分类器XML文件

Python版本的OpenCV库中,人脸识别Haar级联(Haar Cascade)的XML文件下载。

2020-07-28

apriori关联分析算法python代码

资源中包含apriori关联分析算法的Python代码,python的版本为3.6,使用pycharm平台运行即可。

2020-01-06

HCluster.py

资源中包含层次聚类算法的Python代码,不含测试数据,python的版本为2.7,您运行代码前,将测试文件路径修改为您本地的存储路径,使用pycharm平台运行即可。请自行准备测试数据。

2020-01-02

Logistic算法(随机梯度下降法)的Python代码和数据样本

资源中包含随机梯度下降逻辑回归算法的Python代码和测试数据,python的版本为3.6,您运行代码前,将测试文件路径修改为您本地的存储路径,使用pycharm平台运行即可。

2019-03-12

Logistic回归算法的Python代码和数据样本

资源中包含逻辑回归算法的Python代码和测试数据,python的版本为3.6,您运行代码前,将测试文件路径修改为您本地的存储路径,使用pycharm平台运行即可。

2019-01-28

C4.5决策树算法的Python代码和数据样本

资源中包含完整的C4.5决策树算法Python代码和测试数据,其中有4个文件:C45.py是算法的实现代码,treePlotter.py是绘制决策树代码,PlayData.txt是样本数据,C45test.py用来构建、绘制并测试决策树,您可以运行该文件来依次进行决策树的构建、剪枝、绘制树型图,并对测试样本进行分类。

2018-12-21

朴素贝叶斯算法的邮件数据

《机器学习笔记(2)——使用朴素贝叶斯算法过滤(中英文)垃圾邮件》 一文中的邮件数据

2018-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除