- 博客(6)
- 资源 (7)
- 收藏
- 关注
翻译 Python学习笔记(4)——Matplotlib中的annotate(注解)的用法
在上一篇博文ID3决策树算法中,绘制决策树时,使用了Matplotlib的注解工具annotate,借此机会系统学习一下annotate的用法。annotate用于在图形上给数据添加文本注解,而且支持带箭头的划线工具,方便我们在合适的位置添加描述信息。参数说明:Axes.annotate(s, xy, *args, **kwargs)s:注释文本的内容 xy:被注释的坐标点,二维...
2018-09-30 11:25:18 96643 8
原创 机器学习笔记(4)——ID3决策树算法及其Python实现
决策树是一种基于树结构来进行决策的分类算法,我们希望从给定的训练数据集学得一个模型(即决策树),用该模型对新样本分类。决策树可以非常直观展现分类的过程和结果,一旦模型构建成功,对新样本的分类效率也相当高。最经典的决策树算法有ID3、C4.5、CART,其中ID3算法是最早被提出的,它可以处理离散属性样本的分类,C4.5和CART算法则可以处理更加复杂的分类问题,本文重点介绍ID3算法。举个...
2018-09-27 16:07:37 38034 53
原创 Python学习笔记(3)——列表的索引、切片、增删改和排序
列表是由一系列按顺序排列的元素组成,列表的元素可以是字母、数字或任何东西,它们之间没有关系,用方括号([ ])表示列表。>>> numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]>>> numbers[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]1. 索引从0开始与大多数编程语言一样,列表的索引从...
2018-09-18 17:20:52 3131
原创 机器学习笔记(3)——使用聚类分析算法对文本分类(分类数k未知)
聚类分析是一种无监督机器学习(训练样本的标记信息是未知的)算法,它的目标是将相似的对象归到同一个簇中,将不相似的对象归到不同的簇中。如果要使用聚类分析算法对一堆文本分类,关键要解决这几个问题:如何衡量两个对象是否相似 算法的性能怎么度量 如何确定分类的个数或聚类结束的条件 选择哪种分类算法下面就带着这几个问题,以我工作中的一个业务需求为例,来学习一下怎么对中文文本进行聚类。(此文略长...
2018-09-14 11:37:13 52359 230
原创 Python学习笔记(2)——字符串常用方法(对齐、替换、拆分、合并)
1. 字符串对齐——center、ljust、rjust通过在两边填充字符(默认空格)让字符串居中、左对齐、右对齐。2. 查找子串——find、index、countfind:查找子串,返回子串第一个字符的索引,如果没找到返回-1。index:查找子串,返回子串第一个字符的索引,如果没找到引发异常。count:计算子串出现的次数。注意:以上三个方法均可指定起点和终点,但...
2018-09-04 16:55:15 3295
原创 Python学习笔记(1)——字符串拼接、长字符串、原始字符串r、格式设置%
1. 单引号和双引号字符串可以用单引号或双引号括起来,含义是一样的。但是当字符串中有引号时,可以将单引号和双引号结合使用,或使用反斜杠转义。>>> "Hello world!"'Hello world!'>>> 'Hello world!''Hello world!'>>> "Let's go.""Let's go
2018-09-04 16:55:04 2050
HCluster.py
2020-01-02
Logistic算法(随机梯度下降法)的Python代码和数据样本
2019-03-12
Logistic回归算法的Python代码和数据样本
2019-01-28
C4.5决策树算法的Python代码和数据样本
2018-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人