![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
黑马水牛
这个作者很懒,什么都没留下…
展开
-
第四章基于概率论的朴素贝叶斯分类
第四章基于概率论的朴素贝叶斯分类 本章主要讲基于概率论的分类方法:朴素贝叶斯分类,这里本人只是简单进行了梳理,以及代码分享。 算法介绍 测试代码 import os import numpy as np class Bayes: def __init__(self): pass def CreateDataSet(self): dataset = [ ["my", "dog", "has", "flea", "problems"原创 2021-05-17 20:23:45 · 67 阅读 · 0 评论 -
第三章决策树
第三章决策树 本章主要讲决策树的概念、适用领域、数据集的划分和决策数的构建,这里本人只是简单进行了梳理,以及构建决策树的代码分享。 算法介绍 信息熵 集合信息的度量方式简称熵,信息的期望值,下面是计算熵的计算公式: 其中n是类别数,p(xi)是该类别的概率。 条件熵 其中pi=P(Y|X=xi)的概率。 信息增益 详细介绍可以参考链接:https://zhuanlan.zhihu.com/p/41134986 ID3算法 详细参看链接:https://blog.csdn.net/weixin_43原创 2021-04-30 16:41:29 · 104 阅读 · 1 评论 -
第二章k邻近算法(机器学习实战)
第二章k邻近算法(机器学习实战) 本章主要介绍k邻近算法的基本原理,并附上测试用例代码。 算法介绍 测试代码 测试一 简单的算法测试代码,kNN_1.py。 from numpy import * def createDataSet(): group = array([[1.0, 1.1], [1.0, 1.0], [0.0, 1.0], [0.0, 1.1]]) label = array(['A', 'A', 'B', 'B']) return group, label d原创 2021-04-27 15:38:53 · 69 阅读 · 1 评论