机器学习
笨蛋程序员
这个作者很懒,什么都没留下…
展开
-
python实现线性回归
本文不涉及线性回归的具体原理,只通过python代码实现算法,并且没有用到机器学习库,根据算法流程一步一步实现。线性回归加载数据# 加载数据def loadData(fileName): file = open(fileName) num = len(file.readline().split('\t')) - 1 # 特征的个数 x = [] # 数据 y = [] # 标签 # 遍历每一条数据 for i in file.readlin原创 2021-02-06 11:17:15 · 280 阅读 · 1 评论 -
python实现Logistic回归
本文不涉及逻辑回归的具体原理,只通过python代码实现算法,并且没有用到机器学习库,根据算法流程一步一步实现。目录逻辑回归数据准备sigmoid函数权重更新分类绘制决策边界逻辑回归数据准备文件中没条数据有两个属性,和一个标签# 数据准备def loadData(): x = [] y = [] fr = open('data.txt') for i in fr.readlines(): i = i.strip().split() # 分隔原创 2021-02-03 15:19:39 · 795 阅读 · 1 评论 -
python实现朴素贝叶斯分类
本文不涉及决贝叶斯算法的原理,只通过python代码实现算法,并且没有用到机器学习库,根据算法流程一步一步实现。目录贝叶斯数据准备模型训练分类贝叶斯这里实现文本分类数据准备首先准备好实验数据及其标签# 创建样本def loadData(): x = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog',原创 2021-02-01 11:39:12 · 497 阅读 · 0 评论 -
python实现决策树算法并绘图
本文不涉及决策树算法的原理,只通过python代码实现算法,并且没有用到机器学习库,根据算法流程一步一步实现。决策树本文使用ID3算法实现决策树。计算熵首先是计算香农熵,需要了解计算公式# 计算数据集的香农熵def ent(data): num = len(data) # 数据的数量 count = {} # 计算标签数量 for d in data: label = d[-1] # 获得数据标签 if label not i原创 2021-01-30 11:29:39 · 2779 阅读 · 0 评论 -
python实现k-近邻算法
本文不设计k-近邻算法的原理,只通过python代码实现算法,并且没有用到机器学习库,根据算法流程一步一步实现。代码实现数据处理假设我们已经获取了数据及其标签的文本文件,如下图所示。数据有3个属性,标签分为3个类型,。python读取数据# 读取数据并记录def readFile(filename): file = open(filename) # 打开文件 lines = file.readlines() # 读取每行数据原创 2021-01-29 11:37:14 · 545 阅读 · 0 评论 -
梯度下降算法介绍
最优化(Optimization)在我们的日常生活中扮演着重要角色,最优化意味着找到问题的最优解。在机器学习中,通过训练集数据找到最优解,并在验证集上进行检测。许多机器学习算法都需要用到最优化,例如线性回归(linear regression)、k最近邻(k-nearest neighbors)、神经网络(neural networks)等。本文着重介绍最优化的一种技术——梯度下降(Gradient Descent)。目录1. 什么是梯度下降2. 使用梯度下降的挑战2.1 数据挑战2.2 梯度挑战2.3原创 2020-09-26 19:35:21 · 1000 阅读 · 0 评论