练习
文章平均质量分 91
htshinichi
社畜
展开
-
【机器学习实战】sklearn库中出现的线性模型(补充前篇线性回归)
线性模型一般我们可以把线性模型写作:f(x)=wTx+bf(x)=wTx+bf(x)=w^Tx+b的形式。sklearn中列举了线性回归、岭回归、lasso回归等线性模型,模型实在是多⊙▽⊙”,现将几个我印象比较深的做一下整理。 为了方便起见,我们令wT=(w1,w2,...,wn,b)wT=(w1,w2,...,wn,b)w^T=(w_1,w_2,...,w_n,b),因此预测值f(x)=...原创 2018-04-14 12:20:34 · 898 阅读 · 0 评论 -
【wxPython学习】实现一个简单的决策树模型训练预测界面
实现一个简单的决策树模型训练预测界面(打包exe)前面写了几个机器学习算法模型,想要做一个可视化的界面,方便数据导入和训练,经过多方调查,选择了比较好入门的wxPython来做GUI。(python版本是3.6.3)一、安装GUI工具wxPythonwxPython下载地址 我用的是anaconda,因此将下载好的whl文件拷贝至anaconda安装位置下的Scripts文件夹(...原创 2018-08-30 23:09:29 · 1733 阅读 · 8 评论 -
【机器学习实战】逻辑回归
逻辑回归1.初始化init(n_iter=100,eta=0.0001,gd=’bgd’)初始化逻辑回归类,默认迭代次数为100,学习率为0.0001,训练为批量梯度下降。训练还可以选择随机梯度下降。def __init__(self,n_iter = 100,eta = 0.0001,gd = 'bgd'): self.n_iter = n_iter self...原创 2018-08-27 20:35:51 · 797 阅读 · 0 评论 -
【机器学习实战】朴素贝叶斯(连续型/离散型)
朴素贝叶斯一、连续型当特征中数据是连续型时,通常有两种方法来估计条件概率。 第一种方法是把每一个连续的数据离散化,然后用相应的离散区间替换连续数值。这种方法对于划分离散区间的粒度要求较高,不能太细,也不能太粗。 第二种方法是假设连续数据服从某个概率分布,使用训练数据估计分布参数,通常我们用高斯分布来表示连续数据的类条件概率分布。 此处我们使用第二种方法: 1.计算高斯概...原创 2018-08-15 21:31:51 · 15737 阅读 · 14 评论 -
【机器学习实战】KNN分类器(未使用KD树搜索)
一、KNN分类器1.初始化函数init(k=5)2.距离函数euclidean_distance(one_sample,X_train)3.获取标签函数get_k_neighbor_labels(distances,y_train,k)4.投票函数vote(one_sample,X_train,y_train,k)5.预测函数predict(X_test,X_train,y_tra...原创 2018-08-12 09:51:35 · 496 阅读 · 0 评论 -
【机器学习实战】构建/绘制决策树(ID3/C4.5)
近来想要整理一下机器学习实验的代码,将一些基本算法的过程重新整理实现,并完善注释。一、构建决策树1.计算信息熵calculate_entropy(dataset)H(D)=−∑k=1K|Ck||D|log2|Ck||D|H(D)=−∑k=1K|Ck||D|log2|Ck||D|H(D)=-\sum\limits_{k=1}^K\frac{|C_k|}{|D|}log_2\frac{...原创 2018-08-11 13:38:48 · 1786 阅读 · 0 评论 -
【实战】数据预处理练习----标准化/归一化/独热化
下半学期即将开始,大数据课已经开始在上了,趁着课后余热赶紧做做实践,找回状态。【数据预处理】机器学习和数据挖掘的任务基本都是特征工程+模型优化。 对于特征工程而言,它决定了我们训练结果的上限,而模型优化只是去逼近这个上限。 特征工程的核心在于对于未处理的原始数据集进行预处理,数据预处理包括: ·Variable Transformation(变量变换) ·Discretizatio...原创 2018-05-07 21:38:28 · 3175 阅读 · 0 评论 -
【机器学习实战】支持向量机----分类库和简单训练mnist
前面已经对mnist数据集进行了读取,现在我们可以直接使用sklearn.svm模块中的算法库对mnist数据集进行训练。【svm模块】算法库:sklearn.svm模块中提供了这些库: 大概分成这几类(除了svm_l1_min_c返回的是惩罚参数C的最低界) 由于这次的任务是分类,因此只需要熟悉分类类型的库。分类库主要参数: 其他参数介绍可以看官方库...原创 2018-04-27 16:47:10 · 3885 阅读 · 0 评论 -
【数据】读取mnist数据集
前段时间用过CNN在mnist数据集上做训练,最近在学机器学习算法,因此准备用SVM试试。不过在用SVM训练前,先学习学习mnist数据集的读取。【数据集介绍】先看看官方库中的描述: 训练数据集train和测试数据集test都分为label和image两个文件。 label中前两个整数为magic number和标签数目number of items; image中前四个...原创 2018-04-26 21:28:19 · 15042 阅读 · 2 评论 -
【机器学习实战】降维方法的sklearn实现----PCA和LDA
利用sklearn库来给PCA和LDA做一个比较。首先先了解一下这两个库,然后通过(iris)鸢尾花数据集来进行实践操作。【PCA】主要参数:n_components int, float, None or string 这个参数类型有int型,float型,string型,默认为None。 它的作用是指定PCA降维后的特征数(也就是降维后的维度)。 若取默认(...原创 2018-04-25 00:37:05 · 13554 阅读 · 2 评论 -
【机器学习实战】逻辑回归----digits手写数字分类
【导入库和数据集】和线性回归一样,首先导入所需要用到的库和数据集。 导入库:##用于可视化图表import matplotlib.pyplot as plt##用于做科学计算import numpy as np##用于做数据分析import pandas as pd##用于加载数据或生成数据等from sklearn import datasets##加载线性模型f...原创 2018-04-20 21:01:45 · 8451 阅读 · 1 评论 -
【机器学习实战】线性回归----boston房价预测
不积跬步无以至千里,实践经验得慢慢积累,就从线性回归开始练习。【导入所需要用到的库和数据分析】导入库:##用于可视化图表import matplotlib.pyplot as plt##用于做科学计算import numpy as np##用于做数据分析import pandas as pd##用于加载数据或生成数据等from sklearn import dat...原创 2018-04-13 14:10:27 · 9636 阅读 · 4 评论 -
【练习】常用排序以及C++/python实现
突然想要整理一下常用的排序算法,用python和C++都来写一写^_^。无论是python还是C++结构都差不多,没考虑什么优化方法。【冒泡排序】每次比较相邻的两个元素,若是前者比后者大,则交换两个的位置。对数组的每一对相邻两个元素进行比较,进行n-1次比较(n为数组长度)后,最后一个元素一定是最大的数。重复以上步骤,直至没有任何一对数字需要比较(每次都不用再比较前一次步骤中的最后一个...原创 2018-04-12 15:27:07 · 227 阅读 · 2 评论 -
【ONNX】使用yolov3.onnx模型进行目标识别的实验
文章目录yolov3原理分析yolov3.onnx模型来源和介绍来源介绍模型输入模型输出节点类型种类依赖库思路代码准备工作处理图像获取概率最大的概率值和索引获取bbox+第一次筛选(目标置信度阈值)第二次筛选(NMS非极大值抑制)绘制预测框总流程测试图像结果yolov3原理分析关于模型原理分析,网上已有很多博客,不再赘述。下面是两个我认为写的比较好的。yolo系列之yolo v3【深度解析】...原创 2019-04-20 08:04:14 · 12744 阅读 · 14 评论