- 博客(7)
- 收藏
- 关注
原创 多分类任务的混淆矩阵处理
多分类任务的混淆矩阵处理在多分类任务中,不适合使用PR曲线和ROC曲线来进行指标评价,但我们仍可以通过混淆矩阵来进行处理。可以通过matplotlib的matshow()函数,直观地展示分类结果的好坏。先使用cross_val_predict得出各个分类值的分数 y_train_pred = cross_val_predict(sgd_clf, X_train_scaled, y_train...
2018-09-26 20:43:49 10530
原创 混淆矩阵与PR曲线、ROC曲线的理解与使用
混淆矩阵与PR曲线、ROC曲线的理解与使用1.混淆矩阵对于分类器而言,一个比较好的评估指标是混淆矩阵。下面通过一个表格具体展示。Neg(非A)Pos(A)Neg(非A样本)90(TN)10(FP)Pos(A样本)30(FN)70(TP)其中Neg表示非A类,pos表示A类。从表格中可以得知,此分类器更能有效地识别非A样本,而对于A样本的识别能力不足。...
2018-09-26 16:18:08 2791 2
原创 常见激活函数的用法
常见激活函数的用法1.为什么要使用激活函数如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合。如果使用的话,激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。2.常用的激活函数2.1 Sigmoid函数sigmoid函数也叫 Logistic 函数,用于隐层神经元输出,取值...
2018-09-19 17:31:40 1710
原创 独热码(one-hot-enconding)的理解以及编码与解码
独热码(one-hot-enconding)的理解以及编码与解码1.为什么要引入独热码的概念在机器学习的领域中,常常会遇到分类,聚类等问题,如果所收集到的数据拥有大量离散型的特征和类别,则我们就需要对其进行编码。就拿mnist手写数字识别来说,其数据的标签就有10个类别:0~9,假设采取神经网络模型进行训练和识别。如果不采取独热码的形式,仍然以0~9作为其标签,那么就相当于最终的输...
2018-09-17 16:49:42 6077 1
原创 如何在jupyter上运行conda的虚拟环境
如何在jupyter上运行conda的虚拟环境jupyter的默认运行环境是电脑环境变量中的python运行环境。如果需要将项目运行在虚拟环境中,就需要在你所运行的虚拟环境中安装一个插件nb_conda。activate env0conda install nb_conda或者在虚拟环境中安装一个ipykernel包,将虚拟运行环境导入到jupyter的kernel文件中。a...
2018-09-15 16:07:16 4821
原创 初学深度学习1——深度神经网络简介
初学深度学习1——深度神经网络简介深度神经网络是由多个线性或非线性神经网络堆叠而成的 而只含一层隐藏层的算是一个简单的神经网络,其中每一个小圆是一个感知机,神经网络中隐含层包含多个感知机。 其中w为权值矩阵,b为偏置值,然后通过一个求和函数和一个激活函数得出最终的输出值Y0,并与标准值Y1进行对比,算出残差。然后反向传播,不断迭代更新权值矩阵,得到训练后的神经网络。...
2018-09-14 10:46:14 607
原创 python虚拟环境的配置和使用
python虚拟环境的配置和使用1.为什么要使用虚拟环境搭建独立的python运行环境,便于依赖包的管理和仿制版本冲突 比如我要开发Flask,我可以创建一个Flask_virtual环境,这个环境里面只有和flask相关的库,这样的好处是避免版本冲突,比如我又要开发Django,发现Flask和Django都引用了A库,而前者需要的版本是1.0,后者需要的版本是2.0,如果没...
2018-09-13 17:34:27 170
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人