![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 59
chang_rj
为每天的提升而学习
展开
-
特征工程实践笔记
一、特征工程1、构造组合特征:对鸢尾花数据集,通过构造前两列相乘而得到的新列特征。代码实现过程:(1)获取数据:通过sklearn.datasets获取iris数据;(2)使用tensorflow的构建图来完成相乘计算过程,构建新列特征。import tensorflow as tffrom sklearn.datasets import load_irisiris = load_i...原创 2018-10-18 13:33:15 · 710 阅读 · 0 评论 -
读热编码OneHotEcoder理解与应用
读热编码,又称哑编码,是将定性数据编码为定量数据,在机器学习中广泛用于对离散型的分类数据预处理操作。如特征性别,即可分为三类:男、女和其他。用计算机二进制表达([1,0,0],[0,1,0],[0,0,1]).在python中的调用函数如下:from sklearn.preprocessing import OneHotEncoderclf = OneHotEncoder()clf.fit...原创 2018-10-15 19:33:46 · 1118 阅读 · 0 评论 -
机器学习项目实战流程
机器学习项目流程:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已问题建模——获取数据——特征工程——模型训练——模型调优——线上运行数据预处理:数据预处理的思考流程如下:(1)读入样本,观察原始数据:样本类别的取值集合与分布按照不同的特征类型区分理解属性字段名,了解对应语义(2)观察各个特征的分布情况,同时可以进行离群点检测对于数值变量:理解连续变量的中...原创 2018-10-14 13:06:44 · 1000 阅读 · 0 评论 -
使用numpy实现BP神经网络(python代码细节展示)
BP神经网络算法:后向传播,使用后向传播算法,学习分类或预测的神经网络输入:.D: 由训练元祖和其相关联的目标值组成的数据集L:学习率输出:训练后的神经网络numpy中的中的高斯分布的概率密度函数np.random.normal()其中,np.random.normal(mean=0.0, stdev=1.0, size=None)loc表示均值,scale是标准差(scale...原创 2018-10-10 17:24:50 · 14830 阅读 · 6 评论 -
BP神经网络原理公式推导
如下图对一个两层简易神经网络,隐藏层的激活函数为sigmoid函数,{p}'=p\left ( 1-p \right )$a^b$原创 2018-08-03 23:51:35 · 1006 阅读 · 0 评论 -
windows10下安装dlib
很多时候,安装python库会遇到pip install 安装不了的情况,开始在安装dlib,遇到很多问题,与别的库发生conflict的情况,cmake的情况,以及platform不符等等问问。 将收集到的文件做个总结,便于大家参考 note:根据相关的python版本进行对应下载python2,python3.5以下版本whl安装包下载地址。上述下载中有最新的版本,但是是tgz格式...原创 2018-07-31 12:35:56 · 2904 阅读 · 0 评论 -
机器学习评价标准,precision与recall通俗理解
recall与precision区别:(1)recall,召回率又名查全率,与漏报率有关,(漏报率,FN,即错误的预测为负样本,换句话说,将实际为正的样本预测为负),详情参照混淆矩阵,如下。 预测为正样本(positive,P) 预测为负样本(negative,N) 实际为正样本 TP FN 实际为负样本 FP TN 其中,T指预测正...原创 2018-07-05 12:30:55 · 5484 阅读 · 0 评论