自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 【神经网络】激活函数

神经网络什么是神经网络,最简单的神经网络是线性组合wx+bwx+bwx+b,加激活函数ϕ(wx+b)\phi(wx+b)ϕ(wx+b),就构成一个神经元,多个神经元构成一层网络,多层网络就是深度学习,神经网络。神经网络计算了属于每个类的概率,选择概率最大的就是应该属于的那个类。总结就是,神经网络计算的是p(y∣x)p(y|x)p(y∣x),即对于输入xxx,计算属于每个类的概率,选择概率最大的...

2019-05-06 16:38:44 225

原创 【数据处理】numpy、pandas、matplotlib之bar可视化

barbar实例

2019-05-06 16:38:29 995

原创 【热门算法】ctr、cvr

ctrCTR(Click-Through-Rate)即点击通过率,是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即该广告的实际点击次数(严格的来说,可以是到达目标页面的数量)除以广告的展现量(Show content)。CTR是衡量互联网广告效果的一项重要指标。[^1]cvrCVR (Conversion Rate): 转化率。是一...

2019-05-06 16:30:16 18029

原创 【热门算法】搜索、推荐、广告算法

什么是搜索算法搜索算法是利用计算机的高性能来有目的的穷举一个问题解空间的部分或所有的可能情况,从而求出问题的解的一种方法。[^1]什么是推荐算法、广告算法个人理解推荐算法和广告算法是一回事,都是把用户想要的推荐给用户。推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西,目前应用推荐算法比较好的地方主要是网络,其中淘宝做的比较好。所谓推荐算法就是利用用户的一些行为,...

2019-05-06 16:26:02 6515 1

原创 【神经网络】损失函数

1、损失函数损失函数是计算预测结果与实际结果偏差的函数。直观想到的算是函数还有如下几种:分类问题,可以计算误分类的个数、误分类的概率;回归问题,可以计算到超平面的距离,比如LpL^pLp距离。然而,实际用到的却比较多,考虑的因素也比较多。2、常用的损失函数2.1、均方差损失(L2L^2L2损失)可以记为ESMESMESMMSE=∑i=1n(yi−ypredicti)2MSE=\s...

2019-05-05 09:10:07 382

转载 【刷题】快速排序之递归java实现

快速排序(递归实现)我们知道快速排序有递归和非递归两种实现方法,这里只展示递归实现的代码。忘记该代码取自哪个网站了,如果侵权,请删!public class FastSort { public static void main(String []args){ System.out.println("Hello World"); int[] a = {12...

2019-05-04 16:59:25 581

原创 【模型评估】ROC曲线和sklearn实战

ROC曲线同一个问题可以有多种解决方法,如何选择最优的解决方法呢?这里介绍模型评价标准之ROC曲线。ROC 曲线的纵轴是"真正例率" (True Positive Rate,简称TPR) ,横轴是"假正例率" (False PositiveRate,简称FPR)两者分别定义为,TPR=TP/(TP+FN)FPT=FP/(TP+FP)AUC (Area Under ROC Curve) ...

2019-05-04 12:17:10 1400

原创 【计算机博大精深】加快python执行

加快python执行python调用了很多C语言的东西,python比C语言要慢。但是众多工作者,在写C语言的时候做了优化,如果自己用C语言写的话,未必会比调用python快(比如:自己写一个矩阵相乘的程序,即使用openmp并行,也不会比python快)。python比C语言更接近人类理解,上手更快。如何良好的调用python,使得python的执行速度很快,实现既可以快速建模,又可以快速运行...

2019-05-04 08:37:43 140

原创 【机器学习】SVM和sklearn运用实战

SVM给定训练数据集T={(x1,y1),(x2,y2),...(xN,yN)}T=\{(x_1, y_1),(x_2,y_2),...(x_N,y_N)\}T={(x1​,y1​),(x2​,y2​),...(xN​,yN​)}和超平面(w,b)(w,b)(w,b),若用SVM求解需要首先确定TTT可由超平面(w,b)(w,b)(w,b)线性可分,如果非线性可分,需要先选择核函数做变换,使得变...

2019-05-03 23:12:34 996

原创 【机器学习】pca和sklearn运用实战

pcapca可用于数据降维,也可以用于特征选择。pca通过将数据集映射到方差最大的方向上,保留影响分类最大的因素,减少数据维数。pca求解方法pca如何将数据集映射到方差最大的方向上呢?对于方阵而言通过特征值λ\lambdaλ和特征向量xxx,即Ax=λxAx=\lambda xAx=λx,将特征值从大到小排序,选择特征值较大的特征向量就是方差较大的方向。对于不是方阵的矩阵通过SVD...

2019-05-03 16:22:09 779

原创 【数据处理】numpy、pandas、matplolib之scatter可视化

numpy and pandasnumpy和pandas是python中做数据处理必不可少的工具numpy and pandas实例

2019-05-02 15:58:24 749

原创 【机器学习】决策树和sklearn运用实战

决策树决策树既可以用于分类问题,也可以用于回归问题。熵是表示随机变量不确定性的度量,熵越大,随机变量的不确定性就越大。熵的计算如下:H(X)=−∑i=1npilogpiH(X)=-\sum\limits_{i=1}^np_ilogp_iH(X)=−i=1∑n​pi​logpi​决策树有三种选择特征的方式:信息增益:g(D,A)=H(D)−H(D∣A)g(D,A)=H(D)-H(D|A)g(...

2019-05-02 12:11:50 448

原创 【模型评估】k折交叉验证和sklearn运用实战(cross validation)

k折交叉验证(cross validation)留一法是特殊的k折交叉验证。k折交叉验证主要用于判断是否过拟合。k折交叉验证一般采用分层采样法取得训练集和验证集。分层采样是指,每个类按照比例在总体中随机取数据。k折交叉验证(cross validation)实例这是之前用过的逻辑回归的例子,重点放在后面的交叉验证上。用sklearn中的数据集iris导入需要的包from sklearn...

2019-05-02 12:07:31 7560

原创 【机器学习】逻辑回归和sklearn运用实战(Logistic Regression)

逻辑回归(Logistic Regression)逻辑斯底回归是用于解决分类问题的一种方法,可以用于二分类,也可以用于多分类。二分类:P(Y=1∣x)=exp(w⋅x+b)1+exp(w⋅x+b)P(Y=1|x)=\frac{exp(w\cdot{x}+b)}{1+exp(w\cdot{x}+b)}P(Y=1∣x)=1+exp(w⋅x+b)exp(w⋅x+b)​\qquad\quadP(Y=...

2019-05-02 04:42:05 3938

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除