自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 文件的存在的

2021-10-16 16:12:21 85

原创 机器学习面试题总结

更多内容,关注“百面机器学习”可以看到啦神经网络中怎么降维?标准化和归一化有什么区别?LSTM 为啥比 RNN 在梯度消失上要好?为啥 L1 正则先验分布是 Laplace 分布,L2 正则先验分布是 Gaussian 分布?为什么归一化能加快梯度下降法求优化速度?简单说下 Adaboost?SVM 和 LR 区别和联系?机器学习中的距离和相似度度量方式有哪些?AUC 为啥对正负样本比例不敏感?Xgboost 哪里可做到并行?boosting 不是串行吗?你还知道哪些降维方法?为什么

2020-09-06 22:13:45 165

原创 GBDT的预测结果有负数,为啥?

问题引入大家在项目中遇到的情况基本都是预测的值是正值,如预测问题、股票、现金流等,很少会有负数的场景,那我们在使用GBDT进行模型预测的时候,得到的结果可能是负值吗?为啥有负值,应该怎么处理这种情况?问题解答其实,是可能会出现负值的,出现的情况原因可能有如下:如果在loss函数中没有加对负数输出的惩罚项(regularization),就有可能得到负数输出。首先要看得到负数的的输入值是否在training data中出现过,如果没出现过,并且这种数据点很少,可以认为这些是outlier。也可以把

2020-05-19 23:17:52 2163

原创 使用softmax中需要注意哪些问题?

关注微信公众号“百面机器学习”获得更多问题引入softmax是一个很有用的东西,在我们的分类问题中经常被用到,大家在构建神经网络以及在学习word2vec的时候都会用到softmax函数,那么实际在使用softmax的过程中有哪些需要注意的呢?看来看好像根据公式直接算就可以了,但是中间还有写细节问题,下面我们一起来看一下。问题解答在我们的softmax计算过程中会遇到上溢下溢的问题,这点我们可以从softmax的函数中看到。f(x)=exp⁡(x)∑i=1kexp⁡(x)f(x) = \frac

2020-05-18 23:07:17 686

原创 比较下MSE和交叉熵

问题引入在之前的文章中也说过为啥LR用sigmod函数,这里着重说一下为啥分类问题用到交叉熵比较多呢,为啥不用MSE这些呢?交叉熵有啥好处?本文主要比较小MSE以及交叉熵,关于LR为啥用sigmod函数,分类问题中为啥用交叉熵这些问题,在这里可以找到。问题解答首先来看两者的表达式:MSE:L=1N∑i=1N∣∣yi−y^i∣∣22L = \frac{1}{N} \sum_{i=1}^{N} ||y_i - \hat{y}_i ||_2^2L=N1​∑i=1N​∣∣yi​−y^​i​∣∣22​交叉

2020-05-18 19:29:05 814

原创 详细说明下决策数如何计算特征重要性的?

问题引入笔者在所有的面试中都会被问答到项目中的具体特征的情况,包括特征是如何得到的,为啥这个特征有效,做了哪些特征筛选,特征重要性是如何看的,和线性回归、逻辑回归这种广义线性模型不一样,简单的决策树的特征重要性又没有类似线性回归的系数可以用来说明特征重要性,那么,树模型的特征重要性是怎么计算的呢?问题解答对于简单的的决策数,sklearn中是使用基尼指数来计算的,也就是基尼不纯度,决策数首先要构造好后才可以计算特征重要性,当然,我们在构建数的过程中已近计算好了特征重要性的一些值,如基尼指数,最后我们得

2020-05-18 19:28:32 447

原创 说说PR曲线

问题引入说到PR曲线和ROC的区别,我觉得一半的人能一时半会还是懵逼的,为啥呢,这两个概念看似很简单,但是真的理解起来,可不是随便回答一下字面上的意思就可以了。那么PR曲线和ROC曲线的差别在哪里呢?问题解决首先明确下下概念PR曲线是Precision和Re中的P是Precision,R是Recall,对应的公式如下:但是在ROC的计算指标中的TRP和FPR的公式中,计算公式如下;乍一看...

2020-05-12 19:50:19 905

原创 为什么LR模型损失函数使用交叉熵不用MSE?

问题引入大家最熟悉的莫过于LR模型了,LR模型用的激活函数是sigmod,使用的损失函数是交叉熵,但是它为啥不用MSE呢,按理说MSE也可以刻画预测和实际值的偏差大小呀?问题解答LR的基本表达形式如下:hθ(x)=g(θTx)=11+e−θTx{h_\theta }(x) = g({\theta ^T}x) = \frac{1}{{1 + {e^{ - {\theta ^T}x}}}}hθ...

2020-05-12 19:49:56 2080

原创 Hadoop集群间转移表格

Hadoop相关命令1. Linux上传本地文件到Hadoop的HDFS文件系统使用moveFromLocal命令hadoop fs -moveFromLocal origin_address target_address其中origin_address为Linux本地的文件路径,target_address为HDFS的文件路径2. 集群间数据迁移目标:将数据从一个集群迁移到另一个...

2020-03-14 18:33:17 125

sumo-1.3.1.rar

这里下载了sumo,为了让在国内的小伙伴能更快的下载到软件,里面也有很多的例子,可以方便快读的学习,主要包含了路网的构建、以及一些基本的开发代码的实现,重点关注下示例里面的

2020-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除