自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 回归模型评价指标

回归模型应用场景:预测,趋势分析、投资风险分析等(1)MAE(Mean Absolute Error)平均绝对差值(2)MSE(Mean Square Error)均方误差,是回归任务最常用的性能度量,最小二乘估计也是使用均方误差(3)log对数损失函数(逻辑回归):交叉熵损失,其实是由最大似然估计推导而来(4)RMSE(Root Mean Square error)均...

2018-11-20 10:37:13 2572

原创 睿智合创(北京)科技有限公司数据分析笔试——部分笔试题(附答案)

1.删除重复数据import pandas as pdframe=pd.DataFrame({"C1":['one','two']*2+['two'],"C2":[1,1,2,3,3]})dele_dup=frame.drop_duplicates()frame..drop_duplicates(inpalce=True)注:主要考察DataFrame的drop_d...

2018-11-19 21:38:43 5775

翻译 提升算法之AdaBoost算法原理及其公式推导

1.AdaBoost算法原理     AdaBoost是代表性的提升算法。对于分类问题而言,在给定训练样本的条件下,找到一个弱分类器比找到一个强分类器要简单得多,提升算法就是从弱学习算法(弱分类器)出发,反复学习,得到一系列的弱分类器(基本分类器),然后组合这一系列的分类器,构成一个强分类器。大多数的提升方法都是改变训练数据的概率分布(训练数据的权值分布),针对不同的分布调用弱学习算法学习一系...

2018-11-12 20:49:50 400

原创 面试现场写代码注意事项

1.拿到题目先不要急着写代码,先把问题弄明白,把可能的输入用例考虑清楚2.全面考虑输入用例的情况,代码不仅要能实现基本的功能,还要考虑如边界条件、特殊处理(如空指针,空字符串等)、错误处理等。3.写出代码自己在心里要执行一遍,确认没有问题再给面试官检查。4.考虑时间和空间复杂度。尤其是当一个问题有多个解决方案时...

2018-11-12 15:07:05 1585

原创 保存和加载模型

在训练模型过程中,由于数据集较大,模型训练迭代次数较多等原因,使得模型训练较耗时,因此将训练好的模型进行保存以便下次直接使用是很有必要,下面介绍两种模型的保存和加载方法1.使用pickle模块     (1)保存模型      with open(“模型保存的位置”,“wb”)as f:             pickle.dump(model,f)      或者   ...

2018-11-11 15:42:06 291

原创 logistics回归学习过程推导

2018-11-11 13:03:41 309

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除