自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 准确率、精准率和召回率的理解

            我们在在分类任务时,经常会对模型结果进行评估。评估模型好坏的指标有AUC、KS值等等。这些指标是通过预测概率进行计算的。而准确率、精准率和召回率也通过混淆矩阵计算出来的。下图是对混淆矩阵的介绍:  其中,TP:样本为正,预测结果为正;FP:样本为负,预测结果为正;TN:样本为负,预测结果为负;FN:样本为正,预测结果为负。准确率、精准率和...

2017-09-29 13:46:56 72760 8

原创 在anaconda(python)下安装opencv

     最近参加一个比赛,有人推荐用opencv这个模块做处理,就想在anaconda上安装下这个模块。发现直接用pip会出现各种不匹配的问题。网上说是因为在python的pip库中没有匹配的版本,所以在使用pip安装会报错。    因此我们可以直接下载opencv这个包,然后再本地进行安装。具体做法如下:   1.)打开http://www.lfd.uci.edu/~gohlke/py...

2017-09-27 19:00:10 2836

原创 python的时间转换datetime和pd.to_datetime

    我们在python对数据进行操作时,经常会选取某一时间段的数据进行分析。这里为大家介绍两个我经常用到的用来选取某一时间段数据的函数:datetime( )和pd.to_datetime( )。(一)datetime( )    (1)获取指定的时间和日期。datetime(%Y,%m,%d,%H,%M,%S)    datetime共有6个参数,分别代表的是年月日时分秒。其中年...

2017-09-24 11:38:44 150674 8

原创 用Python绘制ROC曲线

在分类模型中,ROC曲线和AUC值经常作为衡量一个模型拟合程度的指标。最近在建模过程中需要作出模型的ROC曲线,参考了sklearn官网的教程和博客。现在将自己的学习过程总结如下,希望对初次接触的同学有所帮助。PS:网上的例子实在是晦涩难懂,在折腾了一下午之后终于搞定了。下面是我在学习过程中主要参考的资料,大家也可以学习一下。http://scikit-learn.org/sta...

2017-09-21 17:44:23 117977 32

原创 Excel和csv的默认编码

我们用python进行数据分析之前,第一步就是将数据导入到python中。日常中最长用的应该就是excel和csv这两种文件格式了。对于数字类型,excel和csv的编码都是数值型;但对于字符串和汉字类型的单元格,excel的默认编码为unicode,csv的默认编码为str。具体见如下例子:...

2017-09-15 18:19:13 24524

原创 如何保持从github上fork过来的项目与作者同步更新

github的pullrequest的功能是如果你fork了某人的项目,并对原作者的代码进行了一些修改,想要合并到他的项目中,那你就可以通过pullrequest来请求合并。但是如果原作者对自己的代码有了更新,你想要同步到自己的github上,该如何解决呢?我们可以将pullrequest反过来用,可以将我们fork过来的项目作为被合并的项目,而原作者的项目作为请求合并的项目。这样通过pullre

2017-09-13 22:53:37 14873 2

XGBoost原理解析.pdf

XGBoost是机器学习比较热门且重要的算法,其原理为机器学习从业者必须了解的知识。现将电子版免费分享给大家。

2020-05-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除