- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 准确率、精准率和召回率的理解
我们在在分类任务时,经常会对模型结果进行评估。评估模型好坏的指标有AUC、KS值等等。这些指标是通过预测概率进行计算的。而准确率、精准率和召回率也通过混淆矩阵计算出来的。下图是对混淆矩阵的介绍: 其中,TP:样本为正,预测结果为正;FP:样本为负,预测结果为正;TN:样本为负,预测结果为负;FN:样本为正,预测结果为负。准确率、精准率和...
2017-09-29 13:46:56 72798 8
原创 在anaconda(python)下安装opencv
最近参加一个比赛,有人推荐用opencv这个模块做处理,就想在anaconda上安装下这个模块。发现直接用pip会出现各种不匹配的问题。网上说是因为在python的pip库中没有匹配的版本,所以在使用pip安装会报错。 因此我们可以直接下载opencv这个包,然后再本地进行安装。具体做法如下: 1.)打开http://www.lfd.uci.edu/~gohlke/py...
2017-09-27 19:00:10 2837
原创 python的时间转换datetime和pd.to_datetime
我们在python对数据进行操作时,经常会选取某一时间段的数据进行分析。这里为大家介绍两个我经常用到的用来选取某一时间段数据的函数:datetime( )和pd.to_datetime( )。(一)datetime( ) (1)获取指定的时间和日期。datetime(%Y,%m,%d,%H,%M,%S) datetime共有6个参数,分别代表的是年月日时分秒。其中年...
2017-09-24 11:38:44 150705 8
原创 用Python绘制ROC曲线
在分类模型中,ROC曲线和AUC值经常作为衡量一个模型拟合程度的指标。最近在建模过程中需要作出模型的ROC曲线,参考了sklearn官网的教程和博客。现在将自己的学习过程总结如下,希望对初次接触的同学有所帮助。PS:网上的例子实在是晦涩难懂,在折腾了一下午之后终于搞定了。下面是我在学习过程中主要参考的资料,大家也可以学习一下。http://scikit-learn.org/sta...
2017-09-21 17:44:23 117989 32
原创 Excel和csv的默认编码
我们用python进行数据分析之前,第一步就是将数据导入到python中。日常中最长用的应该就是excel和csv这两种文件格式了。对于数字类型,excel和csv的编码都是数值型;但对于字符串和汉字类型的单元格,excel的默认编码为unicode,csv的默认编码为str。具体见如下例子:...
2017-09-15 18:19:13 24528
原创 如何保持从github上fork过来的项目与作者同步更新
github的pullrequest的功能是如果你fork了某人的项目,并对原作者的代码进行了一些修改,想要合并到他的项目中,那你就可以通过pullrequest来请求合并。但是如果原作者对自己的代码有了更新,你想要同步到自己的github上,该如何解决呢?我们可以将pullrequest反过来用,可以将我们fork过来的项目作为被合并的项目,而原作者的项目作为请求合并的项目。这样通过pullre
2017-09-13 22:53:37 14873 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人