- 博客(7)
- 资源 (3)
- 收藏
- 关注
转载 推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)
1、准确率与召回率(Precision & Recall)准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多少是准确的,R
2017-07-14 17:50:51 590
转载 centos6安装xgboost0.6
1. 升级gcc4.4 到gcc4.8wget http://people.centos.org/tru/devtools-2/devtools-2.repomv devtools-2.repo /etc/yum.repos.dyum install devtoolset-2-gcc devtoolset-2-binutils devtoolset-2-gcc-c++三个
2017-07-13 17:45:47 401
转载 机器学习算法选择
本文主要回顾下几个常用算法的适应场景和优缺点!对于你的分类问题,你知道应该如何选择哪一个机器学习算法么?当然,如果你真的在乎精度(accuracy),最好的方法就是通过交叉验证(cross-validation)对各个算法一个个地进行测试,进行比较,然后调整参数确保每个算法达到最优解,最后选择最好的一个。但是如果你只是在寻找一个“good enough”的算法来解决你的问题,或者这里有些技
2017-07-12 15:23:33 497
原创 Linux非root用户安装Python及相关库
前提准备工作,通过root安装yum install -y tkinter tk-devel gcc下面是普通用户操作(用户lilei)1、安装pythonpython版本库https://www.python.org/ftp/python/,此处我选择2.7.9版本的,在安装python的时候,使用--prefix指定安装路径即可,命令如下:wget https:
2017-07-12 15:11:39 7717 1
原创 sklearn训练后使用pickle、joblib保存与恢复模型
在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上测试,下面介绍的是Python中训练模型的保存和再使用。scikit-learn已经有了模型持久化的操作,导入joblib即可.from sklearn.externals import joblib模型保存>>> os.chdir("workspace/model_save")>>
2017-07-12 14:19:37 10777
转载 用sklearn绘制ROC曲线
The ROC curve stands for Receiver Operating Characteristic curve, and is used to visualize the performance of a classifier. When evaluating a new model performance,accuracy can be very sensitive to un
2017-07-11 19:36:12 3371
转载 Hadoop-Streaming实战经验及问题解决方法总结
看到一篇不错的Hadoop-Streaming实战经验的文章,里面有大部分的情景都是自己实战中曾经遇到过的。特意转载过来,感谢有心人的总结。目录Join操作分清join的类型很重要…启动程序中key字段和partition字段的设定…控制hadoop程序内存的方法…对于数字key的排序问题…在mapper中获取map_input_file环境变量的方
2017-07-10 14:18:36 381
Python深度学习(Deep Learning With Python中文版)
2018-09-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人