2017年07月_TURING.DT

11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

转载推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)

1、准确率与召回率（Precision & Recall）准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值，用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率，衡量的是检索系统的查准率；召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率，衡量的是检索系统的查全率。一般来说，Precision就是检索出来的条目（比如：文档、网页等）有多少是准确的，R

2017-07-14 17:50:51 590

转载 centos6安装xgboost0.6

1. 升级gcc4.4 到gcc4.8wget http://people.centos.org/tru/devtools-2/devtools-2.repomv devtools-2.repo /etc/yum.repos.dyum install devtoolset-2-gcc devtoolset-2-binutils devtoolset-2-gcc-c++三个

2017-07-13 17:45:47 401

转载机器学习算法选择

本文主要回顾下几个常用算法的适应场景和优缺点！对于你的分类问题，你知道应该如何选择哪一个机器学习算法么？当然，如果你真的在乎精度（accuracy），最好的方法就是通过交叉验证（cross-validation）对各个算法一个个地进行测试，进行比较，然后调整参数确保每个算法达到最优解，最后选择最好的一个。但是如果你只是在寻找一个“good enough”的算法来解决你的问题，或者这里有些技

2017-07-12 15:23:33 497

原创 Linux非root用户安装Python及相关库

前提准备工作，通过root安装yum install -y tkinter tk-devel gcc下面是普通用户操作（用户lilei）1、安装pythonpython版本库https://www.python.org/ftp/python/，此处我选择2.7.9版本的，在安装python的时候，使用--prefix指定安装路径即可，命令如下：wget https:

2017-07-12 15:11:39 7717 1

原创 sklearn训练后使用pickle、joblib保存与恢复模型

在做模型训练的时候，尤其是在训练集上做交叉验证，通常想要将模型保存下来，然后放到独立的测试集上测试，下面介绍的是Python中训练模型的保存和再使用。scikit-learn已经有了模型持久化的操作，导入joblib即可.from sklearn.externals import joblib模型保存>>> os.chdir("workspace/model_save")>>

2017-07-12 14:19:37 10777

The ROC curve stands for Receiver Operating Characteristic curve, and is used to visualize the performance of a classifier. When evaluating a new model performance,accuracy can be very sensitive to un

2017-07-11 19:36:12 3371

转载 Hadoop-Streaming实战经验及问题解决方法总结

看到一篇不错的Hadoop-Streaming实战经验的文章，里面有大部分的情景都是自己实战中曾经遇到过的。特意转载过来，感谢有心人的总结。目录Join操作分清join的类型很重要…启动程序中key字段和partition字段的设定…控制hadoop程序内存的方法…对于数字key的排序问题…在mapper中获取map_input_file环境变量的方

2017-07-10 14:18:36 381

Python深度学习（Deep Learning With Python中文版）

本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱（François Chollet）执笔，详尽介绍了用Python和Keras进行深度学习的探索实践，包括计算机视觉、自然语言处理、产生式模型等应用。书中包含30多个代码示例，步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化，读者无须具备机器学习相关背景知识即可展开阅读。在学习完本书后，读者将具备搭建自己的深度学习环境、建立图像识别模型、生成图像和文字等能力。

2018-09-29

Spark大数据分析核心概念技术及实践OCR 中文

Spark大数据分析核心概念技术及实践，深度讲解使用spark技术对大数据进行分析，并给出实践案例

2018-09-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人