- 博客(5)
- 收藏
- 关注
原创 python链接mysql
# -*- coding: utf-8 -*-import MySQLdbimport ConfigParserdef mysqlConn(): cf = ConfigParser.ConfigParser() cf.read('dataconf/activityDegree.conf') host = cf.get("mysqlconf", "host")
2016-06-28 14:55:17 327
原创 Python连接Hive
1.在使用Python连接hive之前,需要将hive安装包下的lib/py中的文件拷贝到python的sys.path中的site-packages下,否则引入对应的包会报错,这个是使用hive提供的Python接口来调用hive客户端。2 启动hive 的thrift确保以下服务开启:hive --service hiveserver默认端口是10000
2016-06-15 17:01:30 7108 1
转载 Mahout推荐算法
前言用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。目录Mahout推荐算法介绍算法评判标准:召回率与准确率Recommender.ja
2016-06-06 13:38:24 879
转载 深入推荐引擎相关算法 - 协同过滤
本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。 在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集 , 推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的秘密,并给出基于 Apache Mahout 的协同过滤算法的高效
2016-06-06 10:17:37 568
转载 推荐系统中协同过滤算法实现分析
原创博客,欢迎转载,转载请注明:http://my.oschina.net/BreathL/blog/62519 最近研究Mahout比较多,特别是里面协同过滤算法;于是把协同过滤算法的这个实现思路与数据流程,总结了一下,以便以后对系统做优化时,有个清晰的思路,这样才能知道该如何优化且优化后数据亦能正确。 推荐中的协同过滤算法简单说明下: 首先,通
2016-06-06 09:29:33 1407
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人