数据挖掘
文章平均质量分 63
风火程序员
你之所以会特别,是因为你愿意比别人付出更多的努力。
展开
-
日志分析(php+nosql+rsync+crontable)
是不是常常要分析用户的行为?是不是常常遇到多台服务器上传的日志一起分析?是不是对数据统计的间隔时间要求很短?还有木有因为日志文件过大,而需要分块处理? 1、说明一点在日志写入的时候必须按照一种严格的格式,这样在做解析的时候,才好切割。比如 gameid:123 gameid:2333。切割统一标准就行。 2、在生成日志的文件名的时候也要按照一定规则,在分析的时候,正则表达式好匹配,如 服务器hostname_date.log 这样在匹配的时候 只需要 glob(*—date.log); //glob原创 2014-06-05 22:51:24 · 1652 阅读 · 0 评论 -
php-数据分析 余弦相似度实现
php-数据分析 余弦相似度实现 <?php /** * 数据分析引擎 * 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。 * 求出分析向量与基准向量的余弦值 * @author yu.guo@okhqb.com */原创 2014-06-05 22:34:13 · 3034 阅读 · 0 评论 -
推荐系统根据最近浏览进行推荐
前些日子,公司要求做推荐系统,不言而喻,推荐系统对于电商来说是很有好处的。当然我们是刚开始做,还得从简单的开始做,首先第一版是根据用户最近浏览的进行推荐。接下来,可能要根据相似用户进行相似用户的推荐。这样还要对会员进行分等级。所以后面的工作还有很多。原创 2014-06-29 17:30:19 · 5315 阅读 · 0 评论