- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 推荐算法--基于物品协同过滤算法实现(python: Item-CF)
1. 背景本次测试基于MovieLens数据集实现的基于物品的协同过滤,目前只是在小样本上实现,主要问题是计算太耗内存,后期代码继续优化与完善。 数据集说明:movies.dat中数据是用户对电影的评分。数据格式:UserID::MovieID::Rating::Timestamp。2. 代码import pandas as pdimport numpy as npimport math
2017-05-20 19:37:19 4160
原创 python学习笔记--groupby
groupby简介 1)groupby主要用户数据描述性统计分析,包括: 按一列或多列分组求平均数,计数,标准差等。 2) 经过优化的GroupBy的方法 count 分组中非NA值的数量 sum 非NA值的和 mean 非NA值的平均值 median 非NA值的算术中位数 std、var
2017-05-20 14:21:23 903
原创 kaggle案例:广告点击率预估+LR
一、业务背景传统广告与在线广告区别? 传统广告: 类似电视广告,报纸媒体、杂志、广播、户外媒体等。 在线广告: 类似百度搜索广告,facebook页面展示广告。 区别:在线广告更多与用户相关,例,在google上搜索“kids shoes”,则会出现与搜索相关的一些带有广告标签(“Ad”)的连接。例如,淘宝中带有hot标签的物品。 注: 国家规定如果是广告的话,必须带有广
2017-05-18 16:46:46 11421 11
原创 推荐算法:协同过滤原理介绍
csdn不支持公式编辑,里面涉及很多公式,只能截(bei)图(cui)。主要学是学习《推荐系统》为了加深记忆就手写了一边,同时也方便后期查看。1. 协同过滤算法简介1) 协同过滤根据相似(或者近邻)偏好推荐物品,分为基于用户的近邻推荐和基于物品的近邻推荐, 其实最终都是推荐物品,只是考虑的角度不一样(类似一种投票方式)。 2) 基于用户的最近邻推荐:根据与用户自身偏好比较相似的用户喜欢的物品,
2017-05-06 22:10:31 1195
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人