推荐系统:
可以帮助电子商务网站,视频,文娱,信息检索等领域向用户提供商品和建议,促成用户的产品购买行为,模拟销售人员协助用户完成购买过程。
推荐系统也称为个性化推荐系统,它本质上是一种信息过滤系统,通过一定的算法在海量数据中过滤掉用户不太可能产生行为的物品,从而为用户推荐所需要大物品。
推荐系统分为三类:
基于内容的推荐、基于协同过滤的推荐和混合推荐
Package的准备
1.Numpy:
高性能的科学计算和数据分析基础包。提供的功能有:多为数组、标准数学函数、线性代数、随机数生成和傅里叶变换等。
2.Pandas:
一种基于numpy的工具。包含了大量库和数据模型,提供高效地操作大型数据集所需地工具,包括DataFarme和Series两大数据结构,以及基于两大数据结构的高效的操作 函数,主要用于处理结构化数据。
3.Jieba:
中文 分词库,支持三种分词模式——精确模式、全模式、搜索引擎模式,同时支持繁体分词和自定义词典。
4.Json:
一种轻量级的数据交换格式,该i格式就是python中字典的数据格式。Json模块是专门处理Json格式数据的库,提供四种方法——dumps、dump、loads、load.
5.Random:
实现了各种伪分布随机生成数据,常见的有随机生成浮点数、指定范围内随机数生成、从序列中随机选择一个元素、采样等,在训练数据集和测试数据集生成、产生随机数方面有很大的作用。
6.Jupyter Notebook:
一个强大的网页python编辑器。