数据分析师
文章平均质量分 79
ZZU小哥哥
这个作者很懒,什么都没留下…
展开
-
聊一聊推荐系统
推荐系统的应用场景有很多:新闻推荐(今日头条),音乐推荐(网易云音乐),商品推荐(京东,天猫),电影推荐等。今天我们就来聊一聊就在我们身边的推荐系统。1.推荐系统的基本原理(以电影推荐为例)1)基于内容的电影推荐系统原理我们可以根据电影评分表矩阵和电影内容矩阵求出我们想要的用户喜好矩阵。用户喜好矩阵中包含的是每个用户对每种电影的喜好程度。用户喜好矩阵的求解公式如下: 基...原创 2018-05-19 16:32:18 · 3146 阅读 · 0 评论 -
数据分析之股票市场价格分析
1.如何从互联网上寻找数据数据获取通常分为两种:第一种:主动获取。我们有很多种方式去互联网上获取我们想要的数据。常用的就是爬虫。(例如:http://github.com/xiaopeng163/bili-spider,就是一哥们写的爬虫项目。爬取 B站全站视频信息)第二种:被动方式。别人提供给我们的一些接口,我们可以通过接口获取提供给我们的数据。比如微博,twitter,它们都提供相...原创 2018-04-28 16:35:06 · 8049 阅读 · 1 评论 -
python之matplotlib库画图入门
什么是matplotlib呢?其实matplotlib是python的一个包(库)。在您的计算机里安装anaconda这个软件,就可以直接使用这个包了。另外anaconda中集成了很多的python包,自带我们常用的Jupyter Notebook,是我们做数据科学,学习机器学习的很好工具。 学习任何一种程序的世界里学习新东西都是从Hello World开始的,那么同样学习mat...原创 2018-06-14 15:26:08 · 949 阅读 · 0 评论 -
Pandas之Series画图
今天我们来学习Series画图。这句话听起来有点绕,说白了就是Pandas库中Series数据结构的数据,对它的图形化展示。我们进行数据分析,最终的分析结果有可能是一个Series结构的数据。那么为了更好理解分析的结果,我们有必要对其进行可视化展示。 为了给大家展示这个功能,首先我们要有数据。数据是我们做分析的本源,既然我手里没有数据,那我们可以造一些假的数据。如何造一些假的数据呢...原创 2018-06-15 17:31:51 · 15783 阅读 · 0 评论 -
pandas之DataFrame绘图
我们知道Pandas库中有两种数据结构一种是Series结构类型的数据,还有一个种就是DataFrame类型的数据,那么今天我们就来聊一聊DataFrame结构类型的数据绘图。我们先来看一个最简单的例子。试试我们的小心脏会不会跳动,哈哈。直接上干货,代码如下: 如果您对DataFrame有点陌生,啊哈,去百度一下了。解释一下第5行,里面用到了numpy库中的randint函数,这是...原创 2018-06-19 18:25:34 · 53521 阅读 · 5 评论