- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 pandas-matplotlib 画图初级教程。
摘要本文主要是关于在pandas中如何画图(柱状图、曲线图等等)的一个简单教程。pandas 中画图其实也是利用了matplotlib库。所以会matplotlib库的下面的内容可以不用看了。1.如何画柱状图?1.1情景一假如我们有一个数据集data,我们想统计data中某一列(feature)中每个值出现的次数,并给出柱状图分布。我们可以这样做:需要用
2017-07-27 15:47:33 5852
原创 pandas 如何分割字符
摘要:本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|’分割。我们要把用每个‘|’进行分割的内容抽取出来。pandas有个一步到到位的方法,非常方便。import pandas as pddata['name'].str.split(
2017-07-27 14:43:08 47896
原创 pandas如何去掉、过滤数据集中的某些值或者某些行?
摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。0.导入我们需要使用的包import pandas as pdpandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。1.去掉某些具体值数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单...
2017-07-26 11:03:31 140717 16
原创 自编码器(autoencoder)在协同过滤中的应用
摘要本文简单介绍一下论文中的一些idea。具体详细的论文分析可以参考我上传在CSND的PPT讲解。1.自编码器(autoencoder)网上有许多关于自编码器的文章,以下这篇来自知乎的文章我感觉作为自编码器的入门是一个很好的帮助。https://www.zhihu.com/question/41490383。2.在协同过滤中利用自编码器在之前的文章中
2017-07-26 09:49:44 4794
原创 推荐系统-协同过滤简单介绍
推荐系统中,常用的个性化推荐算法有下图这些分类。其中,基于内容的推荐和协同过滤的推荐是我们本次重点介绍的对象。1.基于内容的推荐首先,我们看看基于内容的推荐(Content-based Recommendation)。基于内容的推荐一般是 根据用户的画像信息(例如年龄、性别、居住地等等)或者item的内容信息(具体来说,例如对于item是电影时,一般是可以基于电影的类型
2017-07-21 18:34:40 6484
A Hybrid Collaborative Filtering Model with Deep Structure
2017-07-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人