自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 python pandas 组内排序、单组排序、标号

摘要:本文主要是讲解一下,如何进行排序。分为两种情况,不分组进行排序和组内进行排序。什么意思呢?具体来说,我举个栗子。****注意****如果只是单纯想对某一列进行排序,而不进行打序号的话直接使用.sort_values就可以了。下文是关于如何把序号也打上的————————————————————————————我们有一个数据集如下:我们下面想进行两种排序。先说第一种比

2017-05-17 15:38:13 51840 9

原创 pandas python 分组统计的方法

首先,看看本文所面向的应用场景:我们有一个数据集df,现在想统计数据中某一列每个元素的出现次数。这个在我们前面文章《如何画直方图》中已经介绍了方法,利用value_counts()就可以实现(具体回看文章)但是,现在,我们考虑另外一个场景,我们假如要想统计其中两列元素出现次数呢?举个栗子:在df数据集中,如果我们想统计A、B两列的元素的出现情况,也就是说,得到如下表。从

2017-05-17 11:43:14 45231 6

原创 python pandas 如何去掉/保留数据集中的重复行?

摘要:本文主要是关于如何把去掉数据集中的重复行,也就是去重的工作。应用场景:假如我们有如下的一个数据集,6行4列。此时,我们3个想法。第一个想法:把所有重复的行去掉第二个想法:只保留第一次出现的重复行第三个想法:保留最后一次出现的重复行这三个想法都可以用pandas中自带一个方法实现。 DataFrame.drop_duplicates()具体实现如

2017-05-16 16:18:16 25857 2

原创 python pandas 怎么替换某列的一个值?

摘要:本文主要是讲解怎么样替换某一列的一个值。应用场景:假如我们有以下的数据集:我们想把里面不是pre的字符串全部换成Nonpre,我们要怎么做呢?做法很简单。df['col2']=df['col1']df.loc[df['col1'] !=' pre','col2']=Nonpre

2017-05-10 22:53:14 57650

原创 Python -Pandas 如何画柱状图?

摘要:本文主要是讲一下用python如何画柱状图(频率直方图),老规矩,先看看我们最终实现的效果。。可以看到,横轴是某个属性的取值,而纵轴是出现是频数。本图来自于以下的数据集:-----------------------------------------------------------------------------------------------首

2017-05-10 22:33:15 41636 4

原创 python-Pandas学习 如何对数据集随机抽样?

摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。应用场景:我有10W行数据,每一行都11列的属性。现在,我们只需要随机抽取其中的2W行。实现方法很简单:利用Pandas库中的sample。DataFrame.sample(n=None, frac=None, replace=False,...

2017-05-02 14:25:55 120104 6

Wide &Deep learning for Recommender Systems

wide&deep 广度深度模型 协同过滤

2017-07-24

A Hybrid Collaborative Filtering Model with Deep Structure

本ppt是关于论文A Hybrid Collaborative Filtering Model with Deep Structure,和协同过滤,自编码器的介绍。

2017-07-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除