自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

king的小屋

Python语言学习中,爬虫、数据分析、数据可视化方向。

  • 博客(4)
  • 收藏
  • 关注

原创 分层索引

分层索引分层索引时pandas的重要特性,允许你在一个轴上拥有多个(两个或两个以上)索引层级。创建分层索引Series,以列表的列表(或数组)作为索引。data = pd.Series(np.random.randn(9), index=[['a','b','a','b','b','c','c','d','d'], [1,2,3,1,3,4,2,2,3]])print(data)打印如下:a 1 0.599

2021-01-14 21:17:01 870

原创 pandas处理缺失值

1、处理缺失值pandas使用浮点值NaN(Not a Number来表示缺失值),pandas的目标之一就是尽可能无痛地处理缺失值,例如:pandas对象的所有描述性统计信息默认情况下是排除缺失值的。NaN的常用处理方法:**dropna:**根据每个标签的值是否缺失数据来筛选轴标签,并根据允许丢失的数据量来确定阀值。**fillna:**用某些值填充缺失的数据或使用插值方法,如:‘ffill’用前一个值填充,‘bfill’用后一个值来填充。当第一个值是NaN时,指定参数‘ffill’后依然是Na

2021-01-07 22:40:06 607 1

原创 pandas数据组合

数据组合常用的方法有concat方法、append方法和merge方法,根据数据的特点不同,有不同的连接方式。1、添加行通过concat方法添加行,列相同时添加的行会在原来的列下面链接,列不相同时新的dataframe数据的列是被连接的列的并集。缺失的值用NaN填充。注:concat是pandas顶层的方法,调用时需要通过pandas来调用。列相同时:pf = pd.DataFrame(np.arange(15).reshape(5,3), index=list(

2021-01-05 22:59:29 726 2

原创 再见2020

2020年已经悄然走过,午餐间隙再回味一下。年初机会偶然的情况下接触了Python,从此就一发不可收拾,一个编程门外汉买书、查资料、看视频,一个人自学学的不亦乐乎。白天要上班,晚上和周末休息时间是我主要的学习时间,经常学的开心的时候到晚上很晚才睡,周末基本都是泡在图书馆。从最开始的基础语法开始,然后爬虫,现在在学数据处理。其实我是由着性子在学,想到啥就学啥。最开始就感觉编程挺有意思的,就开始学。基础语法越学越有意思。看到Python能够爬虫在只学了基础语法的情况下开始学习爬虫,爬虫玩了几个月又开始学习数

2021-01-05 12:07:20 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除