自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 pandas的离散化和分箱基础

cut:1、将列表给离散化首先要用到pandas中cut,pandas.cut(字典或者列表,分割箱子的个数或者显示的箱边)它将你给数据自动进行分组首先我们创建一个列表然后将这些年龄分为18到25、26到35、36到60、60到100,然后使用cut将其进行离散化:2、使用codes属性将其范围转变成序列的形式:3、pandas返回的对象是一个特殊的Categorical对象。然后调用categories将其4个范围表达出来:4、使用value_counts去查看每个范围中有多少个数在里面

2020-09-27 19:51:26 770

原创 pandas中DataFrame中删除重复值的两种用法

duplicated方法去判断是否重复:DataFrame的duplicated方法返回的是一个布尔值Series,这个Series反映的是每一行是否存在重复情况:标题drop_duplicate方法去查看重复行里面的值drop_duplicates返回的是DataFrame,内容是duplicated返回数组中为False的部分:若想查看duplicated和drop_duplicates观测到的值则需要在duplicated和drop_duplicates中添加字典的键:但是dupli

2020-09-27 16:00:26 9542

原创 pandas中DataFrame的用法

首先在DataFrame中,数据被储存为一个以上的二维块,而不是列表,字典或其他一维数组的集合。首先构建一个DateFrame:DataFrame中的head方法只会选出头部的五行:DataFrame中使用columns方法会按照指定顺序排列:如果你传的列不包含在字典里面,将会在结果中出现缺失指:DataFrame中的一列,可以按字典型的标记或属性那样检索为Series:用loc这种特殊的方法可以选取指定的位置:...

2020-09-25 21:16:55 818 1

原创 bisect库下的两种使用

bisect是python的内置模块实现了二分搜索和已排序列表的差值bisect:会找到元素应当被插入的位置,bisect(array, item)insort:将元素插入相应位置,insort(array,item)查找bisect的用法:插入insort的用法:...

2020-09-22 17:07:02 135

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除