自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 数据预处理 2.2 缺失值处理

在实际处理数据中,会存在很多缺失值。在数据库中,确实值为NULL在某些编程语言中用NA或None在缺失值也可能是空字符串' '或数值0在pandas中使用NaN表示缺失值pandas中的NaN值来自NumPy库(因此需要导入numpy库)NumPy中缺失值有几种表示形式:NaN,NAN,nan,他们都一样#导入numpy库并输出空值缺失值和其他类型的数据不同,它毫无意义,NaN不等于0,也不等于空字符串两个NaN也不相同方法说明。

2022-12-17 20:21:18 2239

原创 数据预处理 2.1 数据组合

在进行数据分析工作之前,需要进行数据清理工作,数据清理有一下目标:数据整理好后,可能需要多张表格组合在一起才能进行某些问题的分析单个表也可以被分割成多个,比如时间序列数据,每个日期可能在一个单独的文件中基本格式:说明outer:对于无法对齐的列,默认为naninner:对于无法对其的列,默认不显示出来注意:因为默认是outer,所以对于行拼接时无法对齐的列,默认填充NAN其中可以使用ignore_index=True属性,使concat函数忽略行标签索引,使索引重新生成注意:1.3节有讲到在append函数

2022-12-07 20:26:17 454

原创 无法打开内核设备“\\.\VMCIDev\VMX”: 操作成功完成。是否在安装 VMware Workstation 后重新引导?(亲测有效)

找到vmci0.present = "TRUE"这一行,将TRUE改成FALSE。第一步:在虚拟机所在文件夹下查找.vmx文件。随后保存退出,虚拟机就可以正常运行了。以记事本的方式打开它。

2022-11-29 16:09:11 812

原创 数据预处理 1.5 租房数据分析实例

【代码】数据预处理 1.5 租房数据分析实例。

2022-11-29 15:41:52 1173

原创 数据预处理 1.4 DataFrame查询

seies也可以使用sort_values和sort_index函数进行排序,只不过series的sort_values方法没有by参数。df.sort_values(by=['列标签'],ascending=True)loc和query如果跟多个条件可以用&、|表示条件之间的关系。指定列分组,并对分组数据的相应列进行行相应的聚合操作。按照columns指定的列进行降序,并取前n行数据。ascending参数默认是True表示升序。获取DataFrame中满足条件的数据。

2022-11-29 12:47:45 1722

原创 excel导入失败,显示不支持excel文件,解决方法:

excel导入失败,显示不支持excel文件,解决方法

2022-11-26 14:39:36 1127

原创 数据预处理 1.3 DataFrame增删改

先准备一个series数据把该数据通过append()方法加入到数据集,加入时要添加ignore_index=True属性,忽视其他行标签,直接在数据集后面追加

2022-11-26 14:09:59 710 1

原创 数据预处理 1.2 Series和DataFrame

输出的结果会显示其行标签,默认是0,1,2,3...切记此时行标签个数必须和Python列表个数一致。

2022-11-25 18:58:37 375 5

原创 数据预处理 1.1 pandas入门

他们都是存储一个二维表数据的文件类型。注意:csv文件的列元素是用逗号分割,而tsv文件每列元素用\t分割。

2022-11-24 11:42:22 763 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除