这些内容主要是学习《python数据科学技术详解与商业实践》(书名)记录下来的,它是一本对于初学者很好的书,这张主要是pandas在数据分析常用操作,后面会持续更新各种算法~
如何什么问题请联系我
运行软件:jupyter notebook
也可以用pycharm,但要下载包
一、 数据整合
二、 数据清洗
一、数据整合
1.行列操作
生成dataframe数据
选择单列(以列名选择列)
ix,loc,iloc方法都可以选择行、列,loc方法在选择列时只能使用字符串索引,iloc方法只能使用数值作为索引选择行
2.选择多行和多列
ix选择,行索引前后都包括
iloc使用列表索引前包后不包
3.创建,删除列
(1)创建新列
方法一:
直接通过列赋值完成,如下新增new_coll列
方法二:
通过assign方法,但这种方法生成的新变量并不会保留在原始表中,需要赋值给新表
(2)删除列,使用drop()方法,axis = 1指列
A.删除单列