pandas系列:
1.创建pandas
2.索引、切片、筛选
3.初步探索pandas
4.清洗pandas
5.高级处理pandas
6.时间序列
7.绘图
pandas和matplotlib是数据分析中最基础的python库了。接下来就是机器学习,回归、聚类、分类、关联规则等…
![811378f29ef47c9d7434d19ce085c7c2.png](https://i-blog.csdnimg.cn/blog_migrate/5efb8354fff8a9a67b70419dbeaeeca8.png)
一.3种创建DataFrame的方法
1.使用列表创建DataFrame
![8446018d288f2b15a94d3f4f0f61be6a.png](https://i-blog.csdnimg.cn/blog_migrate/5bf381f72a63cad87f2af7e7e59162fc.png)
添加columns和index名称
![a3e5603f745080fe95d53078461f5bb7.png](https://i-blog.csdnimg.cn/blog_migrate/d0284144b47b2c23c35b2de3b140917c.png)
2.使用字典创建DataFrame
![f910fb64c1a01d14e021b8439fcc949e.png](https://i-blog.csdnimg.cn/blog_migrate/4e476cd392396886359565e7768c92cd.jpeg)
3.使用数据读取创建DataFrame
![a93401d61ee537c8cc4457db0d72f4c2.png](https://i-blog.csdnimg.cn/blog_migrate/0d1900d8ec03a217a94e282e991f4ea3.png)
超级简单有没有,想要导入一个excel文件,直接一句话pd.read_excel,然后excel就出现了,csv文件也是同理。
最简单的是pd.read_clipboard,你Ctrl+C复制一个表格,然后输入这句,表格就直接出现了。
![5cdcd1e4f9ea43c3ba2c322c966f8d81.png](https://i-blog.csdnimg.cn/blog_migrate/a0b970c8f363db72d6a5c9d6320787b3.png)
同理,把表格转出成excel、csv也很简单,只要fruits.to_excel就可以了。
![36cb20950a7b7c47355f3aefe5ff5b48.png](https://i-blog.csdnimg.cn/blog_migrate/ff6a1c8ce3bc199bc771c7223eb9a1c6.png)
二.DataFrame的索引、切片和筛选
1.使用[ ]
[]索引的是列,并且必须使用列名。即df[col_name]。
如果col_name中间没有空格,也可直接使用df.col_name。如df['age']等同于df.age
- 索引单行列
![026233e44f8cdbbe3739b266573e60ed.png](https://i-blog.csdnimg.cn/blog_migrate/178fe97fd0914727f2c76b2363f90d1b.png)
- 索引多行列:
![2473995e879eec3af144d8531965659c.png](https://i-blog.csdnimg.cn/blog_migrate/aad9e601930f0fb8dbb6581342b360d2.png)
- []进行筛选
![ebc0396e9686a30063187a051bca67a1.png](https://i-blog.csdnimg.cn/blog_migrate/0571f89e09706f06b1199f1c8d03f316.png)
2.使用df.loc
- df.loc索引行和列,但必须使用行名称和列名称,df.loc[index_name,col_name]
![2ac3613c34d812370f1bebb9e2c8aff9.png](https://i-blog.csdnimg.cn/blog_migrate/1be8a5421f85a556b65d8973c860ba85.jpeg)
- 同时索引行和列(行、列用逗号隔开):
![a7931d8ae0d34cb3ab016cc87bca9249.png](https://i-blog.csdnimg.cn/blog_migrate/be4d20894db448ae7dcbf4273e5a9d06.png)
- df.loc进行切片
![b5a3f4f10edc8827f369237715079cb1.png](https://i-blog.csdnimg.cn/blog_migrate/e6873be9060048bbc6329bb9598a0065.png)
- df.loc行和列都进行索引
![7c9f619e4ae4102cc3f32b2ca696c10a.png](https://i-blog.csdnimg.cn/blog_migrate/b78d1b684d8746c8f2408fac9e3eb1f5.png)
- df.loc进行筛选
![03f8e6432a77fe074b9699afe3ae56f5.png](https://i-blog.csdnimg.cn/blog_migrate/402009045bd4ee2e99bd2f02b5f66551.jpeg)
- 注:这里的多列使用一个方括号即可
![8f6f473fd29474e262a52f25032c4fe3.png](https://i-blog.csdnimg.cn/blog_migrate/0b9cd49658bbc061d3e7cc07607273b6.png)
3.使用df.iloc
- 类似loc,不同之处在于loc使用行列名称,iloc使用行列位置索引
![3e76d35bbef4506ebbcc178bce3189a4.png](https://i-blog.csdnimg.cn/blog_migrate/a6bdd331f39bb3cdb875f568450a19fa.png)
- df.iloc进行切片
![de5f49212a9c7ea7ef0a180b727a33d1.png](https://i-blog.csdnimg.cn/blog_migrate/69e1e6eaa7638f66a58c2939be64ea00.png)
- df.iloc进行行列同时切片
![a01d50c835badf47d02201c330850af7.png](https://i-blog.csdnimg.cn/blog_migrate/83babbfd67511855067b9cef62f5fd17.png)
- df.iloc进行筛选
![e486a3a0f932905f4f546281f476f1ba.png](https://i-blog.csdnimg.cn/blog_migrate/c937d28b71eb45c6e3d834a336cdc812.jpeg)
————————分割线———————
![0f0aeda2c685da24b21c6dd25a013e25.png](https://i-blog.csdnimg.cn/blog_migrate/a57bcb230123d6224b6251a868f371bc.jpeg)
![5307ebc1e95ae671919ed55ed0d8b47c.png](https://i-blog.csdnimg.cn/blog_migrate/9f1607e761e2bbf9172ddad73e36fc88.jpeg)
![2e3e2c8a1e5ed430c932311080445686.png](https://i-blog.csdnimg.cn/blog_migrate/9462b8faff11eb2cee66eedfe25a50be.jpeg)
![01b442f7358316f23a7ddb8c3c8b321c.png](https://i-blog.csdnimg.cn/blog_migrate/3ad46ba035ea4c3527f3e4550f8da401.jpeg)
具体解释和运行结果都放在公众号里了,懒得贴上来了,哈哈哈哈~
![d1193e8f375ff3cdab834773274d6625.png](https://i-blog.csdnimg.cn/blog_migrate/1ea9e360f9b1faba576117a4d4b25abf.jpeg)