上篇文章提到了如何爬取500强的信息,本次我们来讲下如何通过python进行数据分析。
开始前先说个数据,2020年世界500强中国(包含香港和台湾)有133家企业入围,合计GDP达到8.7万亿美元,而中国大陆去年的GDP才14.1万亿美元,头部聚集效应可想而知。下面我们来用Python来看怎么分析这些数据。
本文用示例来讲解如何掌握python数据分析的基本方法
- 一、Python读取文件的方法
- 二、数据的基础描述
- 三、DataFrame 排序、增删行列操作
- 四、DataFrame数据处理:求和、平均数、计数
- 五、DataFrame的增加行列合并操作等
以下为具体内容
一、Python读取文件的方法
Python读取excel文件有以下三种方式,个人推荐Pandas读取法
1、利用pandas读取
个人比较喜欢直接使用pandas 保存和读取数据,方便好用,特别推荐,只需要三行代码就可以搞定
import pandas as pd
data = pd.read_excel('/Users/***/Fortune500.xlsx')
data
2、使用xlrd读取Excel