案例描述
• 为了能有效地提取并利用网络信息并工作提高效率,出现了网络爬虫
• 利用网络爬虫实时获取城市的空气质量
• 利用beautifulsoup4获取所有城市的空气质量
• 将获取的所有城市空气质量保存成CSV数据文件
• 利用Pandas进行数据处理分析
1.DataFrame
• 类似多维数组/表格数据 (如,excel, R中的data.frame)
• 每列数据可以是不同的类型,what about ndarray?
• 索引包括列索引和行索引
numpy转为DataFrame
df = pd.DataFrame(np.random.randn(8,5))
0 1 2 3 4
0 0.441628 -1.245321 -0.034648 0.312449 1.441857
1 -1.316603 -1.007597 -0.405095 1.344526 0.417242
2 -0.600491 0.853524 -0.818176 -0.069841 0.159042
3 -1.147142 -1.118598 -1.404532 0.190775 0.093319
4 -0.230945 0.313796 1.039287 -0.051584 -0.865326
5 -1.648141 -1.843150 0.637258 -1.033127 1.408701
6 -1.320972 -0