ch02
’本书将要向你介绍的是用于高效处理数据的Python工具。虽然读者各自工作的最终目的千差万别,但基本上都需要完成一下几个大类的任务:
与外界进行交互
准备
转换
建模和计算
展示
内容提要
- 从txt读入json格式数据,转化为字典
- 使用Python字典函数对字典中某一特定元素进行计数
- 绘制柱状图,并运用不同柱状图体现每一类型的组成及其比例
读入数据
path = 'C:/.../usagov_bitly_data2012-03-16-1331923249.txt'#location of file
open(path).readline()
这样读入数据的第一行
数据可以从这本书的git链接上获取https://github.com/wesm/pydata-book/tree/1st-edition/ch02
open(path).readlines()
这样读入所有的数据,并将数据存放在列表里,以换行符为分割的依据
import json
records = [json.loads(line) for line in open(path)]
由于数据是json格式的字符串,使用json包可以方便地将其(每一行)转化为Python字典对象,具体实现方法是列表推导
print('records[0]', records[0],'\n')
print(