利用Python进行数据分析-ch02-来自bit.ly的1.usa.gov数据

本书探讨使用Python进行高效数据处理,包括数据读取、转换、建模和展示。通过分析1.usa.gov的bit.ly数据,展示了如何用Python字典和Pandas对时区进行计数,以及如何绘制柱状图展示各类型的比例。此外,还介绍了处理不同浏览器数据的方法。
摘要由CSDN通过智能技术生成

ch02

’本书将要向你介绍的是用于高效处理数据的Python工具。虽然读者各自工作的最终目的千差万别,但基本上都需要完成一下几个大类的任务:

与外界进行交互
准备
转换
建模和计算
展示

内容提要

  1. 从txt读入json格式数据,转化为字典
  2. 使用Python字典函数对字典中某一特定元素进行计数
  3. 绘制柱状图,并运用不同柱状图体现每一类型的组成及其比例

读入数据

path = 'C:/.../usagov_bitly_data2012-03-16-1331923249.txt'#location of file
open(path).readline()

这样读入数据的第一行
数据可以从这本书的git链接上获取https://github.com/wesm/pydata-book/tree/1st-edition/ch02

open(path).readlines()

这样读入所有的数据,并将数据存放在列表里,以换行符为分割的依据

import json
records = [json.loads(line) for line in open(path)]

由于数据是json格式的字符串,使用json包可以方便地将其(每一行)转化为Python字典对象,具体实现方法是列表推导

print('records[0]', records[0],'\n')
print(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值