本篇分析出自《利用python进行数据分析》,为巩固学习成果,我对其进行了代码实践。
本数据记录了访问某时段内,访问网页的数据,包括所用系统型号,所在时区,访问的域名等数据。
import numpy as np
from numpy.random import randn
np.random.seed(123)
import os
import pandas as pd
import matplotlib.pyplot as plt
plt.rc('figure', figsize=(10, 6))
np.set_printoptions(precision=4)
pd.options.display.max_rows = 20
#导入模块,规定画布,规定小数位数,规定数据显示行数
path = 'datasets/bitly_usagov/example.txt'
a = open(path)
import json
my_dic = [json.loads(line) for line in a] #json数据的读取,弄进一个列表
my_dic[:10]
json数据读取出来是字典的形式,tz代表时区,我们想看看大家都在哪里进行的网上冲浪。
time_zones =