url分析案例

本文通过分析《利用Python进行数据分析》中的案例,展示了如何处理和统计访问网页数据,包括时区和操作系统使用情况。数据经过处理后发现,纽约地区的上网冲浪人数最多。进一步将数据整理为DataFrame,填充空值并分析,揭示了用户的行为模式,特别是在不同时区的操作系统使用偏好。
摘要由CSDN通过智能技术生成

本篇分析出自《利用python进行数据分析》,为巩固学习成果,我对其进行了代码实践。
本数据记录了访问某时段内,访问网页的数据,包括所用系统型号,所在时区,访问的域名等数据。

import numpy as np
from numpy.random import randn 
np.random.seed(123)
import os
import pandas as pd
import matplotlib.pyplot as plt
plt.rc('figure', figsize=(10, 6))
np.set_printoptions(precision=4)
pd.options.display.max_rows = 20
#导入模块,规定画布,规定小数位数,规定数据显示行数

path = 'datasets/bitly_usagov/example.txt'
a = open(path)
import json
my_dic = [json.loads(line) for line in a] #json数据的读取,弄进一个列表
my_dic[:10]

在这里插入图片描述
json数据读取出来是字典的形式,tz代表时区,我们想看看大家都在哪里进行的网上冲浪。

time_zones = 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值