- 博客(3)
- 收藏
- 关注
原创 groupby用法—根据每天记录进行日期和类别的统计
问题:怎么根据消费记录,按照日期和某个类别进行人数的统计?数据:现在以食堂的刷卡记录为例,统计每天每餐的就餐人数,数据大概如下:方案:为了统计每天每餐的就餐人数,至少要进行一下3点:1.把【消费时间】列进行处理,得到【日期】列,因为我们以天为单位统计;2.去除重复的消费记录:所谓重复,即当天当餐某个人有多条消费记录,这里只保留一条。 由于【人员姓名】列可能有重复值,因为不排除重名情况,所以以【...
2018-06-20 15:05:54 5959
原创 pandas 处理天气/日期相关特征并数值化
最近的项目利用机器学习进行分析,对于特征的选取,尝试使用天气相关的数据。利用pandas,对于得到的过去两三年的天气情况进行处理。历史天气获取地址:http://tianqi.2345.com/wea_history/71146.htm此处展现的是上海浦东地区过去两年的天气情况,如下:由于数据可以直接复制粘贴比爬虫获取要快速,所以直接粘贴到excel中,进行分析。1.分别读入三年的天气数据,并合并...
2018-06-14 16:01:15 4899 1
原创 Python抓取中国天气网上海市明天天气/温度/风力
由于项目原因,需要简单快速地抓取上海浦东新区未来一天的天气情况,于是参考了博主@双木已成林的这篇文章,进行修改而生成,感谢!url_address = 'http://www.weather.com.cn/weather/101020600.shtml'打开url_address,出现的是未来7天上海市浦东新区的天气情况,其中,101020600是代表上海市的编号。url_address = 'h...
2018-06-14 10:27:03 999
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人