![](https://img-blog.csdnimg.cn/20200407182354747.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析
在数据分析学习过程中的一些小记
沛然ypr
这个作者很懒,什么都没留下…
展开
-
scrapy安装
几种情况:如果在windows系统下,提示错误:ModuleNotFoundError: No module named 'win32api',可使用命令:pip install pypiwin32,然后再pip install scrapy如果安装的时候提示twisted安装有问题,可以先到网站https://www/lfd.uci.edu/~gohlke/pythonlibs/下载twisted的whl文件,下载完成后用cmd进入该文件所在文件夹,然后pip install ×××.whl注原创 2020-08-20 23:15:17 · 138 阅读 · 0 评论 -
geopandas公交站点覆盖率分析
目标分析研究区域内公交站点的覆盖率使用的文件:研究区域边界.shp(polygon类型数据)站点.shp(point类型数据)代码:# 导入所需的库import geopandas as gpdimport pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 导入文件shp_border = '研究区域边界.shp'shp_pts = '站点.shp'# 读取文件数据data_border = r原创 2020-07-30 18:08:28 · 1278 阅读 · 4 评论 -
geopandas安装
依赖库下载geopandas库无法直接安装,需要先下载依赖库其中包括:fionagdalpyprojshapely依赖库对Python有版本要求,若Python版本为3.7.×,则应下载cp37版本的依赖库(Python版本3.6.×对应cp36依赖库)。版本不对应会导致安装失败官方下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/cp37打包下载:https://download.csdn.net/download/gyxx1998/原创 2020-07-30 17:36:27 · 699 阅读 · 1 评论 -
pandas库(4):Series结构
(1)基本概念单独的几列就是一个Series结构,几个Series结构共同构成DataFrame结构cardtype = subway_info["card_type"] #单独提取出card_type列,这就是一个Series结构print(type(cardtype))(2):自定义Series结构① 以on_station的值为Series结构新值,以card_type值为...原创 2020-04-07 20:23:29 · 131 阅读 · 0 评论 -
pandas库(3):常用函数
以下部分内容仅做示例用,或无实际统计意义(1)求均值代码:correct_mean_station = subway_info["on_station"].mean() #字段on_station出去缺失值外,所有值求平均print(correct_mean_station)输出:44.09090909090909(2)分类求均值按卡种字段card_type分类计算字段o...原创 2020-04-07 20:20:02 · 320 阅读 · 0 评论 -
pandas库(2):数据预处理
示例文件:dateoff_timecard_idcard_typedevice_numoff_stationon_timeon_station2016-04-2208:25:360000990771990514102220237030000037201604220750322016-04-2212:32:430000990772079197...原创 2020-04-07 19:55:35 · 153 阅读 · 0 评论 -
pandas库(1):csv文件的读取与输出
示例文件:南京一日地铁刷卡数据csv文件**其中含有字段:**date(日期),off_time(出站时间),card_id(公交卡号),card_type(卡种),device_num(设备编号),off_station(出站站点编号),on_time(进站时间),on_station(进站站点编号)...原创 2020-04-07 18:30:19 · 717 阅读 · 0 评论