数据分析
文章平均质量分 75
数据分析
rgb2gray
人工智能领域优质创作者,CSDN博客专家
展开
-
pandas学习(七) time series
1.2 将date设置为index原创 2022-08-15 21:01:36 · 289 阅读 · 0 评论 -
pandas学习(六) STATS
数据已被修改为包含一些缺失值,由NaN标识。使用pandas将使得这个处理更容易。不要使用for 循环或其他循环构造一提高效率。原创 2022-08-15 20:42:47 · 612 阅读 · 0 评论 -
pandas学习(五)merge
代码】pandas学习(五)merge。原创 2022-08-14 23:42:42 · 902 阅读 · 0 评论 -
pandas学习(四) apply
是否注意到年份的类型是 int64。但是pandas有一种不同的类型来使用时间序列。原创 2022-08-14 18:51:46 · 533 阅读 · 0 评论 -
pandas学习(三) grouping
代码】pandas学习(三)grouping。原创 2022-07-27 23:22:34 · 672 阅读 · 0 评论 -
pandas学习(二) Filtering and Sorting Data
pandas学习记录原创 2022-07-18 19:57:39 · 754 阅读 · 0 评论 -
pandas学习(一)Getting and Knowing your Data
users . age . value_counts() . tail() #tail()方法返回指定数量的最后5行。原创 2022-07-15 00:41:40 · 512 阅读 · 0 评论 -
[转]Python共享单车数据的OD识别与社区发现(TransBigData+igraph)
这个案例的Jupyter notebook:点击这里.对于共享单车的出行,每一次出行都可以被看作是一个从起点行动到终点的出行过程。当我们把起点和终点视为节点,把它们之间的出行视为边时,就可以构建一个网络。通过分析这个网络,我们可以得到关于城市的空间结构、共享单车需求的宏观出行特征等信息。社区发现,也可以叫图分割,帮助我们揭示网络中节点之间的隐藏关系。在这个例子中,我们将介绍如何将TransBigData整合到共享单车数据的社区发现分析过程中。import pandas as pdimpor.转载 2022-02-01 17:03:47 · 1994 阅读 · 0 评论 -
[转]出租车轨迹处理(二):时空分析
接下来就要进行一些简单的分析了。今天的目标是如何对某一感兴趣区域进行出租车数据的时空分析。一、轨迹数据预处理这一步在上一篇文章中已经有了介绍。步骤无非就是:1)使用pandas读取数据import pandas as pdimport numpy as npf=open('D:\动态人口分布实验\交通赛数据_上\\20140803_train.txt')data=pd.read_csv(f,names=['ID','lat','lon','passager'..转载 2021-10-30 18:04:34 · 1809 阅读 · 0 评论 -
[转]出租车轨迹处理(一):预处理+DBSCAN聚类+gmplot可视化
1、认识数据我要处理的是2015年成都市的出租车数据数据格式及示例为:出租车ID,纬度,经度,载客状态(1表示载客,0表示无客),时间点1, 30.4996330000,103.9771760000,1,2014/08/03 06:01:221, 30.4936580000,104.0036220000,1,2014/08/03 06:02:222, 30.6319760000,104.0384040000,0,2014/08/03 06:01:132, 30.6318830...转载 2021-10-30 18:01:14 · 3474 阅读 · 5 评论 -
十分钟上手sklearn:特征提取,常用模型,交叉验证
十分钟上手sklearn:特征提取,常用模型,交叉验证这一篇虽然叫做:十分钟上手sklearn:特征提取,常用模型,但是写着写着我就想把每一个模型都详细说一下,所以也可以看作是机器学习算法概述了。上一篇我们讲解了如何安装sklearn,导入自带数据集,创建数据,对数据进行预处理,通过上一篇的讲解,相信大家能够感受到sklearn的强大之处。这一篇,我们将对sklearn中有关特征提取,常用模型进行讲解。主要内容包括:1.PCA算法2.LDA算法3.线性回归4.逻辑回归5.朴素贝叶斯6.转载 2020-06-23 23:11:06 · 418 阅读 · 0 评论