数据分析
文章平均质量分 92
渔戈
时间会让你越变越好
展开
-
Pandas学习笔记:一
Pandas学习笔记-仅供学习使用Pandas数据结构Series:基本概念及创建# Series 数据结构# Series 是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引import numpy as npimport pandas as pd # 导入numpy、pandas模块ar = np.random.rand(5)s = pd.Series(ar)ss = pd.Series(ar,index=list('abcde原创 2020-09-03 19:39:22 · 2337 阅读 · 0 评论 -
Numpy学习笔记:三
numpy学习笔记-仅供学习使用# 基本索引及切片import numpy as npar = np.arange(20)print(ar)print(ar[4])print(ar[3:6])print('-----')# 一维数组索引及切片ar = np.arange(16).reshape(4,4)print(ar, '数组轴数为%i' %ar.ndim) # 4*4的数组print(ar[2], '数组轴数为%i' %ar[2].ndim) # 切片为下一维度的一.原创 2020-09-03 19:29:14 · 2562 阅读 · 0 评论 -
Numpy学习笔记:二
Numpy学习笔记-仅供学习使用Numpy通用函数基本操作# 数组形状:.T/.reshape()/.resize()import numpy as npar1 = np.arange(10)ar2 = np.ones((5,2))print(ar1,'\n',ar1.T)print(ar2,'\n',ar2.T)print('------')# T方法:转置,例如原shape为(3,4)/(2,3,4),转置结果为(4,3)/(4,3,2) → 所以一维数组转置后结果不变ar3 =原创 2020-06-24 00:32:59 · 2558 阅读 · 0 评论 -
Numpy学习笔记:一
Numpy学习笔记-仅供学习使用Numpy 基础数据结构Numpy数组是一个多维数组对象,称为ndarray。其由两部分组成:1.实际的数据2.描述这些数据的元数据import numpy as npar = np.array([[1,2,3,4,5,6],[2,3,4,5,6,7],[3,4,5,6,7,8]])print([1,2,3,4,5,6])print(ar) # 输出数组,注意数组的格式:中括号,元素之间没有逗号(和列表区分)print(ar.ndim)原创 2020-06-24 00:26:29 · 2593 阅读 · 0 评论 -
拉勾爬虫项目
拉勾爬虫-仅供学习使用今天要进行爬取的网站是拉勾招聘网站。首先,我们要对网站进行分析,经过我们的一翻页面分析,我们找到了数据存储的地方所在,如图:知道了数据所在,我们就开始分析这个页面的链接信息:可以看出,这个是网页是使用post请求的,既然是post请求,就一定有表单数据的,所以我们接着往下面看:这里就是表单数据了。拉勾的关键词和翻页都说由这个表单数据进行控制的,所以我们只要构建好这个表单,拉勾的数据就可以提取到了。不过我们这里拿到的数据只是表面的数据,要想进入到详情页,我们还需要构建详情原创 2020-06-22 11:09:37 · 21791 阅读 · 0 评论