数据分析
Quinn-ntmy
这个作者很懒,什么都没留下…
展开
-
pandas中合并数据集
数据集的合并1、pandas.merge()语法:pandas.merge(left, right, how=‘inner’, on=None)left:参与合并的左侧DataFrame。right:参与合并的右侧DataFrame。how:连接方式,默认为inner,inner是使用两个表都有的键(笛卡尔积);left使用左表中所有的键;right使用右表中所有的键;outer使用两个表中所有的键。on:用于连接的列名,必须同时存在于左右两个dataFrame对象中,如果未指定,则以left原创 2021-10-23 18:00:24 · 993 阅读 · 0 评论 -
NumPy中的where()函数
numpy.where(condition,x,y)输出什么取决于此处的condition(条件)。若condition为True,则输出x,否则(False)输出y。举个例子:>>>a=pd.Series([np.nan,2.5,0.0,3.5,4.5,np.nan], index=['f','e','d','c','b','a'])>>>b=pd.Series([0.,np.nan,2.,np.nan,np.nan,5.],原创 2021-10-23 10:36:09 · 288 阅读 · 0 评论 -
pandas中的sample方法
sample()函数????DataFrame.sample()用于随机获取数据并返回结果,类似于random.sample()函数语法:????DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)n:可选参数,整数,定义生成的随机行数。frac:可选参数,浮点数,并返回浮点值数据帧值的长度,不能与参数n一起使用;注意,如果frac>1,rep原创 2021-10-16 11:13:18 · 1057 阅读 · 0 评论 -
Numpy中的堆叠(stack)操作
堆叠stack将两个ndarray对象堆叠在一起组合成一个新的ndarray对象。根据堆叠的方向不同分为hstack和vstack两种。hstack为横向堆拼接使用如下:>>>a=np.array([[1,2],[3,4]])>>>b=np.array([[5,6],[7,8]])>>>np.hstack((a,b))array([[1, 2, 5, 6], [3, 4, 7, 8]])vstack为纵向拼接使用如下:原创 2021-10-14 12:08:05 · 766 阅读 · 0 评论 -
Numpy中的mean函数
**mean()函数**mean()用来求取均值,常用操作的参数为axis,以m*n矩阵举例:axis不设置值:对m*n个数求均值,返回一个实数axis=0:压缩行,对各列求均值,返回1*n矩阵axis=1:压缩列,对各行求均值,返回m*1矩阵>>>a=np.array([[1,2,3],[4,5,6]])>>>aarray([[1, 2, 3], [4, 5, 6]])>>>np.mean(a)3.5>&原创 2021-10-14 10:02:48 · 622 阅读 · 0 评论