python数据分析
文章平均质量分 53
发奋图强强强
这个作者很懒,什么都没留下…
展开
-
9/2 pandas数据结构介绍
1.对于Series :当对象相加时,如果存在不同的索引对,则结果的索引是所有索引的并集,对于不重叠的标签,会导致缺失值 obj1 + obj2。注:在重构时,标签只含新的指定序列中的标签,新的和原来的匹配则保留,不匹配则删除原来的,添加新的。2.对于DataFrame:会将行和列的索引同时进行匹配,得到的行列索引是所有索引的并集,不重叠的标签,会导致缺失值。data.drop(["a”,“b"],axis="index或columns")担当索引不为整数索引时,可用data[-1]来提取最后一个数据。原创 2024-09-02 18:00:58 · 1113 阅读 · 0 评论 -
9/1 pandas入门
1.Series类似于一维数组,由一组数据和与之对应的标签(索引)组成obj = pd.Series(数据,index=) index可指定可省略2.可以通过索引获取单个或多个值3.可进行numpy计算4.可看作是长度固定的字典可将字典转化为Series:s1 = pd.Series(dict)可将Series还原为字典:s1.to_dict()将字典转化为Series时,可指定索引:s1 = pd.Series(dict,index) 若原字典中有对应索引则将对应值匹配,若无则匹配NAN。原创 2024-09-01 20:14:01 · 175 阅读 · 0 评论 -
9\1 numpy基础(二)
数组中的元素可能会有重复,使用numpy.unique(arr)对数组进行唯一化并返回排序结果。sample = np.random.standard_normal(size)生成样本数组。np.dot(a, b)或a @ b或a.dot(b):计算两数组内积,即矩阵乘法。样本数组生成:arr = rng.standard_normal(size)生成。arr.mean() arr.sum()等函数,可以计算整个也可以以轴计算。numpy.where(布尔数组,arr或标量,arr或标量)原创 2024-09-01 16:36:33 · 292 阅读 · 0 评论 -
8/31 numpy基础(一)
两数组之间的比较会形成一个布尔型数组,这个数组的每个元素是比较的两数组之间各元素的比较结果。4.np.arange(15)相当于创建了一个0-14的数组。两数组之间或数组与标量之间的运算会作用于数组之中的所有元素。1.使用data.dtype获取数组数据类型。2.使用astype将数组数据类型进行转换。注:对列表切片进行整体赋值会报错。浮点数转整数小数部分会被截断;数字型字符串能被转化为数值形式。整数转化为浮点会加上小数点;可对ndarray进行切片。2.数组的维度与数据类型。可对切片整体进行赋值。原创 2024-08-31 17:57:05 · 189 阅读 · 0 评论