Python数据分析
文章平均质量分 61
本专栏主要对Python数据分析的知识进行详细讲解,提供学习。
街 三 仔
一个热爱编程的小工科男·阿里云专家博主
展开
-
【Python数据分析 - 13】:pandas的统计分析
在使用idxmin和idxmax时,axis=0表示列,axis=1表示行isin函数用于查看某列中是否包含某个字符串,返回值为布尔Series,来表明每一行的情况。原创 2022-09-24 19:03:04 · 598 阅读 · 0 评论 -
【Python数据分析 - 12】:Series结构、pandas中值的获取和修改、切片操作与排序(pandas篇)
iloc:可以通过索引的下标获取,索引是时间或下标的名字。注意:根据行列索引取值是必须先是列再是行,不然会报错。Series结构是一维数据,只有行索引,没有列索引。根据行索引取值时必须有一个范围,不然会报错。sort_values对值进行排序。loc:只能锁定行列索引的名字。原创 2022-09-24 16:51:14 · 3144 阅读 · 0 评论 -
【Python数据分析 - 11】:DataFrame索引操作(pandas篇)
设置多个索引时以列表的形式进行设置,它会重设索引,覆盖掉原来的索引。接收一个字典,键为旧索引,值为新索引。原创 2022-09-23 16:53:45 · 5972 阅读 · 0 评论 -
【Python数据分析 - 10】:pandas常见基本操作
DataFrame常见基本操作数据准备获取所有列索引 - columns获取所有行索引 - index获取所有的值 - values转置 - T获取前几行信息- head(num)获取后几行信息 - tail(num)原创 2022-09-23 15:22:20 · 1135 阅读 · 0 评论 -
【Python数据分析 - 9】:DataFrame结构中自定义行列索引(Pandas篇)
准备行索引数据设置行索引,在将数据变为DataFrame结构时添加:index=stock_index结果展示函数功能:生成一个固定频率的时间索引,使用此函数时,须指定start,end或periods,否则报错。语法:pandas.date_range(start=None, end=None, periods=None, freq=‘D’, tz=None, normalize=False, name=None, closed=None, **kwargs)原创 2022-09-22 23:00:01 · 8555 阅读 · 1 评论 -
【Python数据分析 - 8】:Numpy数组间的运算
在NumPy中,当两个数组的形状不相同时,可扩充较小数组中的元素来适配较大数组的形状,这种机制叫作广播(broadcasting)。广播机制的本质,就是张量自动扩展,它是一种轻量级的张量复制手段。当数组进行加运算(或减运算等其他简单运算),所有元素统一加或减等。原创 2022-09-19 22:47:39 · 969 阅读 · 0 评论 -
【Python数据分析 - 7】:Numpy中的统计运算(股票小案例)
统计运算对列进行统计(axis=0)对行进行统计(axis=1)标准差 - np.std(array, axis)平均值 - np.mean(array, axis)方差 - np.var(array, axis)获取数组最大索引值 - np.argmax(array, axis)原创 2022-09-09 23:31:31 · 553 阅读 · 0 评论 -
【Python数据分析 - 6】:Numpy中的逻辑运算
逻辑运算>、=、原创 2022-09-03 23:12:38 · 330 阅读 · 0 评论 -
【Python数据分析 - 5】:Numpy-数组的基本操作
tostring:将数值转换成bytes,比如数值想要保存在文件中,不能直接保存数值的类型。:创建一个新的数组,修改原来数组中的数据时,不会修改新数组中的数据。T:把行列进行互换,相当于reshape,不能修改原来的形状。当数据太多,jupyter会进行数组的输出限制。原创 2022-09-02 16:46:48 · 1809 阅读 · 0 评论 -
【Python数据分析 - 4】:了解Numpy、Numpy的属性
numpy 是python的一种开源的数值计算扩展,支持大量的维度数组与矩阵运算。ndarray n维数组,主要存储相同的数据类型和数据集合。原创 2022-08-30 22:29:23 · 369 阅读 · 0 评论 -
【Python数据分析 - 3】:直方图
组数和组的计算公式:组数=(极差/组距)+1,则组距=极差/(组数-1)。组距是指在一组数据中,最大值(组上限)与最小值(组下限)之间的距离。组数与组距是相互联系的,同一变量数列中,组数越多,则组距越小,反之,组数越小,则组距越大,两者成反比关系。把分成组的个数称为组数,把所有组分成若干份,每一个组的两个端点之间的距离称为组距。...原创 2022-08-25 21:21:04 · 2027 阅读 · 0 评论 -
【Python数据分析 - 3】:柱状图的画法以及柱状图的比较
代码】【Python数据分析 - 3】:柱状图的画法以及柱状图的比较。原创 2022-08-11 22:15:44 · 684 阅读 · 2 评论 -
【Python数据分析 - 2】:多个坐标系的绘制
本文无过多讲解,大部分为代码,提供了解。原创 2022-08-09 21:02:28 · 1399 阅读 · 0 评论 -
【Python数据分析 - 1】:matplotlib绘图架构Part1【折线图和基础绘图】
目录一、简单绘一条斜线图形的基本构成二、绘制城市温度折线图1、解析画图过程2、完整源代码以下操作均在Jupter notebook中进行一、简单绘一条斜线导入模块:import matplotlib.pyplot代码如下:import matplotlib.pyplot as pltplt.figure(figsize=(8,8), dpi=80)plt.plot([1,2,3], [4,5,6])plt.show()plt....原创 2022-03-23 13:47:35 · 4510 阅读 · 6 评论