![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据分析
文章平均质量分 93
小王要努力)
这个作者很懒,什么都没留下…
展开
-
Python数据分析DAY5
Python会处理字符串起来会很容易,作为工具包的Pandas同样可以简单快速的处理字符串,几乎把Python内置的字符串方法都给复制过来了,这种方法就是Pandas内置的str方法,通俗来说就可以将series和index对象中包含字符串的部分简单看作单个字符串处理,达到批量简单快速处理的目的。它相比agg和transform而言更加灵活,能够传入任意自定义的函数,实现复杂的数据操作对于groupby后的apply,以分组后的子DataFrame作为参数传入指定函数的,基本操作单位是DataFrame。原创 2023-10-10 23:01:50 · 87 阅读 · 1 评论 -
Python数据分析DAY4
生成例如"2023-9-27"包括在内的之后八天的时间戳,我们可以使用date_range和bdate_range(只有工作日没有双休的日期)完成时间戳范围的生成。使用timedelta可以很方便的在日期上做天days,小时hour,分钟,秒,毫秒,微妙的时间计算,如果要计算月份则需要另外的办法。datatime模块重新封装了time模块,提供更多接口,提供的类有: date,time,datetime,datetime的代替品,时间戳相当于python的datetime大多数情况下可以互换。原创 2023-09-27 20:33:22 · 119 阅读 · 2 评论 -
Python数据分析DAY3
标签索引 当索引为object类型时,既可以使用标签索引也可以使用位置索引,Series类似于固定大小的dict,把 index中的索引标签当做key,而把 Series序列中的元素值当做value,然后通过index索引标签来访问或者修改元素值。Series 是pandas库中的一种数据结构,它是一维标记数组,类似于带标签的列表或向量。的数据结构,既有行标签(index),又有列标签(columns),它也被称异构数据表,所谓异构,指的是表格中每列的数据类型可以不同,比如可以是字符串、整型或者浮点型等。原创 2023-09-24 20:23:40 · 307 阅读 · 1 评论 -
Python数据分析DAY2
在散点图中,每个数据点由两个数值变量的值组成,其中一个变量位于x轴上,另一个变量位于y轴上,每个数据点在二维平面上以点的形式表示。它通过将文本中的单词按照其出现频率或重要性生成不同大小和颜色的字词,并将它们以视觉上引人注目的方式呈现在一个图像或画布上,从而帮助用户更容易地识别文本中的关键词或主题。figure是绘制对象(可理解为一个空白的画布),一个figure对象可以包含多个Axes子图,一个Axes是一个绘图区域,不加设置时,Axes为1,且每次绘图其实都是在figure上的Axes上绘图。原创 2023-09-20 22:49:15 · 214 阅读 · 1 评论 -
Python数据分析DAY1
数组中的每个元素都占有大小相同的内存块。ndarray对象采用了数组的索引机制,将数组中的每个元素映射到内存块上,并且按照一定的布局对内存块进行排列(行或列)。Numpy一个开源的python科学计算库,使用Numpy可以方便的使用数组、矩阵进行计算包含线性代数、傅里叶变换、随机数生成等大量函数。如果新数组大于原始数组,则新数组将填充a的重复副本。astype:numpy数据类型转换,调用astype返回数据类型修改后的数据,但是源数据的类型不会变。其中linspace有一下几种参数可以选择。原创 2023-09-16 10:21:25 · 42 阅读 · 1 评论