数据分析
文章平均质量分 75
数据分析学习记录
qq_45144479
这个作者很懒,什么都没留下…
展开
-
Python数据分析入门7-8
Python数据分析入门原创 2024-07-25 17:52:39 · 393 阅读 · 0 评论 -
Python数据分析入门5-6
删除重复值,判断多列重复,用列表形式将列名传入subsetic(df_excel.drop_duplicates(subset='售货员'))原创 2024-07-26 10:11:41 · 234 阅读 · 0 评论 -
Python数据分析入门3-4
以单一列表的形式传入,列表的值为1列,且行列索引都是从0开始的默认索引;传入嵌套列表,会根据列表数生成多行多列的数据,行列索引同样默认从0开始,可通过index参数自定义行索引,columns参数自定义列索引。传入字典则key值为列索引,values为值,行索引为从0开始的默认索引,也可用index自定义行索引。Series默认索引从0开始,index参数可自定义索引,用以字典的形式传入,key为索引,value为值。DateFrame是由一组数据和一对索引(行和列索引)组成的表格型数据结构。原创 2024-07-26 19:17:45 · 583 阅读 · 0 评论 -
Python数据分析入门13-14
总结:第一种创建坐标系的方法 add_subplot 属于对象式编程,所有的操作都是针对某个对象进行的,比如先建立一块画布,然后在这块画布上建立坐标系,进而在坐标系上绘图。而后三种建立坐标系的方法属于函数式编程,都是直接调用 plt 库里面的某个函数或者方法达到创建坐标系的目的。调用plt库的bar(),plot(),barh(),scatter(),pie()等方法绘制柱状图、折线图、条形图、散点图、饼图等常用图表。python中数据可视化库matplotlib,首先导入此库。原创 2024-07-29 13:00:26 · 314 阅读 · 0 评论 -
Python数据分析入门9
1.获取当前时间输出如下:2.时间格式转换补充: 自定义时间格式3.时间筛选4.时间推移输出如下:5.时间差计算输出如下:原创 2024-07-25 17:54:57 · 175 阅读 · 0 评论 -
Python数据分析入门11-12
ic(pd.merge(df,df_join,on='商品编号',how='inner',suffixes=["_L","_R"]))原创 2024-07-28 13:47:31 · 506 阅读 · 0 评论 -
Python数据分析入门15
numpy是针对多维数组的一个科学计算的包,封装了多个用于数组间计算的函数。数组是相同数据类型的元素按一定顺序排列的组合,需要注意的是必须是相同数据类型的,比如全是整数、全是字符串或者其他。原创 2024-07-30 13:30:55 · 999 阅读 · 0 评论 -
Python数据分析入门10
为了接下来对分组结果进行进一步处理与分析,我们需要把非标准形式转化为标准的 DataFrame 形式,利用的方法就是重置索引reset_index()方法。直接运行groupby()方法返回的是DataframeGroupby对象而不是Dataframe,这个对象里面包含着分组以后的若干组数据,但是没有直接显示出来,需要对这些分组数据进行汇总计算以后才会展示出来。分组后默认对所有数据进行聚合运算,若只需要对某些列进行运算,可通过索引的方式取出来,然后对取出来的数据上进行聚合运算。原创 2024-07-27 17:08:27 · 749 阅读 · 0 评论 -
Python数据分析入门
菜品洗好后是放在一起的,这个时候你要做什么菜,就把什么菜挑出来(数据筛选);1.数据分析是运用合理的工具,在统计学理论的支持下,对数据进行一定的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获取持续竞争的优势。我的理解是,Python是一种分析的工具,如果作为数据分析师,我们的重点在于要通过数据分析,看到数据底层的本质,看到数据反映的问题,并作出合理的优化建议,或帮助领导人作出重要决策。原创 2024-07-31 11:33:03 · 223 阅读 · 0 评论