Python数据分析
中文过六级再取名
这个作者很懒,什么都没留下…
展开
-
Pandas统计分析基础(使用分组聚合进行组内计算,数据预处理)
Pandas统计分析基础(使用分组聚合进行组内计算,数据预处理)分组聚合组内计算1、groupby进行数据拆分groupby能够根据字段或者索引对数据分组处理。groupby 分组后的数据对象类似于DataFrame,也是Pandas提供的一组数据对象,这类主要方法有:2、使用agg进行数据聚合agg参数如下:func :接收list、dict、function。表示应用于每行每列的函数。无默认axis:接收0或1.代表操作的轴向。默认为0例1:获取传感器数据中温湿度数据的均值原创 2020-05-20 10:05:03 · 2035 阅读 · 0 评论 -
Python数据处理之利用sklearn构建模型
利用sklearn构建模型Sklearn机器学习概述概述:案例:Sklearn机器学习模型:使用sklearn转换器预处理数据数据数据获取数据分类数据预处理----标准化Sklearn机器学习概述概述:什么是机器学习:1、研究如何通过计算手段,利用经验来改善系统自身的性能;2、机器学习就是从数据上建立模型的算法,即学习算法,有了算法之后,将经验(数据)提供给算法,算法就能够基于经验(数据)产生模型(学习结果);3、当提供经验之外的数据时,模型就能够一句经验提供相应的判断(决策、识别等)。案例原创 2020-05-27 10:33:26 · 789 阅读 · 0 评论 -
Numpy数值计算基础 学习笔记
Numpy数值计算基础Numpy数值计算基础:Numpy数据对象ndarrayNumpy的特点:1.数组的维数及属性:2.数组创建:3.数组的数据类型:Numpy矩阵与通用函数利用Numpy进行统计分析Numpy数值计算基础:在python中,list或者tuple可以用来表示数组:list=[1,2,3,4]list=[[1,2,3],[1,2,3]]此外,python中提供了arr...原创 2020-03-25 12:05:31 · 374 阅读 · 0 评论 -
Pyplot基础语法及常用参数
Pyplot基础语法及常用参数pyplot基础语法及常用参数1、创建画布:2、创建子图:添加画布内容:4、保存与显示图形5、设置pyplot的动态re参数线条的常用rc参数名称,解释与取值7、中文显示问题分析特征间的关系分析特征内部数据分布与分散情况pyplot基础语法及常用参数1、创建画布:import matplotlib.pyplot as pltfrom matplotlib i...原创 2020-04-08 10:51:42 · 1682 阅读 · 0 评论 -
Pandas统计分析基础之DataFrame
Pandas统计分析基础掌握DataFrame的常用操作1、基础属性2、查看DataFrame中的数据查询DataFrame的数据loc,iloc访问方式3、更改DataFrame中的数据4、增加DataFrame中的数据删除DataFrame中的数据掌握DataFrame的常用操作DataFrame类似于数据库的表或者Excel的表格,panda将数据读取之后,以DataFrame的数据结构...原创 2020-04-29 11:02:41 · 379 阅读 · 0 评论 -
Pandas统计分析(转换与处理时间序列数据)
转换与处理时间序列数据pandas时间相关的类Timestamp类型Timestamp的属性Period类型DatetimeIndex与PeriodIndex函数参数DatetimeIndexPeriodIndexTimedelta课堂案例:pandas时间相关的类Timestamp类型时间相关的字符串多数情况都会转换成Timestamp。注意:Timestamp类型时间是有限制的。...原创 2020-05-06 10:48:22 · 544 阅读 · 0 评论 -
Python数据统计分析之(数据清洗,标准化数据)
Pandas数据清洗引入数据清洗的目的就是为了解决重复值,缺省值和异常值带来的影响,使得得数据的引用更加有效和准确。数据清洗–重复值重复值主要分为两种:记录重复:一个或多个特征列的几条记录完全一致对于记录重复数据,一般采用直接删除方式:DataFrame.drop_duplicates(subset=None,Keep='first',inplace=Flase)subset: 用来指定特定的列,默认所有列例:特征重复:一个或多个特征名不同,但是数据完全一样pandas提原创 2020-05-20 11:37:55 · 2726 阅读 · 0 评论