![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
——Python分析和挖掘库
这里用来放跟Python数据分析相关的库
anonymox
这个作者很懒,什么都没留下…
展开
-
sklearn常用模块
常用算法及类型类型应用算法分类异常检测、图像识别等KNN、SVM等聚类图像分割、群体划分等KMeans、谱聚类等回归价格预测、趋势预测等线性回归、SVR等降维可视化PCA、NMF等加载数据集数据集名称调用方式适用算法数据规模波士顿房价load_boston()回归506*13鸢尾花load_iris()分类150*4糖尿病load_diabetes()回归442*10手写数字loa原创 2020-11-14 00:10:36 · 387 阅读 · 0 评论 -
快速进行数据探索的工具(EDA)
描述pandas_profiling可以用一行代码 生成详细的数据分析报告, 与pandas深度结合, 非常适合前期的数据探索阶段, 以及结果数据报告批量化生产。代码import pandas as pdimport pandas_profiling as ppdata = pd.read_csv('xxx.csv')report = pp.ProfileReport(data)report# 生成html文件(可以指定绝对或相对路径)report.to_file('report.ht原创 2020-11-07 22:10:16 · 339 阅读 · 0 评论 -
(四)Python时间序列整理
文章目录一、Python中处理时间序列数据的库二、Python中时间序列数据类型2.1 基础类型:时间戳和时间段1)pandas创建时间戳 Timestamp2)pandas创建时间段 Period3)pandas创建时间索引 DatetimeIndex、PeriodIndex2.2 日期空值 NaT三、查看时间戳属性(待更新)四、处理时间序列数据4.1 各种方式下创建时间戳1)datetime.datetime2)numpy.datetime643)pandas.Timestamp4)`pandas.da原创 2020-11-04 13:57:17 · 279 阅读 · 0 评论 -
(三)Matplotlib基础绘图指令
文章目录简介一、基础设置项(待更新)中文显示二、单图常见配置文本显示函数指定横纵坐标范围 `plt.axis`plot函数(颜色、风格、标识)三、绘制多个子图分开的多个子图方法一:直接操作plt.subplot方法二(推荐):面向对象绘图1)先生成fig,再通过fig.add_subplot()分步生成对象ax2)直接生成fig和ax,调用ax对象的方法(推荐)3)直接生成fig和ax,通过pandas DataFrame的绘图命令,在参数中指定ax子区域自定义叠加在同一个图上的多个子图(待更新)四、将输出原创 2020-10-25 00:59:51 · 356 阅读 · 0 评论 -
(一)Numpy数据类型及常用命令
文章目录一、Numpy数据类型ndarray 类型属性, 创建和变换Numpy的数据类型数组的索引和切片二、Numpy常用函数操作函数元素级 数组函数一元函数二元函数排序去除重复值查看一个数组中的值 是否在另一个数组中统计函数数组的集合运算线性代数计算常用的 numpy.linalg 函数其他操作Numpy查询条件查询Numpy随机数生成numpy.random模块一、Numpy数据类型ndarray 类型属性, 创建和变换# 创建ndarraynp.array(d1) np.array([1,2原创 2020-10-24 20:57:54 · 133 阅读 · 0 评论 -
(二)Pandas数据类型及常用命令
文章目录一、整体介绍1.1 Pandas 优点1.2 Pandas的数据类型1.3 Series 和 DataFrame 共性索引和列信息查看标量化计算查看是否包含某个元素值二、Series和DataFrame常用操作2.1 SeriesSeries的索引操作2.2 DataFrame2.2.1 创建DataFrame对象输入数据类型实例(创建及reindex)2.2.2 查询和赋值通过行列索引查询条件查询数据赋值2.2.3 索引和切片(待补充)索引对象切片map和apply函数(待补充)元素级运算(待补充原创 2020-10-24 20:14:13 · 352 阅读 · 0 评论