数据探索
炼丹师666
要学神仙,驾鹤飞天,点石成金,妙不可言!
展开
-
标量,向量,矩阵与张量
张量这一概念的核心在于,它是一个数据容器。2.2.1 标量(0D 张量)仅包含一个数字的张量叫作标量(scalar,也叫标量张量、零维张量、0D 张量)。2.2.2 向量(1D 张量)数字组成的数组叫作向量(vector)或一维张量(1D 张量)。一维张量只有一个轴2.2.3 矩阵(2D 张量)向量组成的数组叫作矩阵(matrix)或二维张量(2D 张量)。矩阵有 2 个轴(通常叫作行...原创 2020-01-04 22:21:17 · 497 阅读 · 0 评论 -
groupby计数_折线图
groupby计数_折线图date_count = data[['cust_isn','last_etl_acg_dt']].groupby('last_etl_acg_dt',as_index=False).count()plt.figure(figsize=[12,6])plt.plot(date_count.iloc[:,0],date_count.iloc[:,1],'.-')pl...原创 2019-12-10 16:09:01 · 1278 阅读 · 0 评论 -
数据探索_相关系数矩阵图绘制
数据探索_相关系数矩阵图绘制data_temp = data_sample#相关系数矩阵绘制def cor_matrix(cor): ax = plt.figure(figsize=(10,10)).add_subplot(111) col_num = len(cor) columns = cor.columns step = 0.0625*10/col_nu...原创 2019-12-10 10:59:11 · 1132 阅读 · 0 评论 -
数据探索_异常值所占比例_并做柱状图
数据探索_异常值所占比例,并画柱状图分析data_temp = data_sampledata_describe = data_temp.describe()outlier_rate = []num = len(data_temp)plt.figure(figsize=[20,6])for i in data_describe.columns: mid = data_descr...原创 2019-12-10 09:59:11 · 1503 阅读 · 0 评论