数据分析
文章平均质量分 93
笔尖微凉
算法工程师
展开
-
数据挖掘总结+探索性分析总结
文章目录1. 数据探索2. 数据探索模板3.数据挖掘4.数据建模1. 数据探索核心:1、质量分析2、特征分析(分布、对比、周期性、相关性、常见统计量)数据清洗:1、缺失值处理(通过describe与len直接发现,通过0数据发现)2、异常值处理(通过散点图发现)一般遇到缺失值,处理方式为(删除、插补、不处理)插补的主要方式有:均值插补、中位数、众数、固定值、最近数据、回归插补、拉格朗日插补、牛顿插补、分段插补等异常值一般视为缺失值、删除、修补、不处理等数据集成:把不同来源的数据放在一原创 2021-02-23 16:12:52 · 595 阅读 · 0 评论 -
数据分析12章
先占坑原创 2019-09-11 11:09:51 · 115 阅读 · 0 评论 -
数据分析11章--获取某一列的分类
先占坑原创 2019-09-11 11:09:18 · 565 阅读 · 0 评论 -
数据分析10章-数据的合并和分组聚合
先占坑,下次来补原创 2019-09-11 10:59:58 · 714 阅读 · 0 评论 -
数据分析09章
先占坑,下次来补原创 2019-09-11 10:59:26 · 187 阅读 · 0 评论 -
数据分析08章-dataframe第3-4节
03dataFrame的索引pandas取行或者列的注意点:方括号里写数组,表示取行,对行进行操作方括号里写字符串,表示取列的索引,对列进行操作pandas取行:df[:2]pandas取列:df[“age”]pandas排序:df.sort_values(by=‘tel’)对于一些同时取多行多列的操作,采用*loc和ilocdf.loc与df.iloc的区别:loc通过标签获取行...原创 2019-06-09 15:41:23 · 212 阅读 · 0 评论 -
数据分析08章-dataframe第1-2节
01pandas的dataFrame的创建02Dataframe的描述信息03dataFrame的索引04bool索引和缺失数据的处理import pandas as pdimport numpy as npt1 = pd.DataFrame(np.array(range(12)).reshape(3,4))t1t1 = pd.DataFrame(np.arange(12...原创 2019-06-06 09:59:33 · 152 阅读 · 0 评论 -
数据分析07章-series和读取外部数据---第1-2节
第1节、pandas的series的了解import pandas as pdt = pd.Series([21,1,3,4,5,6,7])print(t)0 211 12 33 44 55 66 7dtype: int64print(type(t))<class ‘pandas.core.series....原创 2019-06-05 15:11:08 · 247 阅读 · 0 评论 -
将Pandas中的DataFrame转换成Numpy中数组
将Pandas中的DataFrame转换成Numpy中数组三种方法:T.valuesT.as_matrix()np.array(T)三种方法都可以:np.array(T)print(y_test.head())print('y_test:',type(y_test))d = np.array(y_test)print('y_test:',d[0:3,:])T.valuesp...原创 2019-05-23 20:34:23 · 53971 阅读 · 5 评论 -
数据分析学习-第五课 numpy读取本地数据和索引(第1节)(有相应课件视频下载链接在文末)
01numpy读取本地数据02numpy中的索引和切片03numpy中更多的索引方式原创 2019-05-17 19:59:38 · 300 阅读 · 0 评论 -
Python 100例练手小程序--python快速上手的捷径
地址:https://www.runoob.com/python/python-100-examples.htmlT1:题目:有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少?程序分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去 掉不满足条件的排列。import numpy as npdata = np.array(range(1,5...原创 2019-05-22 19:49:35 · 842 阅读 · 0 评论 -
数据分析学习-第四课 numpy数组(第2节)(有相应课件视频下载链接在文末)
第2节 numpy的数组的创建第2节 numpy的数组的创建下载链接对应课件下载视频链接:https://pan.baidu.com/s/1hJRWKOE2Mus-hb90woa2Ew提取码:4wjo复制这段内容后打开百度网盘手机App,操作更方便哦...原创 2019-05-17 10:56:57 · 185 阅读 · 0 评论 -
数据分析学习-第四课 numpy数组(第1节)(有相应课件视频下载链接在文末)
第1节 数组的计算和数组的计算第2节 numpy的数组的创建第1节 数组的计算和数组的计算一维数组的建立:一维数组是一个[ ],或者是(12,)中只有一个数字即是1维import numpy as npt1 = np.arange(12)print("t1:%s"%t1)print(type(t1))print(t1.shape)结果:t1:[ 0 1 2 3 4 ...原创 2019-05-16 18:31:00 · 237 阅读 · 0 评论 -
数据分析学习-第06课(3-4节)-numpy中的nan和常用方法(有相应课件视频下载链接在文末)--特征工程缺省值补均值
第3节 numpy中的nan和常用统计方法import numpy as npa = np.nanb = np.infprint(type(a))print(type(b))<class ‘float’><class ‘float’>第4节 numpy中填充nan和youtube数据的练习链接:https://pan.baidu.com/s/1...原创 2019-05-21 15:02:05 · 275 阅读 · 0 评论 -
数据分析学习-第06节-numpy中的nan和常用方法(有相应课件视频下载链接在文中)
第六课–numpy中的nan和常用方法第1节 数据的拼接np.vstack((t1,t2))—>竖直拼接np.hstack((t1,t2))----->水平拼接t[ [1,2],:]=t[ [2,1],:]----->行交换t[:,[0,2] ] = t[:,[2,0] ]----->列交换第2节 numpy中的随机方法1.拼接的实践由于我没下到数据,...原创 2019-05-21 12:07:14 · 145 阅读 · 0 评论 -
数据分析学习-第三课 03-matplotlib常用统计图(4-5节)
摘要:第4节 绘制直方图第5节 更多的绘图工具的了解内容:第4节 绘制直方图from matplotlib import pyplot as plt#识别汉字的标签必须要加的plt.rcParams[“font.family”] = [“sans-serif”]plt.rcParams[“font.sans-serif”] = [“SimHei”]a = [131,98,125...原创 2019-05-15 11:38:55 · 198 阅读 · 0 评论 -
数据分析学习-第06课(第1-2节)-numpy中的nan和常用方法(有相应课件视频下载链接在文末)
第六课–numpy中的nan和常用方法01数据的拼接02numpy中的随机方法03numpy中的nan和常用统计方法04numpy中填充nan和youtube数据的练习链接:https://pan.baidu.com/s/1d-_QhcV8ZyTnayDigBpT7A提取码:0vbq复制这段内容后打开百度网盘手机App,操作更方便哦...原创 2019-05-20 11:23:40 · 228 阅读 · 0 评论 -
数据分析学习-第五课 numpy读取本地数据和索引(第2-3节)(有相应课件视频下载链接在文末)
第五课第2节 numpy中的索引和切片这一节是重点内容,用的特别多第3节 numpy中更多的索引方式链接:https://pan.baidu.com/s/1EvfAJ9UttzlfgdlrbJlfQQ提取码:qf3c...原创 2019-05-19 15:25:43 · 156 阅读 · 0 评论