数据分析
Big-Winda
互帮互助,一起深造IT技术,请大家多多关照!我是一名在读大学生,慢慢的总结经验!
展开
-
使用scikit-learn构建模型——构建并评价回归模型
构建并评价回归模型原创 2021-05-25 21:12:55 · 925 阅读 · 0 评论 -
使用scikit-learn构建模型——构建并评价分类模型
构建并评价分类模型原创 2021-05-24 20:44:35 · 812 阅读 · 4 评论 -
使用scikit-learn构建模型——构建并评价聚类模型
构建并评价聚类模型原创 2021-05-19 20:06:24 · 842 阅读 · 2 评论 -
使用scikit-learn构建模型——使用sklearn转换器处理数据
使用sklearn转换器处理数据加载datasets模块中的数据集(sklearn自带的数据集)#加载breast_cancer数据集from sklearn.datasets import load_breast_cancercancer=load_breast_cancer() #将数据集赋值给cancer变量print('breast_cancer数据集的长度为:',len(cancer))print('breast_cancer数据集的类型为:',type(cancer))将原创 2021-05-17 21:12:24 · 431 阅读 · 0 评论 -
python数据分析中使用pandas进行预处理 的 转换数据
转换数据(1)哑变量处理 类别型 数据(2)使用等宽法、等频法和聚类分析方法 离散化 连续型 数据1.哑变量处理类别型数据import pandas as pdimport numpy as npdetail=pd.read_csv('../数据分析/detail.csv',encoding='gbk')data=detail.loc[0:5,'dishes_name']print('哑变量处理之前:\n',data)print('哑变量处理之后:\n',pd.get_dummies(da原创 2021-04-08 20:25:54 · 446 阅读 · 0 评论 -
python数据分析中使用pandas进行预处理 的 标准化数据
标准化数据1.离差标准化数据(对原始数据的一种线性变换,结果映射到[0,1]区间)import pandas as pdimport numpy as npdetail=pd.read_csv('../数据分析/detail.csv',encoding='gbk',index_col=0)def MinMaxScale(data): #自定义离差标准化函数 data=(data-data.min())/(data.max()-data.min()) return datadata原创 2021-04-08 20:02:36 · 865 阅读 · 1 评论 -
python数据分析中使用pandas进行预处理 的清洗数据
清洗数据一、检测与处理重复值1.记录重复①利用list去重import pandas as pddetail=pd.read_csv('../数据分析/detail.csv',index_col=0,encoding='gbk')#定义去重函数def delRep(list1): list2=[] for i in list1: if i not in list2: list2.append(i) return list2#去重原创 2021-04-07 21:01:38 · 671 阅读 · 0 评论 -
python数据分析中使用pandas进行预处理 的合并数据
合并数据有三种合并数据方法:横向或纵向堆叠合并数据主键合并数据重叠合并数据(1.横向堆叠#横向堆叠import numpy as pyimport pandas as pddetail=pd.read_excel('C:/data/meal_order_detail.xlsx')df1=detail.iloc[:,:10]df2=detail.iloc[:,:10]print('合并df1的大小为%s,df2的大小为%s。'%(df1.shape,df2.shape))prin原创 2021-03-30 20:32:33 · 628 阅读 · 0 评论 -
Python中 掌握Data Frame的常用操作
掌握Data Frame的常用操作一. 查看DataFrame的常用属性DataFrame基础属性有:values(元素)、index(索引)、columns(列名) 、dtypes(类型)、size(元素个数)、ndim(维度数)和 shape(形状大小尺寸),还有使用T属性 进行转置import pandas as pddetail=pd.read_excel('E:\data\meal_order_detail.xlsx') #读取数据,使用read_excel 函数调用# print(de原创 2021-03-29 22:55:13 · 2876 阅读 · 3 评论