数据预处理
文章平均质量分 74
bigbao_num
爱生活,爱算法,爱nlp
展开
-
基于pandas和seaborn进行数据可视化以及相关性分析
本博客学习pandas数据结构和seabon,以kaggle数据集为例,完成数据可视化以及相关性分析。数据总共12列,其中Survived列为target属性(y属性)。加载原始数据pandas数据结构可以方便实现数据预处理,包括基本元素统计、均值、缺失值以及过滤,加上seaborn和matplotlib实现数据相关性分析以及特征可视化分析。原创 2017-05-04 15:11:38 · 7978 阅读 · 0 评论 -
基于pandas进行数据预处理
参加kaggle数据挖掘比赛,就第一个赛题Titanic的数据,学习相关数据预处理以及模型建立,本博客关注基于pandas进行数据预处理过程。包括数据统计、数据离散化、数据关联性分析引入包和加载数据import pandas as pd import numpy as np train_df =pd.read_csv('../datas/train.csv') # train set test_d原创 2017-04-27 11:10:43 · 8169 阅读 · 0 评论