python收入分析_python美国人口收入分析

数据描述:

数据探索:

我们在jupyter上利用python语言进行探索,探索代码如下:

# Data Manipulation 数据操作

import numpy as np

import pandas as pd

# Visualization 可视化

import matplotlib.pyplot as plt

import missingno

import seaborn as sns

from pandas.plotting import scatter_matrix

from mpl_toolkits.mplot3d import Axes3D

#读入数据

df = pd.read_csv('data.csv', header=None)

df.head()

# 数据信息

df.info()

数据清洗:

在jupyter上利用python语言进行清洗,出去无效信息,空值,代码如下:

# 数据处理: 删除缺失值样本

# 将?字符串替换为NaN缺失值标志

import numpy as np

df.replace("?",np.nan,inplace=True)

# 此处直接删除缺失值样本(包含缺失值的行都删除)

df.dropna(inplace=True)

数据分析:

在jupyter上利用python语言进行分析,代码如下:

# 展示所有种类型特征

df.describe(include=['O'])

数据模型建立:

在jupyter上利用python语言进行建模,代码如下:

# 单特征展示

import math

def plot_distribution(dataset, cols=5, width=20, height=15, hspace=0.2, wspace=0.5):

plt.style.use('seaborn-whitegrid')

fig = plt.figure(figsize=(width,height))

fig.subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=wspace, hspace=hspace)

rows = math.ceil(float(dataset.shape[1]) / cols)

for i, column in enumerate(dataset.columns):

ax = fig.add_subplot(rows, cols, i + 1)

ax.set_title(column)

if dataset.dtypes[column] == np.object:

g = sns.countplot(y=column, data=dataset)

substrings = [s.get_text()[:18] for s in g.get_yticklabels()]

g.set(yticklabels=substrings)

plt.xticks(rotation=25)

else:

#直方图,频数

g = sns.distplot(dataset[column])

plt.xticks(rotation=25)

plot_distribution(df, cols=3, width=20, height=20, hspace=0.45, wspace=0.5)

0-14依次为:'age', 'workclass', 'fnlwgt','education','education-num', 'marital-status', 'occupation','relationship', 'race', 'sex',  'capital-gain', 'capital-loss','hours-per-week', 'native-country','income' 单特征影响

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值