01-《机器学习及实践》学习之数据预处理

#0 -*- coding: UTF-8 -*-
#导入工具包,做数据预处理
import pandas as pd
import numpy as np

#创建特征列表
colum_names=['Sample code number',
             'Clump Thickness',
             'Uniformity of Cell Size',
             'Uniformity of Cell Shape',
             'Marginal Adhesion',
             'Single Epithelial Cell Size',
             'Bare Nuclei',
             'Bland Chromatin',
             'Normal Nucleoli',
             'Mitoses',
             'Class']


#使用pandas.read_csv()函数从互联网读取指定数据
#df_train = pd.read_csv('D:\\Python2713\\Datasets\\Breast-Cancer\\breast-cancer-train.csv')
#df_test = pd.read_csv('D:\\Python2713\\Datasets\\Breast-Cancer\\breast-cancer-test.csv')
data=pd.read_csv('D:\\Python2713\\Datasets\\wisonsin\\wisconsin.csv',names=colum_names)
data=data.replace(to_replace='?',value=np.nan)
#丢弃带有缺失值的 数据(只要有一个维度有缺失)
data=data.dropna(how='any')
#输出data的数据量和维度
print data.shape

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

千码君2016

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值