步骤一:安装pandas数据包
代码:
pip install pandas
输出结果:
步骤二:导入数据集
代码:
import pandas as pd
name=['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin','Normal Nucleoli', 'Mitoses', 'Class']
data=pd.read_csv(r"https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",names=name)
data
输出结果:
步骤三:数据集进行切片
代码:
data.loc[:,:"Mitoses"]
输出结果:
步骤四:数据集进行切片
代码:
data.iloc[:,1:-1]
输出结果:
iloc和loc的区别
1.联系
(1)操作对象相同:loc和iloc都是对DataFrame类型进行操作;
(2)完成目的相同:二者都是用于选取DataFrame中对应行或列中的元素。
2.区别
(1)loc和iloc索引的行列标签类型不同。
(2)iloc使用顺序数字来索引数据,而不能使用字符型的标签来索引数据;注意:这里的顺序数字是指从0开始计数
(3)loc使用实际设置的索引来索引数据。但行列名为数字时,loc也可以索引数字,但这里的数字不一定从0开始编号,是对应具体行列名的数字