一、分类
一、数据类型
1、python自带类型
list #列表
tuple #元组,类似列表,不允许修改,只能被查询
dict #字典
set #集和,不允许重复元素,类似于无值的字典
my_set = {
'123','456',89,True}
2、numpy包中多维数组ndarray
ndarray内存方式优于列表,还允许矢量运算,存储数据类型一致的元素
#loadtxt方法可将指定文件(txt或csv)中的数据加载到数组,返回ndarray类型
#当读取的原始表格数据类型不一致时,会尝试转换为一致,不成功则报错
import numpy as np
x=np.loadtxt(../xxx.csv,delimiter=',')
y=np.array([1,2,3])
3、pandas包中dataframe二维表格结构
(其他创建方式见这条博客)
#通过读取文件方式创建
import pandas as pd
#参数header表示每行的索引,names表示列标题
df_train = pd.read_csv('../train.csv',header=None,names=['sepal,'sepal_wid','target'])
通过values进行访问,返回ndarray结构数组
df_train.values
#输出
array([[2000, 'Ohio', 1.5, 0],
[2001, 'Ohio', 1.7, 1],
[2002, 'Ohio', 3.6, 2],
[2001, 'Nevada',<