要学明白的知识点:
os.makedirs(os.path.join(‘…’, ‘data’))创建的文件,放在哪了?
A:'…'表示相对路径,所以是存放在当前项目的路径下的名字叫做data的文件夹里面啊混蛋!学的些什么
os.path.join(‘…’, ‘data’, ‘house_tiny.csv’)
A:就是把这三个字符串连起来,然后返回一个str类型变量’…\data\house_tiny.csv’
csv是什么意思?
A:Comma-Separated Values,逗号分隔值
iloc
A:indexLocation
pd.get_dummies()怎么用?
A:Convert categorical variable into dummy/indicator variables.
Each variable is converted in as many 0/1 variables as there are different values. Columns in the output are each named after a value; if the input is a DataFrame, the name of the original variable is prepended to the value.
每个变量都转换成不同值的0/1变量。输出中的每个列都以一个值命名;如果输入是一个DataFrame,那么原始变量的名称将被附加到该值之前。
默认的数据类型是bool值,想要输出int型需要指定,dtype = int
inputs.fillna(inputs.mean())时,出现Could not convert [’ Pave NA NA NA’] to numeric
A:不能将字符串类型转换成数字,在mean()函数里面加一条:numeric_only=True,像这样inputs.mean(numeric_only = True),it will be ok.
切片操作
A: 可以通过:分割切片参数, start :end:step
实例:
切片
import numpy as np
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print(a)
# 从某个索引处开始切割
print('从数组索引 a[1:] 处开始切割')
print(a[1:])
输出结果为:
[[1 2 3]
[3 4 5]
[4 5 6]]
从数组索引 a[1:] 处开始切割
[[3 4 5]
[4 5 6]]