DAY1
集成开发环境
- Spyder (前身是 Pydee) 是一个强大的交互式 Python 语言开发环境,提供高级的代码编辑、交互测试、调试等特性,支持包括 Windows、Linux 和 OS X 系统。
- 下载Anaconda之后,打开Spyder环境:
原始数据展示
- 是.csv文件
主要函数介绍
data.iloc()函数
- 属于pandas库,功能:从数据表中提出想要的数据。
- 其中,i 表示只接受整型的参数;loc表示location。
dataset.iloc[0]
dataset.iloc[:,:-1]
dataset.iloc[:,3]
dataset.iloc[1:3,1]
取左不取右。
mean()
这个函数在excel中也表示用来求平均数。
可执行代码
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
dataset=pd.read_csv('Data.csv')
# 自变量包括所有的行,除最后一列之外的列
x=dataset.iloc[:,:-1]
# 因变量包括所有的行,最后一列
y=dataset.iloc[:,3]
# 处理缺失值
X['Age'] = X['Age'].fillna(X['Age'].mean()) #median
X['Salary'] = X['Salary'].fillna(X['Salary'].mean()) #median
导入结果展示(缺失值处理前)
缺失值处理后
我的写在最后
学习资料来自荔枝微课。