pandas
本文档代码语法为jupyter notebook格式
👉:数据来源
视频教程,Youtube
import pandas as pd # 导包
df = pd.read_csv('vgsales.csv') # 导入数据
df.shape # 显示几行几列
df.describe() # 返回数据集中每一列的一些基本信息
df.values # 二维数组输出
决策树实现:年龄性别预测喜欢歌曲风格
sklearn机器学习库
需要对数据进行清洗(去重,删空值),准确率才高
- 导入需要的包和数据集
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split