大家好,本文将围绕python随机森林特征重要性展开说明,python随机森林分类模型是一个很多人都想弄明白的事情,想搞清楚随机森林算法python代码需要先了解以下几个事情。
以下内容笔记出自‘跟着迪哥学python数据分析与机器学习实战’,外加个人整理添加,仅供个人复习使用。
这里以一个例子切入随机森林的建模,使用随机森林弯沉对天气最高温度的预测
1. 导入数据
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')
import os
#os.chdir()
features=pd.read_csv(r'data\temps.csv')
print(features.shape)
features.head(2)
2. 数据探索
2.1 时间数据规范获取
import datetime
years=features['year']
months=features['month']
days=features['day']
#datetime格式
dates=[str(int(year))+'-'+str(int(month))+'-'+str(int(day))
for year,month,day in zip(years,months,days)]
dates=[datetime.datetime.strptime(date,'%Y-%m-%d') for date in dates]
dates[:5]
[datetime.datetime(2016, 1, 1, 0, 0),
datetime.datetime(2016, 1, 2, 0, 0),
datetime.datetime(2016, 1, 3, 0, 0),
datetime.datetime(2016, 1, 4, 0, 0),
datetime.datetime(2016, 1, 5, 0, 0)]
逻辑是先将原数据中的时间变量组合,转化为时间格式,然后再分割成事件类型的数据怎么用python画圆弧。
2.2 时间序列作图
查看最高气温、前天、昨天、friend列的数据值
import seaborn as sns
fig,ax=plt.subplots(nrows=2,ncols=2,figsize=(10,8))
fig.auto