Python编程随时记

目录:

  1. feature_importances_
  2. 常用到的包
  3. 常用的函数
  4. Python运算符及其优先级

一、feature_importances_
一般本质是决策树的学习器会有该属性,即特征的重要程度,常用于查看某个模型中用到数据特征的重要性排序。
RandomForest中的feature_importance

二、常用到的包
基础模块:数据处理及环境搭建

import pandas as pd #数据分析
import numpy as np #数组包
from scipy import stats #科学计算包的统计模块

import warnings
warnings.filterwarnings('ignore')

作图

import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
sns.set(style='whitegrid',palette='muted')

#防止中文乱码问题
from matplotlib.font_manager import _rebuild
_rebuild()
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=[u'SimHei']
mpl.rcParams['axes.unicode_minus']=False

计时(程序运行耗时)

import time
t1=time.time()
代码块
t2=time.time()
print('程序运行耗时',(t2-t1))

模型预处理

from sklearn.model_selection import KFold,StratifiedKFold
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import GridSearchCV

机器学习模型-回归

from sklearn.ensemble import GradientBoostingRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.linear_model import LinearRegression

机器学习模型-分类

from sklearn.linear_model import LogisticRegression
from sklearn.linear_model import LogisticRegressionCV
from sklearn.linear_model import Perceptron
from sklearn.linear_model import SGDClassifier
from sklearn.linear_model import PassiveAggressiveClassifier

from sklearn.neighbors import KNeighborsClassifier

from sklearn.svm import SVC, LinearSVC

from sklearn.gaussian_process import GaussianProcessClassifier

from sklearn.naive_bayes import GaussianNB
from sklearn.naive_bayes import BernoulliNB

from sklearn.tree import DecisionTreeClassifier

from sklearn.ensemble import AdaBoostClassifier
from sklearn.ensemble import BaggingClassifier
from sklearn.ensemble import ExtraTreesClassifier
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import VotingClassifier

导入数据

#导入数据
train=pd.read_csv('Python数据/bike_train.csv')
test=pd.read_csv('Python数据/bike_test.csv')
#合并数据集
BikeData=train.append(test,ignore_index=True)
print('训练集大小',train.shape)
print('测试集大小',test.shape)

三、Python运算符及其优先级
1)建立函数查看数据集前三行以及各列信息

#建立函数查看数据集前三行以及各列信息
def check_file(data,data_name):
    print('{:*^30}'.format('{}前3行').format(data_name))
    print(data.head(3),'\n')
    print('{:*^30}'.format('{}各列信息').format(data_name))
    print(data.info())

check_file(taobaoappDfBase,'taobaoappDfBase')
>>>
************taobaoappDfBase前3*************
    user_id    item_id  behavior_type user_geohash  item_category  \
0  98047837  232431562              1          NaN           4245   
1  97726136  383583590              1          NaN           5894   
2  98607707   64749712              1          NaN           2883   

            time  
0  2014-12-06 02  
1  2014-12-09 20  
2  2014-12-18 11   

************taobaoappDfBase各列信息************
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12256906 entries, 0 to 12256905
Data columns (total 6 columns):
user_id          int64
item_id          int64
behavior_type    int64
user_geohash     object
item_category    int64
time             object
dtypes: int64(4), object(2)
memory usage: 561.1+ MB
None

2)查看字段唯一值及空值情况

#查看字段唯一值及空值情况
def check_unique_null(dataframe):
    for column in dataframe.columns:
        print('{}列的非空值数量为'.format(column),dataframe[column][dataframe[column].notnull()].size,
              ',空值数量为',dataframe[column][dataframe[column].isnull()].size,
            ',唯一值数量为',len(dataframe[column].unique()))

check_unique_null(taobaoappDfBase)
>>>
user_id列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 10000
item_id列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 2876947
behavior_type列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 4
user_geohash列的非空值数量为 3922082 ,空值数量为 8334824 唯一值数量为 575459
item_category列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 8916
time列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 31
hour列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 24
weekday列的非空值数量为 12256906 ,空值数量为 0 唯一值数量为 7

四、Python运算符及其优先级
Python中,常用以下类型运算符:

  • 算术运算符
  • 比较(关系)运算符
  • 逻辑(布尔)运算符
  • 位运算符
  • 赋值运算符
  • 成员运算符
  • 身份运算符
    1)算术运算符
    在这里插入图片描述
    2)比较运算符
    在这里插入图片描述
    3)赋值运算符
    在这里插入图片描述
    4)位运算符
    在这里插入图片描述
    5)逻辑运算符
    在这里插入图片描述
    6)成员运算符
    在这里插入图片描述
    7)身份运算符
    在这里插入图片描述

8)优先级及举例
Python——运算符及其优先级

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值