xgb, lgb, Keras, LR(二分类、多分类代码)

最新推荐文章于 2024-06-18 21:40:11 发布

dili8870

最新推荐文章于 2024-06-18 21:40:11 发布

阅读量2.6k

点赞数 4

文章标签：人工智能 r语言 python

原文链接：http://www.cnblogs.com/nxf-rabbit75/p/9748345.html

版权

preprocess

# 通用的预处理框架
 
import pandas as pd
import numpy as np
import scipy as sp
 
# 文件读取
def read_csv_file(f, logging=False):
    print("==========读取数据=========")
    data =  pd.read_csv(f)
    if logging:
        print(data.head(5))
        print(f, "包含以下列")
        print(data.columns.values)
        print(data.describe())
        print(data.info())
    return data

Logistic Regression

# 通用的LogisticRegression框架
 
import pandas as pd
import numpy as np
from scipy import sparse
from sklearn.preprocessing import OneHotEncoder
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
 
# 1. load data
df_train = pd.DataFrame()
df_test  = pd.DataFrame()
y_train = df_train['label'].values
 
# 2. process data
ss = StandardScaler()
 
 
# 3. feature engineering/encoding
# 3.1 For Labeled Feature
enc = OneHotEncoder()
feats = ["creativeID", "adID", "campaignID"]
for i, feat in enumerate(feats):
    x_train = enc.fit_transform(df_train[feat].values.reshape(-1, 1))
    x_test = enc.fit_transform(df_test[feat].values.reshape(-1, 1))
    if i == 0:
        X_train, X_test = x_train, x_test
    else:
        X_train, X_test = sparse.hstack((X_train, x_train)), sparse.hstack((X_test, x_test))
 
# 3.2 For Numerical Feature
# It must be a 2-D Data for StandardScalar, otherwise reshape(-1, len(feats)) is required
feats = ["price", "age"]
x_train = ss.fit_transform(df_train[feats].values)
x_test  = ss.fit_transform(df_test[feats].values)
X_train, X_test = sparse.hstack((X_train, x_train)), sparse.hstack((X

最低0.47元/天解锁文章

dili8870

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
xgb, lgb, Keras, LR(二分类、多分类代码)

preprocess# 通用的预处理框架 import pandas as pdimport numpy as npimport scipy as sp # 文件读取def read_csv_file(f, logging=False): print("==========读取数据=========") data = pd.read_csv(f) ...
复制链接

扫一扫