自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 特征工程

特征工程特征提取基于距离的特征波峰波谷特征

2020-08-24 22:43:51 67

原创 数据重构

数据的合并要控制axis 横向还是纵向合并stack函数 转置groupby分组函数

2020-08-23 23:22:26 160

原创 时间序列

#时间序列#创建数据的深层拷贝data=total_balance浅拷贝data = total_balance.copy()数据重命名data = data[[‘date’,‘purchase_residual’,‘redeem_residual’,‘total_purchase_amt_base’, ‘total_redeem_amt_base’]]for i in data.columns:if i == ‘date’:data[i] = data[i].astype(str)da

2020-08-22 22:38:12 120

原创 决策树分类

基于决策树的分类算法初始化模型分成测试集和训练集模型拟合模型预测模型评估模型评估#选择其类别为0和1的样本 (不包括类别为2的样本)data_target_part = data[data[‘Species’].isin([0,1])][[‘Species’]]data_features_part = data[data[‘Species’].isin([0,1])][[‘Culmen Length (mm)’,‘Culmen Depth (mm)’,‘Flipper Length (m

2020-08-22 21:03:52 180

原创 数据清洗与特征工程

数据清洗与特征工程查找空值处理空值的办法 1.删除空值所在的行 2.用给定的值去填充查找重复值删除重复值对数值型数据 连续数据进行离散化处理文本类型处理#方法三: 使用sklearn.preprocessing的LabelEncoderfrom sklearn.preprocessing import LabelEncoderfor feat in [‘Cabin’, ‘Ticket’]:#for函数lbl = LabelEncoder()label_dict = dict(zip(

2020-08-21 21:25:17 166

原创 逻辑回归

机器学习逻辑回归lr_clf = LogisticRegression() 模型初始化plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap=‘viridis’)自己对画图库matplotlib.pyplot 和seaborn了解不够,##定义逻辑回归模型clf=LogisticRegression(random_state=0,solver=‘lbfgs’)这里的random_state就是为了保证程序每次运行都分割

2020-08-20 21:05:06 137

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除