- 博客(9)
- 收藏
- 关注
原创 建模调参
首先大致说一下各个Model逻辑回归模型它是一种线性模型,适用于二分类问题,因为他的决策函数可以是sigmoid函数,经过它的转换之后,就会变成一个0/1值,这就是为什么适合二分类的原因,它的优点也很多,比如训练速度较快,因为它在做分类的时候,计算量仅仅只和特征的数目相关,再比如它内存资源占用小,只需要存储各个维度的特征值,但也有很多缺点,比如逻辑回归需要预先处理缺失值和异常值,因为它无法处理缺失值。决策树模型它最大的优点就是可视化之后十分直观,可以清晰地知道它分类的指标是什么,而且数据不需要预处理
2020-09-24 23:57:34 3547
原创 feature_select
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tqdmfrom sklearn.preprocessing import LabelEncoderfrom sklearn.feature_selection import SelectKBestfrom sklearn.feature_selecti
2020-09-21 23:54:28 2581
原创 感知机心得
什么是感知机?感知机是一种二分类模型,输入为相应的向量,输出为类别,属于判别式模型。感知机是在数据集可分的情况下,求出一个超平面,使得此超平面可以将数据集一分为二、正反例完全分开。感知机模型f(x)=sign(ω⋅x+b),此模型即为感知机模型,其中sign为符号函数,感知机模型的假设空间是定义在特征空间中的所有线性分类器,可以解释为,线性方程对应于特征空间的一个超平面S,此超平面将特征空间分为两部分,一部分为正类,一部分为反类。感知机的学习策略。首先假设数据集是线性可分得,感知机的学..
2020-09-19 23:59:31 894
原创 金融风控大赛EDA部分
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimeimport warningswarnings.filterwarnings('ignore')data_train = pd.read_csv('F:\\Datas\\Financial_risk_control\\train.csv')data_test_a = pd.read_c
2020-09-19 00:18:19 262
原创 Task01
PK�����/Q��<���/ �� ���Task01.md�Y[S��~ׯ�’�����bS���<�< �9gC�-�S[�H"œaƹ�&�&4�@.�!I�H���?��I�����ڒlkB3�a@Hk��.�������r���>Y0�n|��Y��/L}؝�7_��X(�]ֶ��3s姗������ץ{W��6��uceF+��Fq�2u���’����p�r����_m’�m�G�x�+3z�m{�(
2020-09-15 23:58:02 346 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人