自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 k近邻笔记

2020-09-28 09:35:34 60

原创 建模调参

首先大致说一下各个Model逻辑回归模型它是一种线性模型,适用于二分类问题,因为他的决策函数可以是sigmoid函数,经过它的转换之后,就会变成一个0/1值,这就是为什么适合二分类的原因,它的优点也很多,比如训练速度较快,因为它在做分类的时候,计算量仅仅只和特征的数目相关,再比如它内存资源占用小,只需要存储各个维度的特征值,但也有很多缺点,比如逻辑回归需要预先处理缺失值和异常值,因为它无法处理缺失值。决策树模型它最大的优点就是可视化之后十分直观,可以清晰地知道它分类的指标是什么,而且数据不需要预处理

2020-09-24 23:57:34 3547

原创 feature_select

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tqdmfrom sklearn.preprocessing import LabelEncoderfrom sklearn.feature_selection import SelectKBestfrom sklearn.feature_selecti

2020-09-21 23:54:28 2581

原创 感知机心得

什么是感知机?感知机是一种二分类模型,输入为相应的向量,输出为类别,属于判别式模型。感知机是在数据集可分的情况下,求出一个超平面,使得此超平面可以将数据集一分为二、正反例完全分开。感知机模型f(x)=sign(ω⋅x+b),此模型即为感知机模型,其中sign为符号函数,感知机模型的假设空间是定义在特征空间中的所有线性分类器,可以解释为,线性方程对应于特征空间的一个超平面S,此超平面将特征空间分为两部分,一部分为正类,一部分为反类。感知机的学习策略。首先假设数据集是线性可分得,感知机的学..

2020-09-19 23:59:31 894

原创 金融风控大赛EDA部分

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimeimport warningswarnings.filterwarnings('ignore')data_train = pd.read_csv('F:\\Datas\\Financial_risk_control\\train.csv')data_test_a = pd.read_c

2020-09-19 00:18:19 262

原创 Hadoop伪分布式

更新相关软件包2. 下载SSh下载vim4. 安装net-tools5. List item

2020-09-18 00:06:14 84

原创 Task01

PK�����/Q��<� ��/ �� ���Task01.md�Y[S��~ׯ�’� ����bS� ��<�< �9gC�-�S[�H"œaƹ�&�&4�@.�!I�H���?��I�����ڒlk B3�a@Hk��.�������r���>Y0�n|��Y��/L}؝�7_��X(�]ֶ��3s姗������ץ{W��6��uceF+��Fq�2u ���’����p�r����_m’�m�G�x�+3z�m{�(

2020-09-15 23:58:02 346 2

原创 决策树心得

以下是我看完《统计学习方法》之后的一些心得笔记,以此来记录自己的成长

2020-09-13 21:33:08 373

原创 统计学习方法第一章导图

2020-09-08 14:39:44 107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除