- 博客(3)
- 资源 (15)
- 收藏
- 关注
原创 百面机器学习笔记
第三章 经典算法–支持向量机SVM的第一个问题:对于任意线性可分的两组点,在SVM分类的超平面上的投影都是线性不可分的。证明大概是这样的:首先通过反证法证明,存在一个超平面,使得SVM让所有支持向量在该超平面上的投影依然可分,但是对于可分的这个情况,支持向量却存在更优的超平面,因此不满足于SVM的前提超平面是"最大化的间隔平面"的定义,故证明投影是线性不可分的。接着作者又补充了证明,即刚才...
2019-12-12 21:07:41 287
原创 Kaggle入门--泰坦尼克号存活率预测(完整流程)
1. 通过热力图的方式来查看缺失的数据sns.heatmap(train.isnull(), yticklabels=False, cbar=False, cmap='viridis')tip:对于有些数据集中可能不是显式的存在缺失值,而是把缺失值替换成了特殊的字符,这种情况的话可以先将特殊字符替换为np.nan,再用isnull()函数。2. 查看离散变量和连续变量的属性# 统计离散变...
2019-12-06 23:41:07 3151
原创 数据分析常用处理方法总结
一. 查看每列的数据结构def print_col_info(dataset): '''print info of every column in dataset: detailed info includes: 1, values 2, value type num''' col_num=dataset.shape[1] for i in ran...
2019-12-04 17:21:47 410
nlp-requirements安装包
2019-06-08
selenium webdriver第三版
2018-09-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人