自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 [机器学习 - 算法调用] 随机森林 sklearn.RandomForestCLassifier/ Regressor

特征重要性feature_importances_Return the feature importances (the higher, the more important the feature).Returns: feature_importances_:array, shape = [n_features] The values of this arr...

2019-05-14 22:07:43 1197

原创 [Python] pandas.DataFrame.loc函数使用场景记录

全面详解请参考下面博客!https://blog.csdn.net/brucewong0516/article/details/82494090以某列为条件,筛选得到另一列的值如下例,loc以列'TARGET'的值做布尔值筛选,输出的是另一列'DAYS_BIRTH'的数据app_train.loc[app_train['TARGET']==0, 'DAYS_BIRTH']...

2019-05-14 21:24:18 980

转载 [Python] axis=0 与axis=1的区分

转自:https://www.cnblogs.com/rrttp/p/8028421.htmlhttp://blog.csdn.net/wangying19911991/article/details/73928172https://www.zhihu.com/question/58993137其实问题理解axis有问题,df.mean其实是在每一行上取所有列的均值,而不是保...

2019-05-12 19:52:42 286

原创 [Kaggle] kernel中常用方法和语句总结

目录读取数据表格类型数据读数据,看行数、列数,前几行EDA查看目标变量分布目标变量为分类变量查看缺失值目标dataframe缺失数据的分布查看不同类型变量情况Category/分类变量预处理object类型的变量是分类变量,查看所有分类变量的取值个数Label Encoder - 注意要同时code train和test集!OneHot E...

2019-05-12 19:50:25 1099

原创 [机器学习 - 特征工程] Category/分类变量预处理 - Label Encoding和OneHot Encoding的选择

总结:Label Encoding优点:节约空间缺点:对同一个特征,每次编码的结果不一样;编码隐含了特征取值的相关关系OneHot Encoding优点:避免了LabelEncoding的缺点...缺点:特征取值多时占用空间较多使用推荐:在特征取2值时,使用LabelEncoding。其他情况用OneHotEncoding,如果转换之后维度过高,后续用PCA或其...

2019-05-12 13:44:42 1444

原创 [Deep Learning] 吴恩达深度学习作业 知识点记录

Lesson 1 Week 21. Python Basics with Numpy1.1 - 记住sigmoid的导数s = sigmoid (x)sigmoid_derivative (x) = s * (1-s)1.2 - 图片的三维存储表示https://cloud.tencent.com/developer/article/1144927图片的矩阵表示通常为(wid...

2019-05-05 23:33:12 582

转载 TypeError: ufunc did not contain a loop with signature matching types dtype('U32')

原因:object类型和int类型相加减解决方法:此时的object类型可能是‘12.3’这样str格式的数字,如果要运算必须进行格式转换: 可采用如下方法(pd.to_numeric()):panel_info['input'] = pd.to_numeric(panel_info['input'])参考:https://blog.csdn.net/m0_37477175/a...

2018-12-20 13:37:05 33710 2

原创 [机器学习 - 算法原理] lasso与岭回归的差异

2018-03-25 17:02:46 1356

原创 [机器学习 - 算法原理] CART树剪枝的理解

看了李航的《统计学习方法》中CART树的剪枝,不很清晰,又查了网上一些相关资源,终于明白了整个过程,个人的理解如下(原本写在OneNote上,公式粘贴过来不能显示,就贴图了):but...既然剪来剪去都要所有子树一起去做交叉验证...那直接做交叉验证不行吗...?...

2018-03-24 23:07:35 980 2

原创 Python numpy - 矩阵

求逆矩阵用numpy的linalg库先判断矩阵是否可逆,再运算 if np.linalg.det(xTx) == 0: print("This matrix is singular, cannot be inversed!") ws = xTx.I * (xMat.T * yMat)是否可以用try...except...else...finally来完成?不知道抛出...

2018-03-18 12:05:43 1097

原创 [机器学习 - 基本算法] 感知机

import numpy as npimport matplotlib.pyplot as plt# initializationn = 2l = 100x1 = np.random.randint(0, 100, size=(l, n))x2 = np.random.randint(-100, 0, size=(l, n))x = np.array((x1, x2)).res...

2018-03-11 21:04:48 156

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除