自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习、数据挖掘

机器学习、数据挖掘

  • 博客(5)
  • 收藏
  • 关注

原创 金字塔原理学习笔记

        工作了一段时间发现人与人之间技能差异真的不大(当然也有很牛逼的人,这个另当别论),差异最大的是每个人的思考模式和思考逻辑,优秀的人思辨能力都很强,他们透过一些现象可以很系统的联想到很多事情,也有较高的深度,因此为了自己更好的的发展,都应当提高自己的思辨能力       既然学习金字塔,哪我们应该知道什么是金字塔,金字塔结构是怎么样的?大家一说到金字塔大家就会想到埃及金字塔,在古...

2018-11-27 15:14:09 1961

原创 深度学习Tensorlayer环境搭建

安装anaconda 在Anaconda Prompt 执行pip install Tensorlayer报如下错误Could not install packages due to anEnvironmentError: [WinError 5] 拒绝访问安装code增加--user成功安装成功导入模块包...

2018-11-19 14:47:36 645

原创 不均衡数据处理方法学习笔记

实际生产数据中会出现大量不均衡数据,如果直接对原始数据进行模型训练会使结果失真,达不到预期不均衡数据处理方法主要有三种:一.欠采样:常用的是随机采样缺陷:将多数类样本删除有可能会导致分类器丢失有关多数类的重要信息二.过采样:1.简单复制少数类样本,2.扩大数据集缺陷:可能会导致分类器学习出现过拟合现象三.SMOTE过采样:利用特征空间中现存少数类样本之间的相似性来建立人工数据的(基于...

2018-11-16 15:25:25 988 1

原创 hive和presto的一些对比

1.处理json类型的数据xx:{gory_id=2, custom={"dis":"0.1","test":"test","position":"2"}, id=0}presto处理如下:select xx, json_extract_scalar(xx['custom'],'$.position')from tablelimit 1000hive处

2018-11-08 15:30:30 19549

原创 lightGBM和XGBoost使用方法总结

1.直接import  lightgbm as lgt 和import  XGBoost as lgt这种方式在做训练的时候需要把数据转换成模型所能处理的格式,刚入手的人容易犯错lightGBM为Dataset格式:lgb_train = lgb.Dataset(train_X, train_y, free_raw_data=False)lgb_eval = lgb.Dataset(t...

2018-11-07 18:09:05 2338 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除