2018年11月_千语_肉丸子

11月 10月 09月 08月 07月 06月 05月 04月 01月

原创金字塔原理学习笔记

工作了一段时间发现人与人之间技能差异真的不大（当然也有很牛逼的人，这个另当别论），差异最大的是每个人的思考模式和思考逻辑，优秀的人思辨能力都很强，他们透过一些现象可以很系统的联想到很多事情，也有较高的深度，因此为了自己更好的的发展，都应当提高自己的思辨能力既然学习金字塔，哪我们应该知道什么是金字塔，金字塔结构是怎么样的？大家一说到金字塔大家就会想到埃及金字塔，在古...

2018-11-27 15:14:09 1961

原创深度学习Tensorlayer环境搭建

安装anaconda 在Anaconda Prompt 执行pip install Tensorlayer报如下错误Could not install packages due to anEnvironmentError: [WinError 5] 拒绝访问安装code增加--user成功安装成功导入模块包...

2018-11-19 14:47:36 645

原创不均衡数据处理方法学习笔记

实际生产数据中会出现大量不均衡数据，如果直接对原始数据进行模型训练会使结果失真，达不到预期不均衡数据处理方法主要有三种：一.欠采样：常用的是随机采样缺陷：将多数类样本删除有可能会导致分类器丢失有关多数类的重要信息二.过采样：1.简单复制少数类样本，2.扩大数据集缺陷：可能会导致分类器学习出现过拟合现象三.SMOTE过采样：利用特征空间中现存少数类样本之间的相似性来建立人工数据的（基于...

2018-11-16 15:25:25 988 1

原创 hive和presto的一些对比

1.处理json类型的数据xx:{gory_id=2, custom={"dis":"0.1","test":"test","position":"2"}, id=0}presto处理如下：select xx, json_extract_scalar(xx['custom'],'$.position')from tablelimit 1000hive处

2018-11-08 15:30:30 19549

原创 lightGBM和XGBoost使用方法总结

1.直接import lightgbm as lgt 和import XGBoost as lgt这种方式在做训练的时候需要把数据转换成模型所能处理的格式，刚入手的人容易犯错lightGBM为Dataset格式：lgb_train = lgb.Dataset(train_X, train_y, free_raw_data=False)lgb_eval = lgb.Dataset(t...

2018-11-07 18:09:05 2338 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 金字塔原理学习笔记

原创 深度学习Tensorlayer环境搭建

原创 不均衡数据处理方法学习笔记

原创 hive和presto的一些对比

原创 lightGBM和XGBoost使用方法总结

空空如也

空空如也

原创金字塔原理学习笔记

原创深度学习Tensorlayer环境搭建

原创不均衡数据处理方法学习笔记