自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 libsvm/libffm与dataframe格式相互转换

1. libsvm与dataframe格式相互转换## 将libsvm转为dataframefrom sklearn.datasets import load_svmlight_filefrom pandas import DataFrameimport pandas as pdX_train, y_train = load_svmlight_file("libsvm_data.txt...

2019-04-29 18:23:24 4966 2

原创 用户画像系统概述

1. 用户画像的概念1.1 什么是用户画像?用户画像是对现实世界中的用户的数学建模。1.2 用户标签画像用户标签画像是用标签标示方法来表示用户。标签是某一种用户特征的符号表示;用户画像是一个整体,各个维度不孤立,标签之间有联系;用户画像可以用标签的集合来表示。1.3 用户标签的数学描述:标签是特征空间中的维度。特征空间:每个标签都是特征空间中的基向量;基向量之间有关联...

2019-04-27 15:09:30 7399 1

转载 Pandas实现Hive中的窗口函数

1、Hive窗口函数我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。row_number()该函数的格式如下:row_Number() OVER (partition by 分组字段 ORDER BY 排序字段 排序方式asc/desc)简单的说,我们使用partition by后面的字段对数据进行分组,在每个组内,使用ORDER BY...

2019-04-26 12:52:57 2737

原创 git常用操作

git常用操作1、cd进入目录:2、把当前目录变成git可以管理的仓库:git init3、添加文件:单个文件:git add readme.md全部文件:git add -A4、提交修改:git commit -m “一定要写备注”5、查看是否还有未提交任务:git status6、查看最近日志:git log7、版本回退操作:回退一个:git reset -hard...

2019-04-25 16:46:56 195

原创 论文精读(一)——XGBoost:A Scalable Tree Boosting System

论文精读(一)——XGBoost:A Scalable Tree Boosting System

2019-04-21 14:36:40 2020

原创 统计学习方法(7)前向分步算法推导AdaBoost的详细过程

由前向分步算法可以推导Adaboost,用定理叙述这一关系:定理:AdaBoost算法是前向分步加法算法的特例。这时,模型是由基本分类器组成的加法模型,损失函数是指数函数。证明:前向分步算法学习的是加法模型,当基函数为基本分类器时,该加法模型等价于AdaBoost的最终分类器:f(x)=∑m=1MαmGm(x)f(x) = \sum_{m=1}^{M} \alpha_{m}G_{m}(x...

2019-04-19 17:25:23 1057 2

原创 用GBDT构建组合特征

用GBDT构建组合特征

2019-04-13 19:42:28 4511 3

原创 GBDT(sklearn/lightgbm)调参小结

GBDT(sklearn/lightgbm)调参小结原理参数选择特征重要度

2019-04-13 19:37:36 20763 11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除