- 博客(8)
- 收藏
- 关注
原创 libsvm/libffm与dataframe格式相互转换
1. libsvm与dataframe格式相互转换## 将libsvm转为dataframefrom sklearn.datasets import load_svmlight_filefrom pandas import DataFrameimport pandas as pdX_train, y_train = load_svmlight_file("libsvm_data.txt...
2019-04-29 18:23:24 4968 2
原创 用户画像系统概述
1. 用户画像的概念1.1 什么是用户画像?用户画像是对现实世界中的用户的数学建模。1.2 用户标签画像用户标签画像是用标签标示方法来表示用户。标签是某一种用户特征的符号表示;用户画像是一个整体,各个维度不孤立,标签之间有联系;用户画像可以用标签的集合来表示。1.3 用户标签的数学描述:标签是特征空间中的维度。特征空间:每个标签都是特征空间中的基向量;基向量之间有关联...
2019-04-27 15:09:30 7400 1
转载 Pandas实现Hive中的窗口函数
1、Hive窗口函数我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。row_number()该函数的格式如下:row_Number() OVER (partition by 分组字段 ORDER BY 排序字段 排序方式asc/desc)简单的说,我们使用partition by后面的字段对数据进行分组,在每个组内,使用ORDER BY...
2019-04-26 12:52:57 2738
原创 git常用操作
git常用操作1、cd进入目录:2、把当前目录变成git可以管理的仓库:git init3、添加文件:单个文件:git add readme.md全部文件:git add -A4、提交修改:git commit -m “一定要写备注”5、查看是否还有未提交任务:git status6、查看最近日志:git log7、版本回退操作:回退一个:git reset -hard...
2019-04-25 16:46:56 196
原创 论文精读(一)——XGBoost:A Scalable Tree Boosting System
论文精读(一)——XGBoost:A Scalable Tree Boosting System
2019-04-21 14:36:40 2024
原创 统计学习方法(7)前向分步算法推导AdaBoost的详细过程
由前向分步算法可以推导Adaboost,用定理叙述这一关系:定理:AdaBoost算法是前向分步加法算法的特例。这时,模型是由基本分类器组成的加法模型,损失函数是指数函数。证明:前向分步算法学习的是加法模型,当基函数为基本分类器时,该加法模型等价于AdaBoost的最终分类器:f(x)=∑m=1MαmGm(x)f(x) = \sum_{m=1}^{M} \alpha_{m}G_{m}(x...
2019-04-19 17:25:23 1057 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人