- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 Python3 使用fastText进行文本分类 新闻分类
简介这篇博客将会简要记录使用python版本的fastText对不同类别新闻进行分类,中间会使用结巴分词,pandas的数据处理。新闻数据可以使用清华的新闻数据。安装依赖Python版本:3.6 安装结巴分词以及fasttextpip install jiebapip install fasttext分词处理分词过程中会删除一些常用的停用词,停用词可以使用https:...
2018-04-24 17:56:42 16966 1
原创 SVD奇异值分解 中特征值与奇异值的数学理解与意义
前言之前的博客中SVD推荐算法写得不是很严谨,r̂ ui=∑Ff=1PufQfi+μ+bu+bir^ui=∑f=1FPufQfi+μ+bu+bi\hat{r}_{ui}=\sum_{f=1}^{F}{P_{uf}Q_{fi}}+\mu+b_u+b_i 更像是矩阵分解多一点,没有涉及到SVD的数学意义,这篇博客大概会写一些数学SVD的数学理解,以及SVD在PCA和推荐算法上面的应用。...
2018-04-09 13:35:41 4967
原创 XGBoost简单推导及理解
前言XGBoost的全称是eXtreme Gradient Boosting。作为一个非常有效的机器学习方法,Boosting Tree是数据挖掘和机器学习中最常用的算法之一。因为它效果好,对于输入要求不敏感,相对LR 的优势如不需要做特征的归一化,自动进行特征选择,模型可解释性较好,可以适应多种损失函数如 SquareLoss,LogLoss 等,往往是从统计学家到数据科学家必备的工具之一,...
2018-04-04 00:39:47 3066
NVIDIA 显卡驱动 TLinux 签名内核
2020-10-06
Python 强化学习 DQN Flappy Bird
2018-09-25
推荐系统实践
2018-09-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人