自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

super_chiry的博客

原创推荐系统中的特征工程

文章目录推荐系统中的特征工程1. 构建特征工程需要遵循的基本原则2. 推荐系统中的常用特征2.1 用户行为数据2.2 用户关系数据2.3 属性，便签类数据2.4 内容类数据2.5 上下文信息2.6 统计类信息2.7 组合类特征3. 常用的特征处理方法3.1 连续型特征3.2 类别型特征4. 特征工程与业务理解推荐系统中的特征工程机器学习模型的学习能力边界在于数据的拟合和泛华，数据的表达以及特征工程本身决定了机器学习的上限。为构建一个“好”的特征工程，需要依次解决三个问题：构建特征工程需要遵循的基本原

2020-08-23 23:26:31 767

原创集成学习:Bagging、Boosting、Stacking、Blending

集成学习按大类分也可以分为串行集成方法和并行集成方法。串行模型利用模型之间的依赖性，给错误分类样本一个较大的权重来提升模型的性能。而并行模型主要领用不同模型的差异性，加权平均之后能够较大的降低误差。BaggingBagging是引导聚合的意思。减少一个估计方差的一种方式就是对多个估计进行平均。例如可以将训练集通过多折分为不同的训练集剩下的作为验证集，而最后预测的结果采用多折预测每个模型的平均结果。Bagging使用装袋采样来获取数据子集训练基础学习器。通常分类任务使用投票的方式集成，而回归任务通过平

2020-07-02 12:34:01 558

原创推荐系统眼中的你---用户画像

用户画像我们已经进入到互联网的下半场，增长的动力来自数据驱动。而数据分析的出发点，来自于对用户行为及需求的洞察。如何将用户标签化以便推荐系统能够推荐合适的内容给用户是用户画像的重点。用户画像的准则我们需要解决三个问题：都是谁从哪来到哪去Step1、统一标识：用户唯一标识是整个用户画像的核心Step2、给用户打标签：用户标签的4个维度Step3、基于标签指导业务：业务赋能的3个...

2020-04-16 20:57:51 326

原创强化学习与推荐系统

强化学习简介强化学习（Reinforcement Learning）：机器学习的一个分支：监督学习、无监督学习、强化学习强化学习的思路和人比较类似，是在实践中学习比如学习走路，如果摔倒了，那么我们大脑后面会给一个负面的奖励值 => 这个走路姿势不好；如果后面正常走了一步，那么大脑会给一个正面的奖励值 => 这是一个好的走路姿势与监督学习的区别，没有监督学习已经准备好的训练数...

2020-02-23 18:49:09 4414

原创 Learning to Rank(LTR, Pointwise，Pairwise，Listwise, NDCG, RankNet, ranklib)

LTR介绍以及排序算法与工具使用

2019-12-22 18:25:44 1701

原创 Python SSH,telnet教程及代码，Python如何执行TCL，控制spirentTestCenter，以及基本的数据EDA

需求分析公司要求做自动化测试，在交换芯片流片前测试芯片的功能，在palladium上跑综合网表，仿真实现芯片的功能，具体如何实现的就不细说了，不是重点TAT。我目前的工作就是负责能够用脚本SSH远程服务器，执行Linux下执行一些之前写好的测试程序（芯片的配置代码），同时在配置好芯片后，使用脚本控制测试仪，使得测试仪构造报文，发流停流等功能。由于我们租用的思博伦测试仪版本太老，只支持TCL脚本...

2019-12-19 18:59:11 1705

原创 pandas显示所有行/列

pandas显示所有行/列以及设置value显示的长度#设置value的显示长度为200，默认为50pd.set_option('max_colwidth',200)#显示所有列，把行显示设置成最大pd.set_option('display.max_columns', None)#显示所有行，把列显示设置成最大pd.set_option('display.max_rows', Non...

2019-12-19 17:49:24 23650

原创因子分解机（FM，FFM，DeepFM，libfm,xlearn）

因子分解机MF的局限性以及因子分解机在之间的博客中具体描述了矩阵分解在推荐系统的应用，介绍了funkSVD，BiasSVD，SVD++等算法，这些算法的思想是将rateing矩阵分解为user矩阵和item矩阵的乘积。但是在实际的推荐系统中，除了user和item特征，还有很多其他特征也需要加以应用，实际中一个预测问题包含的特征维度可能很多，因此有了后来的FM，FFM以及与DNN结合的dee...

2019-11-17 22:39:15 707

原创推荐系统中的矩阵分解（一）（ALS,SVD,BiasdSVD,SVD ++,surprise工具）

推荐系统中的矩阵分解（一）（SVD,BiasdSVD,SVD ++）矩阵分解在推荐系统中的位置什么是矩阵分解功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLo...

2019-11-10 13:29:09 5557

netflix-inc/netflix-prize-data

netflix-prize-data 数据集 Netflix数据集包含了1999.12.31-2005.12.31期间匿名客户提供的超过一亿部电影平级

2019-10-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除