![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Datawhale学习
文章平均质量分 87
qq_36818174
这个作者很懒,什么都没留下…
展开
-
Task 01 文件自动化处理-Datawhale
1、文件处理环境:window10,工具pycharm1.1 os.path.join()函数连接两个或更多的路径名组件1.如果各组件名首字母不包含’/’,则函数会自动加上2.如果有一个组件是一个绝对路径,则在它之前的所有组件均会被舍弃3.如果最后一个组件为空,则生成的路径以一个’/’分隔符结尾import osos.path.join('Datawhale','docu') #Datawhale\docu1.2 获取当前目录以当前目录:E:/python/自动化为例子,import原创 2021-11-14 18:47:07 · 1450 阅读 · 0 评论 -
Task02 DeepFM_深度推荐模型
1、动机对于CTR问题,被证明的最有效的提升任务表现的策略是特征组合(Feature Interaction), 在CTR问题的探究历史上来看就是如何更好地学习特征组合,进而更加精确地描述数据的特点。可以说这是基础推荐模型到深度学习推荐模型遵循的一个主要的思想。而组合特征大牛们研究过组合二阶特征,三阶甚至更高阶,但是面临一个问题就是随着阶数的提升,复杂度就成几何倍的升高。这样即使模型的表现更好了,但是推荐系统在实时性的要求也不能满足了。所以很多模型的出现都是为了解决另外一个更加深入的问题:如何更高效的学习原创 2021-03-21 23:50:27 · 199 阅读 · 0 评论 -
Task02 数据分析_零心跳信号分类预测
1、目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。2、内容介绍1、载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy;可视化库 mat原创 2021-03-20 00:16:22 · 125 阅读 · 0 评论 -
Task02 Wide & Deep_深度推荐模型
1、概述在CTR预估任务中利用手工构造的交叉组合特征来使线性模型具有“记忆性”,使模型记住共现频率较高的特征组合,往往也能达到一个不错的baseline,且可解释性强。但这种方式有着较为明显的缺点:特征工程需要耗费太多精力。模型是强行记住这些组合特征的,对于未曾出现过的特征组合,权重系数为0,无法进行泛化。为了加强模型的泛化能力,研究者引入了DNN结构,将高维稀疏特征编码为低维稠密的Embedding vector,这种基于Embedding的方式能够有效提高模型的泛化能力。但是,基于Embeddi原创 2021-03-18 22:11:10 · 209 阅读 · 0 评论 -
Task01 DeepCrossing_深度推荐模型
1、概述这个模型就是一个真正的把深度学习架构应用于推荐系统中的模型了, 2016年由微软提出, 完整的解决了特征工程、稀疏向量稠密化, 多层神经网络进行优化目标拟合等一系列深度学习再推荐系统的应用问题。 这个模型涉及到的技术比较基础,在传统神经网络的基础上加入了embedding,残差连接等思想,且结构比较简单,对初学者复现和学习都比较友好。DeepCrossing模型应用场景是微软搜索引擎Bing中的搜索广告推荐, 用户在输入搜索词之后, 搜索引擎除了返回相关结果, 还返回与搜索词相关的广告,Deep原创 2021-03-17 00:44:47 · 102 阅读 · 0 评论 -
Task01赛题理解_零心跳信号分类预测
1、赛题理解1.1 赛题背景本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事 —— 心跳信号分类预测。赛题以心电图心跳信号数据为背景,要求选手根据心电图感应数据预测心跳信号所属类别,其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例,这是一个多分类的问题。通过这道赛题来引导大家了解医疗大数据的应用,帮助竞赛新人进行自我练习、自我提高。比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introducti原创 2021-03-15 00:31:19 · 290 阅读 · 0 评论