- 博客(15)
- 资源 (8)
- 问答 (1)
- 收藏
- 关注
原创 深度学习推荐模型-DIN
深度学习推荐模型-DIN本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆DIN介绍Deep Interest Network(DIN)是盖坤大神领导的阿里妈妈的精准定向检索及基础算法团队,在2017年6月提出的。它针对电子商务领域(e-commerce industry)的CTR预估,重点在
2021-03-27 20:48:16 734
原创 深度学习推荐模型-NFM
深度学习推荐模型-NFM本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆
2021-03-25 00:16:58 652
原创 深度学习推荐模型-DeepFM
深度学习推荐模型-DeepFM本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆
2021-03-21 17:54:49 675
原创 深度学习推荐模型-Wide&Deep
本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆Wide & Deep介绍Wide & Deep ModelMemorization:之前大规模稀疏输入的处理是:通过线性模型 + 特征交叉。所带来的Memorization以及记忆能力非常有效和可解释。但是Generalizat.
2021-03-18 20:31:48 435
原创 大数据常见运维问题汇总
大数据常见运维问题汇总其他安装问题:1.IDEA安装与配置https://blog.csdn.net/qq_27093465/article/details/774491172.IntelliJ IDEA 修改maven为阿里云仓库https://blog.csdn.net/u013541411/article/details/1001667123.Mysql安装:https://blog.csdn.net/qq_36582604/article/details/80526287
2021-03-16 20:05:56 1811 1
原创 深度学习推荐模型-DeepCrossing
深度学习推荐模型-DeepCrossing背景特征工程是绕不开的话题,巧妙的特征组合也许能够为模型带来质的提升。但同时,特征工程耗费的资源也是相当可观的,对于后期模型特征的维护、模型线上部署不太友好。2016年,微软提出Deep Crossing模型,旨在解决特征工程中特征组合的难题,降低人力特征组合的时间开销,通过模型自动学习特征的组合方式,也能达到不错的效果,且在各种任务中表现出较好的稳定性。与之前介绍的FNN、PNN不同的是,Deep Crossing并没有采用显式交叉特征的方式,而是利用
2021-03-16 10:58:41 713
原创 情感分析-SnowNLP
情感分析SnowNLP SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。安装pip install snownlp主要用法# 导入SnowNLP.
2021-03-13 14:33:56 808
转载 机器学习-决策树(XGBoost、LightGBM)
【机器学习】决策树——XGBoost、LightGBM主要介绍基于 Boosting 框架的主流集成算法,包括 XGBoost 和 LightGBM。1. XGBoostXGBoost 是大规模并行 boosting tree 的工具,它是目前最快最好的开源 boosting tree 工具包,比常见的工具包快 10 倍以上。Xgboost 和 GBDT 两者都是 boosting 方法,除了工程实现、解决问题上的一些差异外,最大的不同就是目标函数的定义。故本文将从数学原理和工程实现上...
2021-03-12 10:56:56 1965
原创 leetcode笔记(Python版)待更新
1.反转链表:class Solution:# 返回ListNodedef ReverseList(self, pHead):# write code hereif pHead == None or pHead.next == None:#若链表为空或只有一个数就直接返回0return pHeadpre = None#定义一个空链表while pHead:...
2021-03-09 12:30:44 241 1
原创 TF-IDF算法
一. 什么是TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。上述引用总结就是, 一个词语在一篇文章中出现次数越多, 同时在所有文档中出现次数越少, 越能够代表该文章.这也就是
2021-03-08 16:14:16 1325
原创 Pandas学习导图
Pandas在线学习网站(强烈推荐):http://joyfulpandas.datawhale.club/Content/ch1.htmlPandas学习导图
2021-03-04 21:52:22 168 1
转载 机器学习-逻辑回归
机器学习-逻辑回归(非常详细)1. 模型介绍Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 因其简单、可并行化、可解释强深受工业界喜爱。Logistic 回归的本质是:假设数据服从这个分布,然后使用极大似然估计做参数的估计。1.1 Logistic 分布Logistic 分布是一种连续型的概率分布,其分布函数和密度函数分别为:其中,表示位置参数,为形状参数。我们可以看下其图像特征:...
2021-03-04 12:23:10 565 1
原创 机器学习-决策树(ID3、C4.5、CART)
机器学习-决策树(上)——ID3、C4.5、CART决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。对于基本树我将大致从以下四个方面介绍每一个算法:思想、划分标准、剪枝策略,优缺点。1. ID3ID3 算法是建立在奥卡姆剃刀(用较少的东西,同样可以做好事情)的基础上:越是小型的决策树越优于大的决策树。1.1 思想从信息论的知识中我们知道:信息熵越大,从而样本纯度越低,。ID3 算法的核心思想就是以信息增益来度量特征选择,选择信息
2021-03-02 23:25:13 558
原创 大数据开发笔记(九):Flink综合学习
Flink基础Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务:
2021-03-01 13:22:50 2548
原创 大数据开发笔记(九):Flink基础
Flink: 分布式、高性能框架,支持实时模式和批处理模式一、Apache Flink作为一款高吞吐量、低延迟的针对流数据和批数据的分布式实时处理引擎和Storm/Spark Streaming一样,定位于流式处理系统区别:– Storm:速度快,低延迟,吞吐能力低,无法保证精确一致性,必须..
2021-03-01 13:19:29 1618 1
Typora 1.4.8免费版
2023-02-06
数据标注工具Labelme中文版
2023-01-31
深度学习OCR论文方法总结
2023-01-14
ML Visuals.pptx
2023-01-01
python自动化办公手册.pdf
2022-01-09
大数据学习书签.html
2021-02-08
大数据电影可视化项目.rar
2020-09-03
python两列数据以相同第一列合并问题
2022-08-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人