- 博客(8)
- 资源 (19)
- 收藏
- 关注
原创 Spark排序算法系列之(MLLib、ML)GBTs使用方式介绍(模型训练、保存、加载、预测)
前言【Spark排序算法系列】主要介绍的是目前推荐系统或者广告点击方面用的比较广的几种算法,和他们在Spark中的应用实现,本篇文章主要介绍GBDT算法,本系列还包括(持续更新): Spark排序算法系列之LR(逻辑回归) Spark排序算法系列之模型融合(GBDT+LR) Spark排序算法系列之XGBoost Spark排序算法系列之FTRL(Follo...
2019-01-29 21:16:35 3726 4
原创 资源分享:从数理统计到DL、RL,还不快来!
之前在自己的年度总结里写到:19年的目标就是技术沉淀与突破。技术突破不仅包含现有技术的总结和反思,更是对未知技术的探索和求知,希望19年能够更上一层楼。这个repo是我一直维护和整理的一个技术资料分享的repo,是我包括群友一块整理的一个免费技术资料分享的库,不仅包含了机器学习,数据挖掘,深度学习,还包含了大数据,数理统计,强化学习等,希望在技术这条路上你能跑的更快。repo:http...
2019-01-28 03:16:19 2167
原创 多分类实现方式介绍和在Spark上实现多分类逻辑回归(Multinomial Logistic Regression)
背景在之前的文章中介绍了多分类逻辑回归算法的数据原理,参考文章链接CSDN文章链接:https://blog.csdn.net/Gamer_gyt/article/details/85209496 公众号:多分类逻辑回归(Multinomial Logistic Regression)该篇文章介绍一下Spark中多分类算法,主要包括的技术点如下多分类实现方式 一对一 (One V...
2019-01-12 22:06:02 3901 5
原创 Hive Join 分析和优化
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer背景Sku对应品牌进行关联,大表对应非大表(这里的非大表并不能用小表来定义)问题分析进行表左关联时,最后一个reduce任务卡到99%,运行时间很长,发生了...
2019-01-03 13:34:48 1896
原创 基于TF-IDF算法的短标题关键词提取
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer扫一扫 关注微信公众号!号主 专注于搜索和推荐系统,尝试使用算法去更好的服务于用户,包括但不局限于机器学习,深度学习,强化学习,自然语言理解,知识图谱,还不定时分享技术,...
2019-01-03 13:27:48 5281 6
原创 TensorFlow 特征工程: feature_column
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer特征工程: feature_column在使用很多模型的时候,都需要对输入的数据进行必要的特征工程处理。最典型的就是:one-hot处理,还有hash分桶等处理。为...
2019-01-03 13:18:16 4045
原创 有监督学习算法的集成学习(Ensemble Learning)介绍
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表...
2019-01-03 13:14:38 2009
原创 【内附PDF资料】Python实现下载图片并生产PDF文件
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer背景2018AICon大会中的一些PPT,官方没有提供完整的PDF文件,而是一张张图片,不方便下载和后续阅读,这里使用Python爬取相关演讲的图片,并生产PDF文...
2019-01-02 20:28:22 1518
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人