- 博客(9)
- 收藏
- 关注
原创 Spark使用Libsvm格式数据构造LabeledPoint格错误:requirement failed:Index 2287 out of bounds for vector of size 27
背景使用libsvm格式的数据构造LabeledPoint格式,例如我的libsvm格式数据如下(索引下标最大值为,3000):790718 1:1 2:1 4:1 5:1 6:1 7:1 9:1 11:1 13:1 16:1 19:1 21:1 28:1 31:1 43:1 64:1 65:1 140:1 164:1 184:1 296:1 463:1 481:1 642:1 813:1 1...
2019-11-29 10:29:22 1530
原创 NLP实战之基于TFIDF的文本相似度计算
TFIDF算法介绍TF-IDF(Term Frequency–InverseDocument Frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF-IDF实际是TF*IDF,其中TF(Term Frequency)表示词条tt...
2019-11-27 20:14:01 4155
原创 常见的五种神经网络(4)-深度信念网络(上)篇之玻尔兹曼机和受限玻尔兹曼机
引言常见的五种神经网络系列第三篇,主要介绍深度信念网络。内容分为上下两篇进行介绍,本文主要是深度信念网络(上)篇,主要介绍以下内容:背景玻尔兹曼机受限玻尔兹曼机该系列的其他文章:常见的五种神经网络(1)-前馈神经网络常见的五种神经网络(2)-卷积神经网络常见的五种神经网络(3)-循环神经网络(上篇)常见的五种神经网络(3)-循环神经网络(中篇)常见的五种神经网络(3)-循...
2019-11-26 14:32:04 7731 3
原创 美团点评技术与算法文章汇总,设计算法、前后端、客户端、小程序等
这是一份福利贴,先看内容,再看获取方式。算法文章汇总目录:美团“猜你喜欢”深度学习排序模型实践美团大脑:知识图片的建模方法及其应用深度学习在美团搜索广告排序的应用实践美团深度学习系统的工程实践美团餐饮娱乐知识图谱——美团大脑揭秘美团在O2O场景下的广告营销美团外卖骑手背后的AI技术基于TensorFlow Serving的深度学习在线评估强化学习在美团“猜你喜欢的实践”深度...
2019-11-18 20:28:25 2382
原创 机器学习中非常有名的理论或定理你知道几个?
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io在机器学习中,有一些非常有名的理论或定理,对理解机器学习的内在特性非常有帮助。PCA学...
2019-11-16 22:30:20 4470 6
原创 TensorFlow的逻辑回归实现
打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer 逻辑回归我们都知道是用来进行二分类处理的,里边经常用到的阶跃函数是海维塞得阶跃函数(Sig...
2019-11-13 23:22:39 1333
原创 模型的独立学习方式
本篇文章主要介绍一些“模型独立的学习方式”,比如:集成学习、协同学习、自学习、多任务学习、迁移学习、终身学习、小样本学习、元学习等。
2019-11-12 20:53:23 1829
原创 【论文】文本相似度计算方法综述
概述在信息爆炸时代,人们迫切希望从海量信息中获取与自身需要和兴趣吻合度高的内容,为了满足此需求,出现了多种技术,如:搜索引擎、推荐系统、问答系统、文档分类与聚类、文献查重等,而这些应用场景的关键技术之一就是文本相似度计算技术。因此了解文本相似度的计算方法是很有必要的。文本相似度定义文本相似度在不同领域被广泛讨论,由于应用场景不同,其内涵有所差异,故没有统一、公认的定义。Lin从信息论的角度...
2019-11-07 15:55:25 6983 4
原创 无监督学习中的无监督特征学习、聚类和密度估计
无监督学习(Unsupervised Learning)是指从无标签的数据中学习出一些有用的模式,无监督学习一般直接从原始数据进行学习,不借助人工标签和反馈等信息。典型的无监督学习问题可以分为以下几类:无监督特征学习、密度估计、聚类。
2019-11-05 10:58:36 5523
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人