- 博客(8)
- 资源 (6)
- 收藏
- 关注
转载 词向量模型(word2vec) 详解
转载:https://blog.csdn.net/peghoty/article/details/37969519 word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没...
2019-01-16 12:49:28 9370 3
转载 leetcode169.求众数--摩尔投票法
摩尔投票法 提问: 给定一个int型数组,找出该数组中出现次数最多的int值。 解决方案: 遍历该数组,统计每个int值出现次数,再遍历该集合,取出出现次数最大的int值。 这算是一个比较经典的解决办法,其中可能会用到Map来做统计。如果不使用Map,则时间复杂度会超过线性复杂度。除此之外,也没有什么特别好的...
2018-12-25 18:39:07 271
原创 LTP与jieba词性标注对比
词性标注对比¶LTP 使用的是863词性标注集,其各个词性含义如下表。TagDescriptionExampleTagDescriptionExampleaadjective美丽niorganization name保险公司bother noun-modifier大型, 西式nllocation noun城郊cconjunc...
2018-12-12 16:11:46 2665 3
转载 标签传播算法(Label Propagation)及Python实现
转:https://blog.csdn.net/zouxy09/article/details/49105265#commentBox 标签传播算法(Label Propagation)及Python实现 众所周知,机器学习可以大体分为三大类:监督学习、非监督学习和半监督学习。监督学习可以认为是我们有非常多的labeled标注数据来...
2018-12-07 11:43:06 1208
转载 GBDT与XGBoost的区别
转:https://blog.csdn.net/jackmcgradylee/article/details/77778001一、基本概念GBDT(又称Gradient Boosted Decision Tree/Grdient Boosted Regression Tree),是一种迭代的决策树算法,该算法由多个决策树组成。它最早见于yahoo,后被广泛应用在搜索排序、点击率预估上。xgb...
2018-12-05 11:13:56 457
转载 使用SimHash进行海量文本去重
[Algorithm] 使用SimHash进行海量文本去重 转载:http://www.cnblogs.com/maybe2030/ 阅读目录1. SimHash与传统hash函数的区别2. SimHash算法思想3. SimHash流程实现4. SimHash签名距离计算5. SimHash存储和索引6. SimHash存储和索引7. 参考内容 在之前...
2018-11-29 10:46:31 633
转载 机器学习基础--模型评价指标
转载:https://blog.csdn.net/quiet_girl/article/details/70830796以下第一部分内容转载自:机器学习算法中的准确率(Precision)、召回率(Recall)、F值(F-Measure)是怎么一回事摘要:数据挖...
2018-09-10 09:35:23 445
转载 使用sklearn和TensorFlow进行机器学习--第三章 分类
【转载】:https://blog.csdn.net/haoronge9921/article/details/81047681MNIST 在本章当中,我们将会使用 MNIST 这个数据集,它有着 70000 张规格较小的手写数字图片,由美国的高中生和美国人口调查局的职员手写而成。这相当于机器学习当中的“Hello ...
2018-07-21 23:07:29 1854
卡尔曼滤波—以自由落体为例
2017-12-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人