- 博客(9)
- 资源 (19)
- 收藏
- 关注
转载 模型融合—— stacking详细讲解
“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。”stacking的过程有一张图非常经典,如下:虽然他很直观,但是没有语言描述确实很难搞懂。上半部分是用一个基础模型进行5折交叉验证,如:用XGBoost作为基础模型Model1,5折交叉验证就是先拿出四折作...
2018-07-31 14:42:59 52268 15
转载 xgboost相比传统gbdt有何不同?xgboost为什么快?如何支持并行?
传统GBDT以CART作为基分类器,xgboost还支持线性分类器,这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归(分类问题)或者线性回归(回归问题)。传统GBDT在优化时只用到一阶导数信息,xgboost则对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶导数。顺便提一下,xgboost工具支持自定义代价函数,只要函数可一阶和二阶求导。xgboost在代价函数里加入了正则项,用于...
2018-07-30 21:29:01 2280
转载 jieba 详细介绍
原文:https://github.com/fxsjy/jiebajieba"结巴"中文分词:做最好的Python中文分词组件 "Jieba" Feature 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模...
2018-07-27 10:54:04 14487 1
转载 Adaboost入门教程——最通俗易懂的原理介绍
原文 https://blog.csdn.net/px_528/article/details/72963977说到Adaboost,公式与代码网上到处都有,《统计学习方法》里面有详细的公式原理,Github上面有很多实例,那么为什么还要写这篇文章呢?希望从一种更容易理解的角度,来为大家呈现Adaboost算法的很多关键的细节。本文中暂时没有讨论其数学公式,一些基本公式可以参考《统计学习方...
2018-07-25 09:33:26 1178 1
转载 特征提取方法: one-hot 和 TF-IDF
转载:https://www.cnblogs.com/lianyingteng/p/7755545.html推荐阅读:https://blog.csdn.net/lanhaier0591/article/details/78702558https://blog.csdn.net/bitcarmanlee/article/details/51472816one-hot 和 TF-IDF是...
2018-07-18 00:21:21 1958
原创 Word2vec简介,入门
word2vec构建的过程: https://www.cnblogs.com/Newsteinwell/p/6034747.htmlhttps://blog.csdn.net/zhaoxinfan/article/details/11069485Word2vec,是用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输...
2018-07-15 17:32:07 15767
原创 论文阅读:基于用户上网数据的电影个性化推荐系统研究
基于用户上网数据的电影个性化推荐系统研究赵鹏程,黄韬**(北京邮电大学信工程学院,北京 100876) 摘要:本文讲述了如何构建出完整电影知识图谱的方法,同时提出了一套发掘电影系列的实现算法。基础数据为用户的上网请求,在不需要用户参与的情况下获得用户的电影兴趣行为,从中提取出与电影相关的上网数据,然后根据电影知识图谱将用户上网行为一一映射为用户兴趣行为,达到提取用户兴趣的目的。基于...
2018-07-15 15:13:58 19195 3
原创 论文阅读:知识图谱技术综述
知识图谱技术综述徐增林1,盛泳潘1,贺丽荣1,王雅芳2 目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。尤其是在智能搜索中,用户的搜索请求不再局限于简单的关键词匹配, 搜索将根据用户查询的情境与意图进行推理,实现概念检索。与此同时,用户的搜索结果将具有层次化、结构化等重要特征。例如,用户搜索的关键词为梵高,引擎就会以知识卡片的形式给出梵高的...
2018-07-13 09:09:30 2115
原创 论文阅读:知识图谱的推荐系统综述
知识图谱的推荐系统综述常亮,张伟涛,古天龙,孙文平,宾辰忠(桂林电子科技大学广西可信软件重点实验室, 广西 桂林 541004) 摘要:搜索引擎和推荐系统是解决信息过载的代表技术。传统的搜索引擎在本质上来讲是帮助用户过滤和筛选信息,这种方式满足了大多数 人的需求,但没有提供个性化的服务。相对于传统搜索引擎来说,推荐系统可以兼顾个性化需求和解决信息过载问题。推荐系统是信息过滤系统的一个 子集,目的在...
2018-07-06 15:31:21 10226
Mushroom Classification--xgboost训练数据
2018-03-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人