信息检索
stay_foolish12
本科统计学,研究生计算机应用技术。可以【接 】大学计算机课程设计、课程大作业,C++\C\JAVA\汇编\Golang\PHP等相关语言,MySQL\SQLServer等数据库,Linux操作系统,人工智能、数据挖掘、数据分析、自然语言处理等相关课程均可
展开
-
web of science,SSCI索引,带你入门!
第一步;选择数据库,一般选择web of science 核心文集第二步:在更多设置中选择web of science第三步:点击被引频次后面的数字第四部:点击查看其他的被引频次计数根据自己引用的选择次数注意事项:web of science 的最后结果还需要人工审核,校验的过程,具体过程图书馆知道。换句话说,就是会出现结果为0次,但真实情况是有人引用这个文章,但可能由于格式...原创 2019-03-30 13:48:26 · 11633 阅读 · 0 评论 -
支持向量机通俗导论(理解SVM的三层境界)
支持向量机通俗导论(理解SVM的三层境界)作者:July 。致谢:pluskid、白石、JerryLead。说明:本文最初写于2012年6月,而后不断反反复复修改&优化,修改次数达上百次,最后修改...转载 2019-04-22 15:09:23 · 2434 阅读 · 0 评论 -
从贪心选择到探索决策:基于强化学习的多样性排序
本文主要介绍发表在SIGIR'2018上的论文From Greedy Selection to Exploratory Decision-Making: Diverse Ranking with Policy-Value Networkswww.bigdatalab.ac.cn这篇论文利用强化学习来解决多样性排序问题,整体思路和AlphaGo类似。Motivation在信息检索领域一个重要的目标...转载 2019-04-18 18:09:15 · 1718 阅读 · 0 评论 -
]搜索引擎的文档相关性计算和检索模型(BM25/TF-IDF)
搜索引擎的检索模型-查询与文档的相关度计算1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度。实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况。这里我们主要总结网页内容和用户查询相关的内容。 &n...转载 2019-04-19 08:09:37 · 7985 阅读 · 0 评论 -
学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点
Ranking 是信息检索领域的基本问题,也是搜索引擎背后的重要组成模块。本文将对结合机器学习的 ranking 技术——learning2rank——做个系统整理,包括 pointwise、pairwise、listwise 三大类型,它们的经典模型,解决了什么问题,仍存在什么缺陷。关于一些扩展话题和具体应用,可能会在下一篇文章介绍,包括在 QA 领域的实践情况。本文主要参考刘铁岩老师的《Le...转载 2019-05-27 20:28:19 · 5293 阅读 · 3 评论 -
TensorFlow 全网最全学习资料汇总之TensorFlow的技术应用
谷歌于2015年11月发布了全新人工智能系统TensorFlow。该系统可被用于语音识别或照片识别等多项机器深度学习领域,主要针对2011年开发的深度学习基础架构DistBelief进行了各方面的改进,它可在小到一部智能手机、大到数千台数据中心服务器的各种设备上运行。那么为什么会产生TensorFlow系统,以及谷歌为何将其开源?这个问题可以看雷锋网文章《Google开源TensorFlow...转载 2019-06-05 15:14:40 · 1268 阅读 · 0 评论 -
一点关于cloze-style问题的简谈
一个小任务:给出一个问题和诺干个候选句子,从候选句子中选出答案,有没有好的实现方案?一个小任务:类似于:“中国最大的内陆湖是哪个?”给出候选句子1.”中国最大的内陆湖,就是青海湖”2.“青海湖在中国内陆湖中最大的”等等 这种句子 然后根据句子找出答案 请问有什么实现的方案吗?写了个答案,算是个科普向的,搬运到专栏1 从“是什么”说起这个问答属于传统的question-answer问题,比如例子上...转载 2019-06-07 10:37:17 · 858 阅读 · 0 评论 -
Learning to rank基本算法小结
Learning to rank基本算法小结最近工作中需要调研一下搜索排序相关的方法,这里写一篇水文,总结一下几天下来的调研成果。包括Learning to rank 基本方法Learning to rank 指标介绍LambdaMART 模型原理FTRL 模型原理Learning to rank排序学习是推荐、搜索、广告的核心方法。排序结果的好坏很大程度影响用户体验、广告收入等。排序学习可以理解...转载 2019-07-05 16:31:42 · 478 阅读 · 0 评论 -
理解 Word Embedding,全面拥抱 ELMO
理解 Word Embedding,全面拥抱 ELMO DataFun社区 阅读数:4238 2019 年 6 月 15 日 提到 Word Embedding ,如果你的脑海里面冒出来的是 Word2Vec ,Glove ,Fasttext 等。那我猜你有 80% 的概率是从事和 NLP 相关的工作或者至少是一个算法爱好者 ( 这貌似是一个真命题,哈哈 ) 。其实简单来说 Word E...转载 2019-07-06 19:02:32 · 1252 阅读 · 0 评论 -
率的多重比较方法总结-Bonferroni法、杜养志法、bootstrap等方法
http://www.doc88.com/p-7708000529199.html原创 2019-04-17 09:13:21 · 3937 阅读 · 0 评论 -
偏差-方差全面解释
偏差(Bias)与方差(Variance)目录:为什么会有偏差和方差?偏差、方差、噪声是什么?泛化误差、偏差和方差的关系?用图形解释偏差和方差。偏差、方差窘境。偏差、方差与过拟合、欠拟合的关系?偏差、方差与模型复杂度的关系?偏差、方差与bagging、boosting的关系?偏差、方差和K折交叉验证的关系?如何解决偏差、方差问题?1. 为什么会有偏差和方差?对学习算法除了通过实验估计其泛化性能之外...转载 2019-04-13 21:56:42 · 14739 阅读 · 4 评论 -
手把手教你-如何查询中文期刊是否属于核心期刊!
1.进入图书馆、点击数据库检索、在输入cscd中国科学引文数据库(Chinese Science Citation Database,简称CSCD)23456点击详细信息进入下面的页面,可判断文档是否属于核心期刊!...原创 2019-03-30 13:53:35 · 24073 阅读 · 2 评论 -
十分钟搞定特征值和特征向量
如果把矩阵看作是运动,那么特征值就是运动的速度,特征向量就是运动的方向https://mp.weixin.qq.com/s/mZ4AeCcoU0LhWRWfa9_kvw原创 2019-03-30 16:18:33 · 1776 阅读 · 2 评论 -
聚类算法当中的K-means算法如何去做天猫淘宝的推广任务
5 人赞同了该回答figure data-size="normal"> data-size="normal">这个入口是全网人气新品池,我们今天所获取到的数据都是来源于这里。无论是C店还是B店,统统都有机会进来。这个平台最有价值的数据,就是可以告诉我们自己的新品究竟算是什么品质的,俗称档次,如图所示不同档位的产品,,平台的推荐力度不同,并且这里是达人们经常选品的地方,如果能进来这里,实...转载 2019-04-05 15:42:46 · 1521 阅读 · 0 评论 -
研究生常用的几种风险评估方法-专家调查法、蒙特卡洛模拟法、计划评审技术、敏感性分析法、决策树法、影响图法、模糊综合评价方法
其实风险评估就是在充分掌握资料的基础之上,采用合适的方法对已识别风险进行系统分析和研究,评估风险发生的可能性(概率)、造成损失的范围和严重程度(强度),为接下来选择适当的风险处理方法提供依据。今天老徐给大家介绍介绍常用的一些风险评估方法。一、专家调查法在风险识别的基础之上,请专家对风险因素的发生概率和影响程度进行评价,再综合整体风险水平进行评价。老徐认为这类方法简单易行,但是大家在分析的时候最...原创 2019-04-11 10:46:10 · 23734 阅读 · 1 评论 -
百度作业帮-产品分析
一、商业模式分析1.1、问答时期(2014年2月-2015年1月)商业模式之作业帮V1.0.png两点值得注意:作业帮的出现有明显的历史原因,即由百度知道团队出品,因此切入K12教育初期,采取的是之前的问答模式;作业帮初期属于流量累积期间,并未有明显的盈利模式;1.2、搜题时期(2015年1月-8月)商业模式之...转载 2019-04-11 18:19:05 · 5510 阅读 · 0 评论 -
从特征分解到协方差矩阵:详细剖析和实现PCA算法
从特征分解到协方差矩阵:详细剖析和实现PCA算法本文先简要明了地介绍了特征向量和其与矩阵的关系,然后再以其为基础解释协方差矩阵和主成分分析法的基本概念,最后我们结合协方差矩阵和主成分分析法实现数据降维。本文不仅仅是从理论上阐述各种重要概念,同时最后还一步步使用 Python 实现数据降维。首先本文的特征向量是数学概念上的特征向量,并不是指由输入特征值所组成的向量。数学上,线性变换的特征向量是一个非...转载 2019-04-12 10:52:20 · 897 阅读 · 0 评论 -
论文 | 信息检索结果Ranking的评价指标《RankDCG: Rank-Ordering Evaluation Measure》
未经允许,不得转载,谢谢~~一 文章简介为什么要提出这个新的评价算法?我们都知道ranking过程对于信息检索的结果是非常重要的,那么我们就需要有一些算法能评价ranking的结果到底如何。现有用来评价ranking的常用算法有:Kendall's τ, Average Precision(AP) , Mean Average Precision(MAP),...转载 2019-04-16 15:42:52 · 1154 阅读 · 0 评论 -
信息检索IR评价中常见的评价指标-MAP\NDCG\ERR\P@10等
信息检索评价是对信息检索系统性能(主要满足用户信息需求的能力)进行评估的活动。通过评估可以评价不同技术的优劣,不同因素对系统的影响,从而促进本领域研究水平的不断提高。信息检索系统的目标是较少消耗情况下尽快、全面返回准确的结果。IR的评价指标,通常分为三个方面:(1)效率(Efficiency)—可以采用通常的评价方法:时间开销、空间开销、响应速度。(2)效果(Effectiveness):返...转载 2019-04-16 15:58:08 · 7099 阅读 · 1 评论 -
深度学习在用户画像标签模型中的应用
最近一段时间都在学习深度学习,想着在用户画像标签模型中看能不能用上,终于,用了一个多月的时间,结合实际的场景和数据,搭建...转载 2019-07-18 14:57:05 · 1023 阅读 · 1 评论