自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 问答 (1)
  • 收藏
  • 关注

转载 GBDT+LR simple例子

# 弱分类器的数目n_estimator = 10# 随机生成分类数据。X, y = make_classification(n_samples=80000) # 切分为测试集和训练集,比例0.5X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5)# 将训练集切分为两部分,一部分用于训练GB...

2019-04-19 10:28:22 525

转载 意图识别_Query特征提取

【1】背景1、Search_Session:用户与搜索引擎的一次完整的过程。信息包括:Session期间变换了查询词,后续的搜索和点击均会被记录,知道脱了搜索。理解:一个样本即Query和点击的Title【2】的意图识别和传统的文本分类问题区别:1、类别不完全互斥,即多标签。 eg:极品飞车属于游戏、电影类2、样本分布不均衡:一、类别方面不均衡,vidio类别占总比例需求...

2019-04-15 14:08:52 1676 1

转载 solr官方教程

https://www.w3cschool.cn/solr_doc/solr_doc-g1az2fmd.html

2019-03-25 09:58:31 419

转载 美团点评旅游搜索召回策略的演进(转)

美团点评旅游搜索召回策略的演进

2019-03-25 09:55:23 319

转载 推荐系统介绍(转)

当下,个性化推荐成了互联网产品的标配。但是,人们对推荐该如何来做,也就是推荐技术本身,还不甚了解。推荐系统从搜索引擎借鉴了不少技术和思想,比如内容推荐有不少技术就是来自搜索引擎。推荐系统也是现在热门的人工智能分支之一,但凡人工智能类的落地,都需要具备这几个基本元素才行:数据、算法、场景、计算量。推荐系统也不例外,而刚好,现在的时代,这些元素的获得成本相比十年前已经小多了。未来随着各种硬件设备越来越...

2019-03-14 13:23:45 470

转载 Solr集群搭建详细教程(二)

三、solr集群搭建第一步:创建四个tomcat实例。每个tomcat运行在不同的端口。8180、8280、8380、8480上传解压步骤省略,下面是作者解压好的复制tomcat到之前搭建zookeeper集群第四步时,创建的/usr/local/solr-cloud目录里,复制4个去solr-cloud目录,发现已经复制好了4个tomcat目录在tomcat目录下的c...

2019-03-05 10:24:17 1231

转载 Solr服务在Linux上的搭建详细教程

一、系统环境CentOS-6.7-i386-bin-DVD1jdk-8u151-linux-i586apache-tomcat-8.5.24.tarsolr-7.1.0注意:solr6.0以上,官方建议使用jdk8,tomcat8,。和solr4部署历程有略微差别二、搭建步骤第一步:上传并解压solr第二步:上传并解压tomcat,复制一份出来创建sol...

2019-02-27 15:21:23 440

转载 Solr集群搭建详细教程(一)

一、Solr集群的系统架构SolrCloud(solr云)是Solr提供的分布式搜索方案,当你需要大规模、容错、分布式索引和检索能力时使用SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发要求很高,这时需要使用SolrCloud来满足这些需求。SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用...

2019-02-26 15:44:12 9827

转载 搜索引擎选择:Elasticsearch与Solr

搜索引擎选型调研文档Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎Apache Lucene基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架...

2019-02-19 14:13:46 160

转载 NPE问题

http://www.cnblogs.com/dragonsuc/p/6937584.html防止NPE(),是程序员的基本修养,注意NPE产生的场景:1) 返回类型为基本数据类型,return包装数据类型的对象时,自动拆箱有可能产生NPE。反例: public int f(){             return Integer 对象                 }...

2019-02-18 19:51:36 3404

转载 OKR工作法

一、序1、目标通过本书的学习了解OKR工作法的基本原理和实施原则。2、实施中遇到的问题制定目标和关键成果过程中会存在困惑;在执行过程中,会受到业务压力影响,变得焦虑;早期目标设定过低或则过高,含糊不清,都是正常现象,需要慢慢修正。3、OKR前身目标管理法MBO-HP,包括两个原则:实施方法1).不要告诉下属怎么做,只要告诉他们你要什么,他们就会给你一个满意的结果...

2019-02-01 15:50:23 5103

转载 Leveinshtein距离

一、定义编辑距离又称Leveinshtein距离。编辑距离是计算两个文本相似的算法之一。 二、常用场景编辑距离是基于文本自身去计算,没办法深入到语义层面,可以胜任一些简单的分析场景,例如拼写检查、抄袭侦测、算法在数据聚合时会有一定的运用。...

2019-01-23 11:45:52 235

原创 网络营销中常见术语

PV:Page View 流量UV:独立访客,一台电脑24小时以内访问N次计为1次ADPV:Advertisement Page View载有广告的pageview流量ADimp:ADimpression单个广告的展示次数PV单价:每PV的收入,衡量页面流量变现能力的指标RPS:Revenue Per Search每搜索产生的收入,衡量搜索结果变现能力的指标GMV:Gros...

2019-01-18 13:36:59 1260

转载 搜索下拉框的算法和实践

转载吴海波同学https://zhuanlan.zhihu.com/p/36636525搜索下拉框也叫搜索提示,搜索下拉推荐,QAC(Query autocompletion),Query suggestion。本质上是指搜索引擎系统根据用户当前的输入,自动提供一个query候选列表供用户选择,这些推荐query一般从query log中挖掘出大量的候选query,并且保持前缀相同,然后依据某...

2019-01-14 20:20:20 1277

原创 搜索算法相关性评价指标

累计增益(CG)是DCG的前身,只考虑到了相关性的关联程度,没有考虑到位置的因素。它是一个搜索结果相关性分数的总和。置顶位置p上的CG为:CGp=∑i=1preliCG_p = \sum^{p} _{i=1}rel_iCGp​=i=1∑p​reli​relirel_ireli​代表i这个位置上的相关度。eg:搜索“篮球”结果,最理想的结果是:B1、B2、B3。而出现的结果是B3、B1、B2...

2019-01-11 13:01:44 3715

转载 图像的上采样(upsampling)与下采样(subsampled)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/stf1065716904/article/details/78450997 </div> <link rel="stylesh...

2019-01-10 16:05:41 2626

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除