个性化推荐与检索
文章平均质量分 77
悟乙己
心如花木,皆向阳而生!
展开
-
[转载] CTR预估中的贝叶斯平滑方法
参考:CTR预估中的贝叶斯平滑方法(一)原理及实验介绍、贝叶斯平滑文章目录竞价模式:遇到的困难:假设数据的连续性数据层级结构的贝叶斯平滑方法代码实现贝叶斯平滑方法参数估计和代码实现竞价模式:对于在线广告,主要有以下几种竞价模式:1)pay-per-impression(按展示付费):广告商按照广告被展示的次数付费,这是一种最普遍的竞价模型。缺点在于没有考虑投放广告的效果。2)pay-per-action(按行为付费):只有在广告产生了销售或者类似的一些转化时,广告商才付费。缺点在于追踪用户的交转载 2021-03-17 17:19:12 · 594 阅读 · 0 评论 -
相似性︱python+opencv实现pHash算法+hamming距离(simhash)(三)
pHash跟simhash很多相近的地方。一个是较多用于图像,一个较多用于文本。一、pHash跟simhash1、simhash可参考:Python基础教程-python实现simhash算法实例详细介绍 Simhash的算法简单的来说就是,从海量文本中快速搜索和已知simhash相差小于k位的simhash集合,这里每个文本都可以用一个simhash值来代表,一个simhash有64bit,相似原创 2017-04-20 19:03:05 · 22640 阅读 · 7 评论 -
LSH︱python实现局部敏感随机投影森林——LSHForest/sklearn(一)
关于局部敏感哈希算法,之前用R语言实现过,但是由于在R中效能太低,于是放弃用LSH来做相似性检索。学了python发现很多模块都能实现,而且通过随机投影森林让查询数据更快,觉得可以试试大规模应用在数据相似性检索+去重的场景。 私认为,文本的相似性可以分为两类:一类是机械相似性;一类是语义相似性。 机械相似性代表着,两个文本内容上的相关程度,比如“你好吗”和“你好”的相似性,纯粹原创 2017-04-19 18:58:51 · 14767 阅读 · 3 评论 -
Recorder︱图像特征检测及提取算法、基本属性、匹配方法
在做图像的研究,发现对图像本质、内核以及可以提取的特征方式一点儿都不懂,赶紧补补课。.一、图像常用属性本节指的是一般来说,图像处理的一些角度,也是根据一些美图软件最为关注的一些图像属性:基本属性:图像亮度,对比度,色彩饱和度,清晰度(锐度)色阶:曝光、高光、阴影颜色:色温、色调 .1、图像亮度来源于:OpenCV改变图像或视频的亮度 改变亮度是在每个像素上的点操作。如果想提高亮度,必须原创 2017-03-17 17:32:32 · 24050 阅读 · 0 评论 -
IQA+不懂︱图像清洗:图像质量评估(评估指标、传统检测方法)
深度学习技术如火如荼,但是训练的图像集都是标注好、质量高的,那么笔者对如何进行图像清洗表示好奇。难道只有让工人肉眼看吗?一些传统的IQA都是基于图像本身质量去评价,那么我想知道,之外的图像信息质量该如何评估?现在还不知道除了肉眼之外的好办法,只能先来列举一下传统IQA的一些评估指标: .1、MOS、DMOS图像质量评价可以分为主观评价方法和客观评价方法, 主观评价由观察者对图像质量进行主观评分原创 2017-03-10 12:19:30 · 17672 阅读 · 2 评论 -
实例检索︱图像的实例搜索(文献、方法描述、商业案例)
笔者在这几天看了一些关于图像特征化的内容,发现图像相似性搜索领域,一般先图像特征量化,然后进行相应的匹配。 1、方向一:描述符。先抽取图像局部特征符,根据一些匹配算法进行匹对,较多适合在图像比对,人脸比对等领域; 2、方向二:描述符的特征。先抽取图像局部特征符,描述符堆砌然后降维下来,成为拥有全局信息的图像特征向量,适合形成图指纹; 3、方向三:颜色特征。使用直方图,后计算两原创 2017-03-18 22:16:27 · 18403 阅读 · 1 评论 -
python︱imagehash中的四种图像哈希方式(phash/ahash/dhash/小波hash)
code来源:https://github.com/JohannesBuchner/imagehash 外文原文:https://fullstackml.com/wavelet-image-hash-in-python-3504fdd282b5可以直接pip:pip install imagehash1 perception hashing感知哈希,不同于aHash,...原创 2017-11-20 14:36:58 · 27899 阅读 · 5 评论 -
ltp︱基于ltp的无监督信息抽取模块(事件抽取/评论观点抽取)
无监督信息抽取较多都是使用哈工大的ltp作为底层框架。那么基于ltp其实有了非常多的小伙伴进行了尝试,笔者私自将其归纳为:事件抽取(三元组)观点抽取“语言云” 以哈工大社会计算与信息检索研究中心研发的 “语言技术平台(LTP)” 为基础,为用户提供高效精准的中文自然语言处理云服务。pyltp 是 LTP 的 Python 封装,提供了分词,词性标注,命名实体识别,依存句法分析,语义角色...原创 2018-09-19 10:57:44 · 10013 阅读 · 10 评论