Search Engine
持续努力
努力不辜负每一天. 享受编程和技术带来的快乐!
展开
-
隐私 只是针对熟人之间有意义
陌生人之间没有隐私的意义。 ----计算广告 刘鹏原创 2020-09-26 23:02:52 · 122 阅读 · 0 评论 -
搜索:刘超的博客及《Lucene 原理与代码分析》
https://www.cnblogs.com/forfuture1978/archive/2011/09/10/2172918.html原创 2020-07-05 18:16:39 · 266 阅读 · 0 评论 -
转发 Deep Learning在搜索引擎检索结果排序中的应用
https://yangxudong.github.io/deep-learning-in-search/原创 2020-06-28 00:09:34 · 173 阅读 · 0 评论 -
向量搜索引擎 Milvus
如题原创 2020-05-29 23:02:20 · 690 阅读 · 0 评论 -
世界著名搜索专家
陈沛朱会灿吴军俞军腾讯搜索技术部原创 2020-05-29 19:40:34 · 197 阅读 · 0 评论 -
基于C/C++的搜索引擎库有CLucene, Xapian,Sphinx,应该学习哪一个??
如题原创 2020-05-29 16:13:08 · 562 阅读 · 0 评论 -
repost C++服务端程序员发展方向
https://blog.csdn.net/Varygod/article/details/51242829原创 2020-05-20 17:09:03 · 160 阅读 · 0 评论 -
simhash中文 网页去重
https://my.oschina.net/leejun2005/blog/150086原创 2020-05-18 21:32:48 · 338 阅读 · 0 评论 -
repost 垂直搜索引擎总结
https://blog.csdn.net/liushaoke_kexuejia/article/details/83682736?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-3原创 2020-05-18 18:35:01 · 157 阅读 · 0 评论 -
repost 一个程序员、一个愣头青、一个富二代,凭什么创下10000亿大帝国
https://baike.baidu.com/tashuo/browse/content?id=a46e4d35142ca303fffb9c2f&lemmaId=15898544&fromLemmaModule=pcBottom原创 2020-05-18 17:24:35 · 208 阅读 · 0 评论 -
新一代搜索引擎ZeroSearch, Google分布式论文
新一代搜索引擎项目 ZeroSearch 设计探索https://blog.csdn.net/Tencent_TEG/article/details/109505339?spm=1000.2115.3001.4373Google论文、开源与云计算https://blog.csdn.net/qq_19968255/article/details/109487855?spm=1000.2115.3001.4373...原创 2020-11-22 23:27:11 · 356 阅读 · 0 评论 -
搜索引擎、推荐引擎
Application:search/recomendation engine:tf-idf lyric similarity(歌词搜索) document similarity(网页搜索、文章推荐) 歌曲推荐:歌曲相似性,歌曲聚类,视频推荐:视频理解,广告推送原创 2020-11-18 16:49:48 · 242 阅读 · 0 评论 -
中文分词 文本关键字提取
NLP领域:中文分词:Chinese Word Segmentation文本摘要(文本关键字提取):https://github.com/AimeeLee77/keyword_extraction TF-IDF、 TextRank、 Word2Vec词聚类词性标注情感分析文本分类(Text Categorization)是指计算机将一篇文章归于预先给定的某一类或某几类的过程。。。中文分词算法word2vecViterbi 解码算法HMM基于深度学习: bi-LSTM(双向长短原创 2020-11-18 13:57:30 · 1846 阅读 · 0 评论 -
去重算法,simhash,shingle,百度去重算法
对比其他算法『百度的去重算法』百度的去重算法最简单,就是直接找出此文章的最长的n句话,做一遍hash签名。n一般取3。 工程实现巨简单,据说准确率和召回率都能到达80%以上。『shingle算法』shingle原理略复杂,不细说。 shingle算法我认为过于学院派,对于工程实现不够友好,速度太慢,基本上无法处理海量数据。『其他算法』具体看微博上的讨论...原创 2020-11-17 23:48:18 · 720 阅读 · 0 评论 -
以图搜图
如今我们日常使用的百度、搜狗等通用搜索引擎均提供了相似图像检索功能。淘宝、京东等电商平台也利用自己庞大的商品图像库开发了垂直领域内的图像检索功能来满足消费者们不易用文字描述的商品搜索需求。有更多的创业公司在各自的领域内使用相似图像搜索技术来满足各种各样图像检索需求,服务于更多的行业和消费者。...原创 2020-10-15 16:58:58 · 429 阅读 · 0 评论