搜索引擎
文章平均质量分 83
赵侠客
一个独立思考的开发者
展开
-
90后在技术上开始被00后嘲笑了,90后该何去何从?
00后突破我的认知,深刻反思,实例讲解Elasticsearch索引添加字段、修改字段和删除字段方法原创 2024-08-17 17:05:32 · 1091 阅读 · 0 评论 -
《EalsticSearch从入门到实战》-CRUD+JAVA常用操作
本文主要介绍elaticsearch索引和数据的增、删、改、查基本操作,其它包括API和JAVA的操作,大部分操作都介绍的单数据操作和批量操作。同时还介绍的索引创建过程中和更新数据过程中的注意事项原创 2023-07-30 18:43:48 · 236 阅读 · 0 评论 -
windows环境安装elasticsearch+kibana并完成JAVA客户端查询
elasticsearch官网下载比较慢,有时还打不开,可以通过elasticsearch.cn下载,先找到对应的版本,最好使用迅雷下载,秒下的,我的下载速度可以达到40M/S原创 2023-07-30 11:31:37 · 1316 阅读 · 0 评论 -
通过案例实战详解elasticsearch自定义打分function_score的使用
elasticsearch给我们提供了很强大的搜索功能,但是有时候仅仅只用相关度打分是不够的,本文结合简单案例详解function_score的使用方法原创 2023-07-29 20:28:02 · 1295 阅读 · 0 评论 -
EalsticSearch添加字段后重建索引方法
alsticSearch作为全文搜索引擎被大家广泛应用于项目中,大部项目原始数据一般都存在关系型数据库中,如Mysql。然后通过同步或者异步方式将需要搜索的数据同步至EalsticSearch,常用方法有:代码中先写入Mysql,然后再写入EalsticSearch,异步的一般使用Canal+MQ的方式异步抽取数据写入ES。由于ES中的索引字段是不可变的,不像Mysql需要添加字段时可以随时添加,而ES索引一旦创建好了就不能再添加字段,动态添加的数据也无法创建索引,本文介绍一种简单的方式,使用ES别名+重建原创 2023-07-24 18:14:29 · 529 阅读 · 0 评论 -
elasticsearch在统计存储用量方面的应用
本文主要通过介绍使用elasticsearch计算存储来学习一下elasticsearch分组查询的使用以及使用JAVA代码调用elasticsearch分组查询原创 2023-07-21 20:33:48 · 677 阅读 · 3 评论 -
配合Kibana记录一次 ElasticSearch JVM 调优实战
先上图主要问题: GC count 中Old和YoungGC在10点之前次数比较频繁 1、第一步优化 在JVM Heap图表中可以看到在10点之前UsedHeap基本上等于Max Heap,所以引起频繁的 Old GC,修改ElasticSearch配置文件config/jvm.options, 修改 -Xms2g ,-Xmx2g,默认两个都是1g。-Xms2g...原创 2018-12-10 11:03:03 · 3431 阅读 · 0 评论 -
使用轻量级JAVA 爬虫Gecco工具抓取新闻DEMO
写在前面最近看到Gecoo爬虫工具,感觉比较简单好像,所有写个DEMO测试一下,抓取网站 http://zj.zjol.com.cn/home.html,主要抓取新闻的标题和发布时间做为抓取测试对象。Gecoo GitHub地址 https://github.com/xtuhcy/gecco Gecoo 作者博客 http://my.oschina.net/u/2336761/blog?fr原创 2016-04-08 14:15:16 · 5623 阅读 · 1 评论 -
SEO优化之——html页面相关总结
写在前面在前面一篇文章中我简单介绍了怎么优化SEO,其中一点就是网站html结构的优化。网站结构的优化主要是让搜索引擎爬虫更好的理解你网站内容,从而让它喜欢上你的网站,这样它才会经常来爬你的网站,网站排名自然靠前了。这里我简单总结一些前端设计页面时应该注意的事项,总结可能不全,仅在我能力范围内,有不妥之处请踊跃吐槽。网页总体布局 如图所示为一个简单的网站布局,主要有标题、导航、面包屑导航、正文、相原创 2016-03-08 22:11:31 · 4476 阅读 · 3 评论 -
SEO优化之——常用工具总结
写在前面SEO优化就是让网站排名更靠前,那么怎么来衡量一个网站SEO的好坏呢?通常我们是借助一些SEO工具来查询一个网站SEO的相关信息,以下介绍一些本人知道的工具,有更好的工具请大家补充。百度 如上图所示为2015年中国搜索引擎市场份额,从图中可以看出百度在PC端和移动端都占据了大半壁江山,所以在国内SEO优化主要还是针对百度做优化。既然针对百度做SEO,百度当然是最好的工具了,百度可以说是无原创 2016-03-07 20:14:23 · 1522 阅读 · 0 评论 -
计算两组标签/关键词 相似度算法
写作背景标签在互联网行业有大量的应用,给博客打标签,给商品打标签,给新闻打标签。通常每篇文章会打上多个标签,好的标签系统给后期的数据分析可以带来巨大的利处。最近想做一个基于内容的新闻简单推荐系统,其中的一个推荐权重就是两篇新闻标签的相似度,由于没什么数据挖掘和机器学习经验,自己一直在摸索,感觉自己还没有入门,先记录下来,慢慢学习。应用案例比较现在有两篇文章 文章1:广州车展实拍东风悦达起亚K2两原创 2016-02-05 11:03:40 · 16302 阅读 · 5 评论 -
IKAnalyzer 添加扩展词库和自定义词
IKanalyzer分词器IK分词器源码位置 http://git.oschina.net/wltea/IK-Analyzer-2012FFIKanalyzer源码基本配置如图所示是IKanlyzer加载默认配置的路径项目中配置扩展词库如图所示,当我们导入Ikanlyzer jar包后,使用扩展词库只需要在项目的src根目录下建立IKAnalyzer.cfg.xml文件,文件中配置扩展词库和停用词库原创 2015-12-01 15:52:57 · 11329 阅读 · 1 评论 -
solr+solrJ facet.pivot 用法实例
solr+solrJ facet.pivot 用法实例 ,solr 多维分组查询实例原创 2015-07-29 17:52:18 · 2925 阅读 · 1 评论