- 博客(12)
- 收藏
- 关注
原创 nginx配置ik远程词库
参考文献1参考文献2只要当远程词库的数据发生变动后,es即重新加载远程词库中所有的词(间隔60s),从而动态修改词库,并且不需要重启es。1.nginx安装 Macbrew install --build-from-source nginx文档路径:Docroot is: /usr/local/var/www配置文件路径:The default port has been set in /usr/local/etc/nginx/nginx.conf to 8080 so that nginx
2021-02-24 16:01:01
332
原创 bert+es7实现相似度搜索(待测试与更新bert中文预处理模型)
步骤与代码参考:https://github.com/Hironsan/bertsearchhttps://github.com/hanxiao/bert-as-servicehttps://towardsdatascience.com/semantics-at-scale-bert-elasticsearch-be5bce877859待测试:使用中文预处理bert模型进行相似度搜索的准确度以下为参考以上文献进行英文句子相似度搜索:1.docker启动es7与bertservice此步参考ht
2020-08-31 19:00:16
2138
1
原创 es ik
IK Analyzer GitHub地址https://github.com/medcl/elasticsearch-analysis-ik1.下载与安装:(1)从GitHub下载与elasticsearch版本对应的ik版本,地址https://github.com/medcl/elasticsearch-analysis-ik/releases(2)将下载的zip解压后,放到es目录下的plugins目录中。(3)重启es,ik生效2.测试分词效果:ik分词器有ik_smart 和 i
2020-08-30 19:06:58
237
原创 es analyzer分词
参考:https://learnku.com/articles/35136https://www.cnblogs.com/cjsblog/p/10171695.htmlhttps://blog.csdn.net/white_while/article/details/985045741.Analyzer 由三部分组成:(1)Character Filters 字符过滤器(针对原始文本处理,例如去除 html)字符过滤器以字符流的形式接收原始文本,并可以通过添加、删除或更改字符来转换该流。一个an
2020-08-26 16:27:05
661
原创 Ubuntu docker配置es kibana ik
一、es1.拉取镜像:docker pull elasticsearch:7.3.22.创建自定义网络:docker network create somenetwork3.运行容器:docker run -d --name es --net somenetwork -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" elasticsearch:7.3.24.配置跨域:进入容器docker exec -it es /bin/b
2020-07-17 20:08:18
216
原创 elasticsearch for Mac相关笔记
1.启动:(base) linxierdeMacBook-Air:~ linxier$ elasticsearch启动报错:[2020-07-05T10:00:10,397][WARN ][o.e.b.ElasticsearchUncaughtExceptionHandler] [unknown] uncaught exception in thread [main]org.elasticsearch.bootstrap.StartupException: java.lang.IllegalSta
2020-07-05 11:18:28
165
原创 ik分词 笔记(持续更新)
1.kibana:GET _analyze{ "analyzer": "ik_smart", "text": "上海自来水来自海上"}输出:{ "tokens" : [ { "token" : "上海", "start_offset" : 0, "end_offset" : 2, "type" : "CN_WORD", "position" : 0 }, { "token" : "
2020-07-05 11:18:01
130
原创 MongoDB学习笔记--查询,排序,统计
基础文档为名为food的集合,key包含score(分数)、version(版本)、date(日期)、device(设备型号)等。1.按照键值对value内容查询:查询分数为1.0的文档db.food.find({‘score’:1.0})多个键值对内容查询:查询分数与版本db.food.find({‘score’:1.0,‘version’:‘1.0.136’})查询value...
2019-05-17 22:39:19
473
原创 MongoDB导入json文件 Mac
无法在shell中导入,需要在bin目录下通过terminal导入 linxierdeAir:~ linxier$ cd /usr/local/Cellar/mongodb/4.0.3_1/bin linxierdeAir:bin linxier$ ./mongoimport --db comment --collection two --file /Users/linxier/v...
2019-05-17 17:34:56
1633
原创 mac解决Python词云中文乱码与plt标题乱码
1.解决Python词云内中文乱码wc=WordCloud(font_path = '/System/Library/Fonts/Hiragino Sans GB.ttc',background_color = 'White', max_words = 100)font_path = ‘/System/Library/Fonts/Hiragino Sans GB.ttc’,这里路径可以改成自...
2019-05-08 10:43:01
1911
3
原创 记录在macOS搭建Java环境
学习Java第一步:搭建环境参考链接:https://segmentfault.com/a/1190000014114109https://www.jianshu.com/p/de3b2f1a3534https://zhuanlan.zhihu.com/p/228655641.下载官网jdk:https://www.oracle.com/technetwork/java/javase/d...
2019-04-21 23:12:39
305
原创 macOS 在make pycaffe时报错fatal error: 'Python.h' file not found解决
安装完caffe,在caffe/build中执行make pycaffe时,报出以下错误: linxierdeAir:caffe linxier$ cd buildlinxierdeAir:build linxier$ make pycaffe[ 1%] Built target caffeproto[ 98%] Built target caffe[ 98%] Building CX...
2019-04-21 21:33:50
6528
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人