自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Jay_Josby的博客

Keep Going

  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 基于ChatGPT+词向量/词嵌入实现相似商品推荐系统

可以看到回答中的语义比原有描述"WIENER A/B 7IN 5/LB FZN"清晰了很多,试验下来推荐准确率比直接用原有描述高了很多,但是回答中仍然包含很多“废话”——介词/连词/符号其实都没有什么语义在里面,最后比较下来,直接用三种可能的商品名(比如'[答案1:熏肠,答案2:烤肠,答案3:火腿]')生成embedding效果最好。使用Redis存储,Redis可以做内存KNN,并有版本对向量计算做了优化(似乎叫Stack,这块不是我做的)使用ChatGPT扩展语义,类似以下prompt。

2023-10-10 15:46:36 945

原创 spring boot 中如何配置国际化/多语言

它包含了关于语言、地区和国家等信息,用于在应用程序中进行国际化和本地化的操作。在国际化应用程序中,可以根据用户的首选语言或系统默认语言设置来确定Locale对象。Locale对象用于在资源文件中选择对应语言的文本消息,以实现多语言支持。通过使用Locale对象,可以在应用程序中根据不同的Locale来获取相应的本地化资源,实现国际化功能。通过以上步骤,你可以在Spring Boot应用中实现国际化功能,根据用户的Locale设置动态获取对应语言的消息文本。代表英语(美国)的Locale,

2023-05-31 11:22:53 1799 1

原创 K8S环境中,每次部署服务前更新数据库表

K8S环境中,每次部署Spring服务前,更新数据库表。:Spring服务启动时会自动加载类路径中的liquibase文件来更新数据库,但无法读取外部路径中liquibase文件,要想使用,只能将liquibase文件打成jar加入服务启动类路径。项目要求所有的数据库操作(包括schema/table)都是by tenant级别,该逻辑是由公司自有框架实现,短期难以通过直接调用liquibase api实现by tenant级别的数据库操作。

2023-01-31 15:50:17 351 1

原创 go语言使用gin库实现SSE长连接

项目需求:在go项目中实现SSE长连接,耗时操作完成后,后端主动通知前端消息。

2023-01-31 14:33:48 6826 1

原创 常用linux命令

常用linux命令

2023-01-31 13:49:36 216

原创 Go 语言学习笔记

Go 使用笔记

2023-01-31 13:32:01 88

转载 pom.xml文件介绍

什么是POM?POM是项目对象模型(Project Object Model)的简称,它是Maven项目中的文件,XML格式,名称为pom.xml,作用类似ant的build.xml文件,功能则更强大。该文件用于管理:源代码、配置文件、开发者的信息和角色、问题追踪系统、组织信息、项目授权、项目的url、项目的依赖关系等等。事实上,在Maven的世界中,一个项目可以什么都没有,甚至没有代码,但是必须包含pom.xml文件。概览下面是一个pom项目中的pom.xml文件中包含的元素。注意,其中的mo

2020-07-31 10:10:50 2260

原创 Maven <properties>标签

通过<properties>元素用户可以自定义一个或多个Maven属性,然后在POM的其他地方使用${属性名}的方式引用该属性,这种做法的最大意义在于消除重复和统一管理。Maven总共有6类属性,内置属性、POM属性、自定义属性、Settings属性、java系统属性和环境变量属性; 内置属性 两个常用内置属性 ${basedir} 表示项目跟目录,即包含pom.xml文件的目录;${version} 表示项目版本 POM属性 用户可以使用该类属性引用POM文件中对应元素

2020-07-22 11:01:26 570

原创 Maven插件

什么是Maven插件?Maven实际上是一个插件执行框架,Maven中的所有任务都是由插件完成的。Maven插件是构建目标的集合,也称为MOJO (Maven Old Java Object)。可以把插件理解为一个类,而构建目标是类中的方法。构建阶段包含一系列的构建目标,可以理解为按顺序调用各个插件中的构建目标(方法),然后一系列的构建阶段组成一个构建生命周期。构建目标可以绑定到多个构建阶段,也可以不绑定,就像类的方法可以被调用,也可以不被调用。插件示例:<build>

2020-07-22 10:57:19 656

原创 Brat文本注释工具的使用文档

1 Brat Document 目录 Brat.........................................................................................................................................1 Brat 标注配置 .......................

2019-12-16 20:42:42 3129

原创 在pycharm中使用pyliblinear进行快速文本分类

目录生成预训练模型: 训练或载入①训练预测模型:②加载训练模型:③保存训练模型:训练/预测数据格式:载入数据:生成预训练模型: 训练或载入①训练预测模型:import pyliblinear as pl # 使用数据构成featureMatrix用以训练和验证fm_Tra = pl.FeatureMatrix.load('E:\文本分类实验\Tr...

2019-08-25 20:33:28 702

原创 【NLP 资源】英文词相似度数据集

所有词相似度数据集结构都是类似三列结构,如下所示:ws.txtgem jewel 3.94midday noon 3.94automobile car 3.92cushion pillow 3.84boy ...

2019-08-02 21:33:38 756

原创 【七月份】实验记录_Mixed perceptual language representation model 混合感知语言表示模型

课题思路是构建一种多维度词表示方法,更抽象一点课题属于多模态语言表示研究范畴。具体而言,是想增加词表示嵌入信息量,比如声音和图像信息,而不仅仅是词汇在上下文中的分布信息,这在直观上比较容易理解,数据维度越多,蕴含的信息量就越大。但有一个问题,尽管增加了维度数量/信息含量,最终的词表示是否会提高下游任务的表现?不同维度间信息会不会相互干扰?现在词向量/语言表示模型的评价指标,一般是词相似度(...

2019-08-02 21:11:24 314

原创 JAVA实现百度地图上绘制离散点等值线——离散点插值+等值线算法+BaiduMap绘制

最近希望在android上实现在百度地图绘制重力异常图(地形图),查了一下官方提供了一个热力图绘制方法,效果很好,但只能显示官方提供的人员流量数据,所以退一步试着实现简单的等值线图绘制,不难,着急的朋友完全可以仿照下例修改使用:主要方法:①对离散点构造矩形区域并插值:insertValue(List longitude,List latitude ,List value,int row ,int ...

2018-04-22 21:06:11 6704 3

原创 【编译原理】First /Follow /FirstVt /LastVt 集合的简单学习

最近准备考研复试,专业课里有一门编译原理,乍看很难懂,但仅应对几个考点又非常容易上手:First和Follow用来构造预测分析表(在LL(1)分析法处)。Firstvt和Lastvt用来构造算符优先关系表(&lt;=&gt;三种关系)。①First(A)直观上来说First(A)即为非终结符A的产生式首个终结符的集合(因为有多个产生式)。有以下几种情况:A-&gt;aB···First(A)={a...

2018-03-07 23:00:25 3345 1

原创 ANN神经网络代码在Matlab中的简单实现

%m是自变量因素行数,n是因变量因素行数,o是所要预测用的自变量因素行数,一般m==owarning off;format long g;[filename filepath]=uigetfile('*.xlsx','选择神经网络需要参考训练的样本数据');xlsx=[filepath filename];XLSX=xlsread(xlsx);[row column]=size(XLSX...

2016-04-19 22:06:22 13076 1

英文词相似度评分数据集.rar

英文词相似度数据,包含了常见的数据集,同时对不同数据集评分区间不统一的问题,提供了将相似度评分统一到[0,1]区间的ws.txt,该文件包含所有词相似度数据集中的词对。

2019-08-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除