- 博客(16)
- 资源 (1)
- 收藏
- 关注
原创 基于ChatGPT+词向量/词嵌入实现相似商品推荐系统
可以看到回答中的语义比原有描述"WIENER A/B 7IN 5/LB FZN"清晰了很多,试验下来推荐准确率比直接用原有描述高了很多,但是回答中仍然包含很多“废话”——介词/连词/符号其实都没有什么语义在里面,最后比较下来,直接用三种可能的商品名(比如'[答案1:熏肠,答案2:烤肠,答案3:火腿]')生成embedding效果最好。使用Redis存储,Redis可以做内存KNN,并有版本对向量计算做了优化(似乎叫Stack,这块不是我做的)使用ChatGPT扩展语义,类似以下prompt。
2023-10-10 15:46:36 945
原创 spring boot 中如何配置国际化/多语言
它包含了关于语言、地区和国家等信息,用于在应用程序中进行国际化和本地化的操作。在国际化应用程序中,可以根据用户的首选语言或系统默认语言设置来确定Locale对象。Locale对象用于在资源文件中选择对应语言的文本消息,以实现多语言支持。通过使用Locale对象,可以在应用程序中根据不同的Locale来获取相应的本地化资源,实现国际化功能。通过以上步骤,你可以在Spring Boot应用中实现国际化功能,根据用户的Locale设置动态获取对应语言的消息文本。代表英语(美国)的Locale,
2023-05-31 11:22:53 1799 1
原创 K8S环境中,每次部署服务前更新数据库表
K8S环境中,每次部署Spring服务前,更新数据库表。:Spring服务启动时会自动加载类路径中的liquibase文件来更新数据库,但无法读取外部路径中liquibase文件,要想使用,只能将liquibase文件打成jar加入服务启动类路径。项目要求所有的数据库操作(包括schema/table)都是by tenant级别,该逻辑是由公司自有框架实现,短期难以通过直接调用liquibase api实现by tenant级别的数据库操作。
2023-01-31 15:50:17 351 1
转载 pom.xml文件介绍
什么是POM?POM是项目对象模型(Project Object Model)的简称,它是Maven项目中的文件,XML格式,名称为pom.xml,作用类似ant的build.xml文件,功能则更强大。该文件用于管理:源代码、配置文件、开发者的信息和角色、问题追踪系统、组织信息、项目授权、项目的url、项目的依赖关系等等。事实上,在Maven的世界中,一个项目可以什么都没有,甚至没有代码,但是必须包含pom.xml文件。概览下面是一个pom项目中的pom.xml文件中包含的元素。注意,其中的mo
2020-07-31 10:10:50 2260
原创 Maven <properties>标签
通过<properties>元素用户可以自定义一个或多个Maven属性,然后在POM的其他地方使用${属性名}的方式引用该属性,这种做法的最大意义在于消除重复和统一管理。Maven总共有6类属性,内置属性、POM属性、自定义属性、Settings属性、java系统属性和环境变量属性; 内置属性 两个常用内置属性 ${basedir} 表示项目跟目录,即包含pom.xml文件的目录;${version} 表示项目版本 POM属性 用户可以使用该类属性引用POM文件中对应元素
2020-07-22 11:01:26 570
原创 Maven插件
什么是Maven插件?Maven实际上是一个插件执行框架,Maven中的所有任务都是由插件完成的。Maven插件是构建目标的集合,也称为MOJO (Maven Old Java Object)。可以把插件理解为一个类,而构建目标是类中的方法。构建阶段包含一系列的构建目标,可以理解为按顺序调用各个插件中的构建目标(方法),然后一系列的构建阶段组成一个构建生命周期。构建目标可以绑定到多个构建阶段,也可以不绑定,就像类的方法可以被调用,也可以不被调用。插件示例:<build>
2020-07-22 10:57:19 656
原创 Brat文本注释工具的使用文档
1 Brat Document 目录 Brat.........................................................................................................................................1 Brat 标注配置 .......................
2019-12-16 20:42:42 3129
原创 在pycharm中使用pyliblinear进行快速文本分类
目录生成预训练模型: 训练或载入①训练预测模型:②加载训练模型:③保存训练模型:训练/预测数据格式:载入数据:生成预训练模型: 训练或载入①训练预测模型:import pyliblinear as pl # 使用数据构成featureMatrix用以训练和验证fm_Tra = pl.FeatureMatrix.load('E:\文本分类实验\Tr...
2019-08-25 20:33:28 702
原创 【NLP 资源】英文词相似度数据集
所有词相似度数据集结构都是类似三列结构,如下所示:ws.txtgem jewel 3.94midday noon 3.94automobile car 3.92cushion pillow 3.84boy ...
2019-08-02 21:33:38 756
原创 【七月份】实验记录_Mixed perceptual language representation model 混合感知语言表示模型
课题思路是构建一种多维度词表示方法,更抽象一点课题属于多模态语言表示研究范畴。具体而言,是想增加词表示嵌入信息量,比如声音和图像信息,而不仅仅是词汇在上下文中的分布信息,这在直观上比较容易理解,数据维度越多,蕴含的信息量就越大。但有一个问题,尽管增加了维度数量/信息含量,最终的词表示是否会提高下游任务的表现?不同维度间信息会不会相互干扰?现在词向量/语言表示模型的评价指标,一般是词相似度(...
2019-08-02 21:11:24 314
原创 JAVA实现百度地图上绘制离散点等值线——离散点插值+等值线算法+BaiduMap绘制
最近希望在android上实现在百度地图绘制重力异常图(地形图),查了一下官方提供了一个热力图绘制方法,效果很好,但只能显示官方提供的人员流量数据,所以退一步试着实现简单的等值线图绘制,不难,着急的朋友完全可以仿照下例修改使用:主要方法:①对离散点构造矩形区域并插值:insertValue(List longitude,List latitude ,List value,int row ,int ...
2018-04-22 21:06:11 6704 3
原创 【编译原理】First /Follow /FirstVt /LastVt 集合的简单学习
最近准备考研复试,专业课里有一门编译原理,乍看很难懂,但仅应对几个考点又非常容易上手:First和Follow用来构造预测分析表(在LL(1)分析法处)。Firstvt和Lastvt用来构造算符优先关系表(<=>三种关系)。①First(A)直观上来说First(A)即为非终结符A的产生式首个终结符的集合(因为有多个产生式)。有以下几种情况:A->aB···First(A)={a...
2018-03-07 23:00:25 3345 1
原创 ANN神经网络代码在Matlab中的简单实现
%m是自变量因素行数,n是因变量因素行数,o是所要预测用的自变量因素行数,一般m==owarning off;format long g;[filename filepath]=uigetfile('*.xlsx','选择神经网络需要参考训练的样本数据');xlsx=[filepath filename];XLSX=xlsread(xlsx);[row column]=size(XLSX...
2016-04-19 22:06:22 13076 1
英文词相似度评分数据集.rar
2019-08-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人