- 博客(297)
- 资源 (16)
- 收藏
- 关注
原创 RAG检索与生成的融合
检索增强生成 (RAG) 模型代表了检索系统和生成模型两大不同但互补组件完美结合的杰作。通过无缝整合相关信息检索和生成与背景相关的响应,RAG模型在人工智能领域达到了前所未有的复杂程度。
2024-06-10 21:30:57
772
原创 tf处理序列常用函数
是 TensorFlow 中的一个函数,用于找出一个张量中所有的唯一元素,并且返回它们的索引。该函数会返回两个张量:第一个包含了输入张量中的唯一元素,第二个包含了原始输入张量中每个元素在唯一元素张量中的索引。输出张量的长度是输入张量的最大值加1。是 TensorFlow 中的一个函数,用于逐元素比较两个张量,并返回一个布尔张量,该张量的每个元素表示第一个输入张量中的元素是否大于第二个输入张量中对应的元素。返回的是一个一维张量,因为它从输入张量中抽取了所有被选中的元素,并将它们平铺在了一个新的一维张量中。
2024-06-10 21:22:43
855
原创 Permissions 0644 for ‘/home/jsy/.ssh/id_rsa‘ are too open
执行git pull --rebase 报错。
2024-06-10 21:20:55
295
原创 ssh密钥配置
把其中的内容贴入http://gitlab.xx.com/profile/keys。# 一路回车,如果需要输入,请看提示输入y。# 然后执行下面命令测试是否 ok。
2024-06-10 21:20:26
79
原创 __vsc_prompt_cmd_original: command not found
vi ~/.bashrc # 使用Vim打开并编辑此文件。1.打开.bashrc文件。
2024-06-10 21:19:18
121
原创 python clear和clear()
不带括号的情况,它没有执行任何操作,只是引用了方法对象。这在实际代码中通常不会直接使用,除非你有特殊的理由将方法作为一个第一级对象传递给其他函数或保存为变量。是一个方法属性,代表着一个清除容器内容的方法对象,但它没有被调用执行。调用clear,什么了一个方法,原来的值并没有改变。调用clear对象,引用对象也会被删除。另外赋值,将代码地址空间引入到其他地方。方法,作用是实际清除容器中的内容。是一个调用操作,表示执行。
2024-05-18 21:28:19
273
原创 tf输出tf.variable_scope作用域的变量名
对于TensorFlow 1.x和2.x,总体上的使用逻辑类似,但语法和API有所差异。,这是用来标示这是变量的第一个引用。在TensorFlow中,你可以有同名的多个变量引用,编号标示它们的不同。内创建变量时,所有变量的名称都会带有这个作用域的前缀。如果你需要获取特定作用域下所有变量的名称,你可以使用。已经不再使用,所以对于变量和模型组件的命名和组织,应优先使用。在TensorFlow 1.x中,当你在一个特定的。函数,并且筛选出名称以这个特定作用域为前缀的变量。在TensorFlow 2.x中,由于。
2024-05-18 21:27:47
138
原创 LLM-KERec
LLM-KERec系统包括传统推荐模块和基于LLM的互补知识增强模块。传统推荐模块负责召回候选商品、粗排过滤、精排和重排。LLM互补知识增强模块则包括实体提取器、互补图构造、E-E-I权重决策模型等,以整合互补知识,增强推荐效果。
2024-05-12 19:35:17
313
原创 GENRE
摘要改写:把新闻的title, abstract 还有category 当作输入,然后要求大语言模型来生成一个摘要,把这个摘要当作这个新闻的 new feature输入下游。用户画像:根据用户过去观看过的新闻的标题,尝试去问大语言模型是否知道这个用户的一些感兴趣的topic,也就是用户的喜好和他所在的位置。样本扩充:有一些用户看过的新闻非常少,所以用大语言模型来做一些样本的扩充。
2024-05-12 19:34:12
343
原创 王者荣耀铭文说明
铭文,是指在进入游戏之前你可以为你的英雄额外增加的一些属性。一套好的铭文可以说是召唤师的第七件装备。铭文,卡攻速阈值;卡暴击效果阈值等。
2024-05-12 19:31:54
214
原创 前赤壁赋 《苏轼》
壬戌之秋,七月既望,苏子与客泛舟游于赤壁之下。清风徐来,水波不兴。举酒属客,诵明月之诗,歌窈窕之章。少焉,月出于东山之上,徘徊于斗牛之间。白露横江,水光接天。纵一苇之所如,凌万顷之茫然。浩浩乎如冯虚御风,而不知其所止;飘飘乎如遗世独立,羽化而登仙。于是饮酒乐甚,扣舷而歌之。歌曰:“桂棹兮兰桨,击空明兮溯流光。渺渺兮予怀,望美人兮天一方。”客有吹洞箫者,倚歌而和之。其声呜呜然,如怨如慕,如泣如诉;余音袅袅,不绝如缕。舞幽壑之潜蛟,泣孤舟之嫠妇。苏子愀然,正襟危坐,而问客曰:“何为其然也?
2024-04-24 14:40:22
133
原创 白居易《中隐》
古代的理想生活啊,白居易不愧为诗王、诗魔,乐天居士。留司官这种闲官冷官既能保障衣食无忧,又能躲避朝堂纷争。总而言之,这首诗表达的就是钱多事少离家近,登山、游园,喝酒、吹牛、睡懒觉等等不在话下。大隐住朝市,小隐入丘樊。丘樊太冷落,朝市太嚣喧。不如作中隐,隐在留司官。不劳心与力,又免饥与寒。终岁无公事,随月有俸钱。君若好登临,城南有秋山。君若爱游荡,城东有春园。君若欲一醉,时出赴宾筵。洛中多君子,可以恣欢言。君若欲高卧,但自深掩关。亦无车马客,造次到门前。贱即苦冻馁,贵则多忧患。穷通与丰约,正在四者间。
2024-04-20 22:53:32
128
原创 python文件无法作为模块被导入
在项目tt下新建了文件夹tt包含模块文件a.py,里面包含t函数,在同路径下的1.py引入模块进行t函数的调用,具体如下目录结构tt/tt/a.pytt/tt/1.py执行报错ModuleNotFoundError。
2024-04-20 22:52:58
492
原创 苏轼的《六月二十七日望湖楼醉书五首》
黑云翻墨未遮山,白雨跳珠乱入船。卷地风来忽吹散,望湖楼下水如天。译文乌云上涌,就如墨汁泼下,却又在天边露出一段山峦,明丽清新,大雨激起的水花如白珠碎石,飞溅入船。忽然间狂风卷地而来,吹散了满天的乌云,而那西湖的湖水碧波如镜,明媚温柔。情感这首诗写作者坐船时所见,描绘了西湖的美丽雨景;
2024-04-20 22:51:59
124
原创 Chat-REC: Towards Interactive and Explainable LLMs-Augmented Recommender System
推荐系统被应用于推荐服务,提高人们的生活质量,但仍存在一些问题。Chat-Rec,有效地学习用户的偏好,,有效推理出用户和产品之间之间的联系。产品之间用户偏好相关联,允许更好的跨域产品推荐。
2024-04-04 22:52:16
460
原创 大模型llm综述
LLM 是指包含数千亿(或更多)参数的 Transformer 语言模型 ,这些模型是在大规模文本数据上进行训练的 , 例如 GPT-3 ,PaLM,Galactica 和 LLaMA。LLM 展现了理解自然语言和解决复杂任务(通过文本生成) 的强大能力。
2024-03-17 20:27:38
1172
原创 Wilson威尔逊平滑
在曝光很少的情况下,计算出的CTR并不真实可靠,而样本数越大,CTR的比例才越准确,更能反应真实情况。为了衡量样本数对于CTR信区间的影响,我们引入"威尔逊(Wilson)区间"的概念。Wilson区间的含义就是,就是指在一定置信度下,真实的CTR范围是多少。
2024-03-11 21:08:45
1267
原创 langchain入门
现将文本分段,然后逐段总结,最后合并各个总结。# 导入文本# 将文本转成 Document 对象# 初始化文本分割器# 切分文本# 加载 llm 模型# 创建总结链# 执行总结链,(为了快速演示,只总结前5段)
2024-03-10 21:28:57
1063
原创 26条prompt规则应用于大模型
llm大模型在回答一些问题上表现出了惊人的能力,例如数学逻辑推理,代码生成,问题答复等。提词工程是和大预言模型交流的一门艺术。一般地,提供的指令或任务越精确,模型回答的越好,越符合用户的预期。为此,论文《Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4》提出了26个原则,这些原则增强了LLM关注输入上下文关键元素的能力,从而生成高质量的响应。
2024-02-03 18:36:31
2052
原创 清朝12帝
清太祖爱新觉罗·努尔哈赤(1559年-1626年),又作努尔哈齐,建州左卫指挥使塔克世长子,姓爱新觉罗,自称姓佟,号淑勒贝勒,女真族(即满族),生于建州左卫(今辽宁新宾县西南)。后金政权的创建者、清朝的实际奠基人。努尔哈赤少年时家道中衰,曾靠采集山货为生。初为辽东总兵李成梁部下,屡立战功。后袭父职,任建州左卫指挥使。1583年,以祖、父为明兵误杀为由起兵,先后统一建州女真各部及海西女真、野人女真大部,受明封为都督佥事、龙虎将军。曾创建八旗制度,并命人创造满文。1616年,建立后金政权,都城赫图阿拉。
2024-01-07 13:15:01
777
原创 tf特征处理常用函数
eg:a=[a1,a2,a3],其中a1,a2,a3的维度均是(None,1,32),执行b=concat_fun(a,axis=1),则b的维度为(None,3,32);执行c=concat_fun(a,axis=-1),则b的维度为(None,1,96);
2024-01-07 12:35:32
909
原创 明朝16个皇帝
明太祖朱元璋(1328年10月21日—1398年6月24日),字国瑞, 原名朱重八、朱兴宗。(今安徽凤阳)钟离人。开国皇帝(1368年—1398年在位), 年号“洪武”。朱元璋二十五岁参加领导的,反抗。至正十六年(1356年)攻占,改名,至正二十四年(1364年)称吴王。他陆续消灭等割据势力,并在吴元年以“驱逐胡虏,恢复中华”为号召,派遣举兵北伐,以推翻元朝统治。洪武元年(1368年)正月,即皇帝位于应天府,国号大明,年号洪武。同年秋攻占,结束了元朝在全国的统治。[291]此后数次遣将北征,打击残余势力。
2023-12-10 19:32:29
599
原创 rank的相关loss
排序优化时,主要从三个角度来考虑构建loss,分别为pointwise、pairwise、listwise。pointwise将排序所有query当成一个整体,计算每个对的loss,相当于一个二分问题。pairwise以每个query为维度,构建这样的元组,构建doc和doc之间的偏序关系。listwise以query为维度,将此query下的doc作为一个list进行建模。常见的这几种loss包括如下几种,来源于TF-Ranking代码库。Click
2023-12-02 12:42:06
1736
原创 信息检索指标直接优化的通用近似框架
X为q的一系列doc,x为X中的一个,f为x的排序打分函数,x的分数记为,其表述如下:根据可以得到一个排序,根据label会有一个原始的相关度排序r(x),重定义中的位置函数和截断函数均不可导4.4、位置近似函数4.4.1、排序分位置表示位置可视为排序分的产出,位置和截断函数均不连续可导此paper为直接优化IR指标提供了理论依据;在一定条件下,直接优化IR指标是合理的;直接优化指标可能是排序学习最优的方法之一。
2023-11-25 22:49:05
1050
原创 fully_connected与linear
fully_connected创建一个名为的变量weights,表示一个完全连接的权重矩阵,乘以它inputs产生一个 Tensor隐藏单位。如果normalizer_fn提供了数据(例如 batch_norm),则应用它。否则,如果normalizer_fn为None且使用了biases_initializer,biases则将创建变量并添加隐藏单位。如果activation_fn不是None,它也会应用于隐藏单位。inputs:至少为二阶张量和最后一个维度的静态值;
2023-11-19 22:20:54
389
原创 tf loss构建常用到函数
tf.map_fntf1.x中tf.map_fn没有fn_output_signature参数tf.map_fn案例。
2023-10-22 18:18:24
656
原创 预训练相关知识
选择一些目标token,依据排列顺序中目标token前的字符和输入文本原本顺序的自然位置,训练模型(引入two-stream self-attention 机制,实际中,由于收敛速度较慢,仅选择排列序列中的最后几个token作为目标token)。由于pretrain和fine-tuning不一致,在预训练的过程中采用了比较trick的方式,80%的采用[mask],10%随机token,10%原来的token,例如bert。一个span内随机打乱次的顺序,在已知词的情况下,预测词正确位置的概率。
2023-09-17 14:33:39
133
原创 c++之枚举
2.1、枚举类型的定义枚举类型(enumeration)是 C++ 中的一种派生数据类型,它是由用户定义的若干枚举常量的集合。2.2、枚举类型的格式enum {};// 定义枚举类型week。
2023-08-30 17:59:46
493
原创 kmeans常见考点
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。
2023-08-28 20:34:07
191
原创 冷启问题目前常见解决方案
MAB(Multi-Arm-Bandit)是多臂赌博机问题,是RL(强化学习)的一种。主要解决的是EE(exploit and explore)问题,exploit表示利用已有的确定兴趣,explore表示探索未知的兴趣。MAB问题:有K个老虎机,总共摇T次,怎样使T次后的总收益最大的问题。
2023-08-27 17:43:26
249
原创 es引擎篇
Elasticsearch是。它允许我们快速实时地存储、搜索、分析大数据。Elasticsearch使用Lucene作为内部引擎,但是在你使用它做全文搜索时,只需要使用统一开发好的API即可,而不需要了解其背后复杂的Lucene的运行原理。
2023-08-27 17:04:42
207
原创 c++字符串浮点数转化
atof(): 把字符串转换为atoi():函数用来将字符串转换成整数(int)atol():把参数所指向的字符串转换为一个长整数c++中的定义。
2023-08-27 16:59:42
3899
女程序员后来都去做什么了
2023-12-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人