自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 收藏
  • 关注

原创 【刷题笔记】N皇后||回溯||符合思维方式

n 皇后问题 研究的是如何将 n 个皇后放置在 n × n 的棋盘上,并且使皇后彼此之间不能相互攻击。给你一个整数 n ,返回 n 皇后问题 不同的解决方案的数量。

2023-12-14 10:58:21 469

原创 【刷题笔记】串联所有单词的子串||暴力通过||滑动窗口

给定一个字符串 s 和一个字符串数组 words。words 中所有字符串 长度相同。s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。例如,如果 words = [“ab”,“cd”,“ef”], 那么 “abcdef”, “abefcd”,“cdabef”, “cdefab”,“efabcd”, 和 “efcdab” 都是串联子串。“acdbef” 不是串联子串,因为他不是任何 words 排列的连接。返回所有串联子串在 s 中的开始索引。

2023-11-30 14:15:59 1056

原创 【刷题笔记】长度最小的子数组||二分查找||边界||数组

给定一个含有 n 个正整数的数组和一个正整数 target。找出该数组中满足其总和大于等于 target 的长度最小的 连续子数组 [numsl, numsl+1, …, numsr-1, numsr] ,并返回其长度。如果不存在符合条件的子数组,返回 0。示例 1:输入:target = 7, nums = [2,3,1,2,4,3]输出:2解释:子数组 [4,3] 是该条件下的长度最小的子数组。示例 2:输入:target = 4, nums = [1,4,4]输出:1。

2023-11-30 11:26:05 1214

原创 【刷题笔记】两数之和II_二分法||二分查找||边界||符合思维方式

对于二分查找有两个最重要的问题:`如何计算mid`,`如何跳转left和right`。

2023-11-29 11:10:42 1090

原创 【刷题笔记】匹配字符串||KMP||动图解析||符合思维方式

给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1。

2023-11-28 11:08:41 945

原创 【刷题笔记】H指数||数组||二分查找的变体

我们有一个有序数组[1, 2, ... , len(citiations)](表示为nums),我们有一个判定条件counter(nums[i]) >= i+1(i在这里是下标),我们需要从有序数组中找到最后一个符合条件的元素

2023-11-27 15:57:00 1142

原创 【刷题笔记】分糖果||数组||暴力通过||符合思维方式||多案例分析

题目让我们返回需要准备的最少糖果,最直接的想法就是:找到所有的波底分数对应的小孩,设置其糖果为1,然后朝着两边的波峰,逐步+1。

2023-11-27 10:32:50 1128

原创 【刷题笔记】加油站||符合思维方式

每两个站点之间的增加或者减少量是一定的,即任何两点之间连线的斜率是不变的(gas[i] - cost[i]),只要我们让最低值大于等于0,就可以保证走一圈。只要我们让最低值为出发点,不就能保证其为0了?给定两个整数数组 gas 和 cost ,如果你可以按顺序绕环路行驶一周,则返回出发时加油站的编号,否则返回 -1。你从其中的一个加油站出发,开始时油箱为空。(参考上面的图,走一圈回来,相当于一共gas.length+1个站点)的数组。一开始的时候,剩余油量为0。出发时,剩余油量(或者说,初始油量)为0。

2023-11-26 21:46:52 664

原创 【刷题笔记】接雨水||暴力通过||符合思维方式

那么我们能做的就是从左到右,依次找到越来越高的值;保存其索引,从右到左,依次找到越来越高的值,保存其索引。然后计算这些索引之间的最大盛水面积,减去之间的柱子的面积,就是最后的接雨水的结果。

2023-11-26 21:14:44 682

原创 【刷题笔记】数组-双指针||覆盖||重复元素

【刷题笔记】数组-双指针||覆盖||重复元素。

2023-11-26 15:39:26 1096

翻译 SIGIR22:Bilateral Self-unbiased Learning from Biased Implicit Feedback

协同过滤是目前构建推荐系统最流行的技术。协同过滤经常使用两种用户反馈:显式和隐式反馈。显式反馈提供了更加丰富的用户偏好,因为用户精确地评估了他们有多喜欢或者不喜欢项目。然而,在多样的真实世界应用中收集精确反馈是很困难的,因为很少的用户会在体验了项目之后会提供反馈。另一方面,隐式反馈很容易通过记录很多的用户行为来进行收集,例如点击链接、购买产品或者浏览网页。在协同过滤中使用隐式反馈存在着一些挑战:(i)现存的研究将观测的用户交互仅当作正反馈,例如点击一个项目或者查看一个页面,并不表示用户是否喜欢该项目。

2023-02-25 11:14:39 317 1

翻译 WWW22: CAUSPref_Causal Preference Learning for Out-of-Distribution Recommendation

常见的推荐方法有协同过滤[18]、基于内容的推荐[24]、混合推荐[29]等等。最近,深度神经网络DNN[2]和图卷积神经网络GCN[21]提升了推荐系统的性能。目前大部分的推荐系统假设原始训练和测试数据是独立同分布(I.I.D)的。然而这个假设常常是与现实中的推荐情景相违背的。现实中的数据不可避免地存在分布的偏移问题。第一种偏差在文献中很少被研究,同时也缺乏一种统一的方法来处理这两种分布的变化。这种问题也被称为OOD问题(out-of-distribution)

2023-02-22 14:10:36 396

原创 SIGIR22:User-controllable Recommendation Against Filter Bubbles

由于仅仅是拟合数据,推荐系统常常面临过滤气泡问题:持续推荐很多同质性的项目,将用户和多样化的内容隔离开。例如,如果用户点击了很多短视频,来学习制作咖啡,系统可能会持续向其推荐不同视频上传者投稿的相似短视频,占据了其他诸如热点新闻等信息丰富的视频。更糟糕的是,因为如图一的反馈循环,过滤气泡可能会逐渐地变得严重。从长远来看,过滤气泡将会减少用户的积极性以及项目的创造性,会损伤整个生态环境。因此,消除过滤气泡是很重要的。为了实现这一目标,现有的研究提出纳入额外目标的历史交互数据拟合。例如(1)多样性[6]

2023-02-11 20:26:05 863

翻译 【SIGIR22】使用反事实生成器来消除知识感知推荐中的虚假联系

知识图谱将实体信息组织成元组的集合,为推荐系统提供了辅助信息,来丰富项目的表示以及捕获在项目属性上的结构化偏好。因此,知识感知的推荐器更加能够提供准确以及可解释的推荐。为了利用知识图谱的信息,现有的知识感知推荐方法主要集中于如何设计有效的推荐系统神经结构。虽然在一定程度上这种做法很有效,但是这些方法只学习了项目知识以及用户行为之间的表层联系。因此,由于虚假联系导致的潜在效应,模型的合理性以及可靠性在一个更加泛化的设定下可能无法得到保证。

2023-01-28 20:29:37 1278 1

翻译 【WWW‘ 22】Unbiased Sequential Recommendation with Latent Confounders

最近序列推荐由于其更贴合实际的设置获得了逐渐增加的吸引力以及更好的推荐效果。通过对用户连续动作之间的关系进行建模,使得序列推荐优于传统的推荐。FPMC[22]模型基于用户最新的行为估计当下的用户偏好。GRU4Rec[16]模型将循环神经网络引入,来建模更加综合的历史信息。NARM[17]使用注意力机制来区分不同用户行为的重要性。这些模型持有的主要假设是,训练数据可以很好地表示用户的序列偏好。然而,该假设在实际中是存疑的。

2023-01-13 17:52:54 1904

翻译 【WWW ‘22】A Model-Agnostic Causal Learning Framework for Recommendation using Search Data

基于机器学习的推荐系统已经成为人们自动发现兴趣的一种有效的方式。现有的方法经常将推荐的富信息,例如项目、用户、以及上下文等信息表示为embedding向量,并且利用这些向量来预测用户的反馈。从因果分析的角度来看,嵌入向量与用户反馈之间的关联,混合了能够表示用户为何偏好某个项目的因果部分以及仅仅表示统计相关性的非因果部分,例如曝光机制、公共观点、展示位置等。然而,现存的推荐系统在使用这些嵌入向量的时候大都忽略了因果部分和非因果部分之间的显著差异。

2023-01-01 20:48:54 772 1

翻译 Causal Representation Learning for Out-of-Distribution Recommendation

现代的推荐系统会从历史交互数据种学习用户表示,会受到用户特征偏移的影响,例如用户收入的提升。历史交互数据会将过时的历史交互信息注入到用户表示种,而这些信息是与用户最新的特征相冲突的。本文将分布外(out-of-distribution)推荐问题视为一种用户特征产生偏移的环境。为了达到高可信度,我们为学习设置了两个目标:1. 稳健的OOD泛化性;2. 快速的OOD适应性。

2022-12-21 21:15:25 749

原创 RecSys2021反事实评估学习教程

反事实评估器允许我们使用现存的日志数据来评估当我们使用新的目标推荐策略来替换之前的策略时候会如何表现。我们称这些评估器以“异策略(off-policy)”的方式在工作。反事实衡量器引出了类似于无偏离线A/B测试的“异策略衡量(Off-policy Evaluation, OPE)”方式以及通过“异策略学习(Off-policy Learning, OPL)”习得的新的推荐策略。

2022-11-15 21:37:41 743

原创 【Leetcode小解析】正则表达式匹配

10. 正则表达式匹配给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。'.' 匹配任意单个字符'*' 匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

2022-11-12 17:09:26 718

原创 【论文不精读】Reinforced Path Reasoning for Counterfactual Explainable Recommendation

Reinforced Path Reasoning for Counterfactual Explainable Recommendation

2022-10-28 16:44:46 1046

原创 【论文精读】Counterfactual Explainable Recommendation

可解释反事实推荐,Counterfactual Explainable Recommendation

2022-10-19 23:13:56 695

原创 推导多元最小二乘法的计算方法

对多元最小二乘法的推导

2022-10-18 10:03:49 1563

原创 估计β1等于总体的协方差除以x的方差

为何β1等于总体的协方差除以x的方差。

2022-10-18 10:02:02 1600

原创 【综述精读】:Causal Inference in Recmmender Systems(因果推论在推荐系统中的应用)

如今的推荐系统的基本思想是对“关联”进行建模,例如协同过滤中的行为联系(behavior correlation),或者是CTR中的特性-特性(feature-feature)、特性-行为(feature-behavior)联系。然而,现实世界是由因果关系推动的,而不是所谓的联系,联系并不意味着存在因果关系。

2022-09-15 08:17:37 1753

原创 关于DAG的一些零散记录

d-separation是一个判定标准,来判断给定的因果图中集合X的变量在给定Z的情况下是否与Y无关。主要思想是将“相关”和“可连接性”以及“无关”和“不可连接性”联系起来。假设我们正在面对着一个有向箭头系统,这个系统中一些节点是测量变量,即已经精确地知道了它们的值。......

2022-08-18 16:26:09 162

原创 【论文翻译和解释(2)】LOF:Identifying Density-Based Local Outliers论文精读

以上的例子说明了DB(pct,dminpct,dminpct,dmin)-outliers持有的全局观点是有意义的,并且在特定的情况下是完全可用的,但是对于存在不同密度簇的一般情况是不适合的。目前的关键情况在于,离群情况不应该是一个二元值。相反,我们赋予每个对象一个离群因子,这是对象的离群程度。(对象ppp的kkk-distance)对于任何一个正整数kkk,k−distance(p)k−distance(p)p。......

2022-07-31 16:54:22 1067

翻译 【论文翻译和解释(1)】Mitigating Confounding Bias in Recommendation via Information Bottleneck

如何有效地减少推荐系统中的反馈偏差是一个重要的研究课题。本论文中,我们首先通过两种各自的因果图描述了推荐系统中有偏差和无偏差反馈的生成过程,他们之间的差异可以视作偏差的来源。我们将这种差异定义为,这些偏差可以视为一些以前已经研究过的特定偏差的集合。对于仅有反馈偏差情况,我们从因果图中推导了需要获得去偏表示的情况。基于信息论,我们提出了一种叫做**无偏信息瓶颈理论(debiasedinformationbottleneckDIB)**的新颖方法来优化这些情况并且找到了一种对于它的易于解决的解法。...

2022-07-30 10:15:49 1045 1

原创 Collaborative Filtering for Implicit Feedback Datasets结论公式推导

精确反馈的假设并不总是可行的。一个用户可能选择不去对不喜欢的物品做出反映,这使得这样的一个交互条目缺失。或者数据并不能第一时间就捕获到用户的确定的偏好。例如一个点击数据流集合只能显示出用户浏览物品的频繁程度,却不能等价地说明用户喜欢这个商品。事实上用户在第一次浏览商品之前不可能会表示出对商品的反感。或者用户已经在别的地方见到过这个商品并且选择再也不看了,因为他对这个商品不感兴趣。这些情况下用户都不喜欢这个商品,但是没有方法可以仅凭点击流辨别出用户的真实喜好。这就是为什么隐式反馈的方法出现。...

2022-07-04 18:30:51 232

原创 关于ThreadPoolExecutor调用了submit之后发生了什么

关于ThreadPoolExecutor调用了submit之后发生了什么文章目录关于ThreadPoolExecutor调用了submit之后发生了什么前置的杂乱知识点看一下execute如何调用reject的简单观察addWorker全解析runWorker在干嘛?总结如果只想看详细的执行流程,建议直接看最后一小节,同时您可以打开编译器,对比着源码同时您需要了解一点可重入锁ReentrantLock的使用方法,了解线程池的生命周期和线程的生命周期前置的杂乱知识点Executors的基本特点

2022-02-06 18:19:31 2282

原创 JDK1.7中关于多线程操作HashMap的成环以及丢失问题

JDK1.7中关于多线程操作HashMap的成环以及丢失问题文章目录1. 预备知识2. 关于成环2.1 线程A2.2 线程B2.3 分析一下堆中的情况2.4 我们重新转入线程A2.5 动图3. 分析Entry丢失的情况3.1 前提信息3.2 线程B3.3 线程A3.4 线程B3.5 动图1. 预备知识扩容产生的条件:如果HashMap初始化的时候,没有设置初始容量,那么初始容量默认为16,扩容阈值threshold为16*0.75f=12;如果设置了初始容量,那么首次扩容阈值threshold为

2022-01-26 15:26:32 1026

原创 关于Java泛型的通配符的写入和读出的一点思考

关于Java泛型的通配符的写入和读出的一点思考文章目录1.前期准备☕2. 关于上、下转型☕3. <? super SomeClass>的写入☕ 4. <? super SomeClass>的get☕<? extends SomeClass>的写入☕ 5. <? extends SomeClass>的get总结1.前期准备 ┌────────────────┐ │ PGrandpa │ └────────────────┘ .

2022-01-23 21:17:28 508 1

原创 A First Course in Database Systems(数据库基础教程 第三版)课后答案——2.3.1\2.3.2\2.4.1

数据库mysql练习

2022-01-16 20:13:05 5255 1

原创 计算机网络——经典的128B和512B之问

问题来源(2012年联考) 两台主机之间的数据链路层采用了后退N帧协议(GBN)传输数据,数据的传输速率为16kbps,单向传播时延为270ms,数据帧的长度范围是128~512字节,接收方总是以数据帧等长的帧进行确认(即确认帧长度与发送的帧一样大)。为使信道利用率最高,帧序列的比特数至少是(B)A.5 B.4 C.3 D.2定量分析数据帧的长度在[128B, 512B]范围内都可以取得,假设我们取512B作为帧长,那么512*8/16000=0.256s第一个确认帧到达的时间:(0.2

2021-11-26 09:30:12 4511

原创 计算机网络——冲突域、广播域能够被谁划分?

首先下结论:集线器不分割冲突域,也不分割广播域交换机分割冲突域,但是VLAN技术可以通过交换机分割冲突域和广播域路由器可以分割冲突域和广播域集线器只起到一个互联的作用,只是将不同的计算机通过双绞线等线路连接起来,使得不同的信号电流可以相互流通。每次有电信号发出到网络上的时候,都默认是想要对全体其他计算机设备广播的。我们得出第一个结论:集线器就是起到一个连接的作用,它无法隔离任何东西但是这样会出现一个问题:冲突。不同计算机设备都想要占用信道来发送自己的信号,有没有一种方法,能尽量减少这种冲突?那就

2021-08-25 16:26:38 3206

原创 Win10删除文件权限不足的一种可能的解决方式

文章目录发现问题尝试剪切到桌面桌面上的文件拖入回收站,清空剩余的文件用火绒强力删除文件消失了PS发现问题尝试剪切到桌面此时有可能还有文件无法移动,先跳过桌面上的文件拖入回收站,清空剩余的文件用火绒强力删除文件消失了PS不要在一开始就用火绒,如果文件比较大的话,会很慢,反正我是一次都没等到过他删除成功。...

2021-08-13 14:49:58 1517 1

原创 计算机网络——图解文件发送时间

计算机网络——图解文件发送时间文章目录计算机网络——图解文件发送时间第一题:第二题第三题:题目来源:【王道2021 p9 6】我们来分析一下,在发送的过程中有几类时间:图像制作工具:ppt我们假设有四组数据,连续地看一下时间分布第一题:2RTT+RTT/2+n×(分组大小/带宽) = 2×100+(100/2) + (1000/1)×(1KB/1.5Mb/s) = 200ms+50ms+1000×5.4613×10−35.4613\times 10^{-3}5.4613×10−3​​​

2021-07-30 18:40:04 2285 3

原创 计组——从一道计算题题开始,展开关于总线平均传输速率的分析

关于总线平均传输速率的分析做王道有感,如果您遇到了同样的问题并且在我这里能得到一点点收获,我将十分荣幸。本文采用了公式推导,有些繁琐,如果您觉得浪费了您的时间,请轻喷????2.2 某总线支持耳机Cache块传输方式,若每块6个字,每个字长4字节,时钟频率为100MHz。(1) 读操作时,第一个时钟周期接收地址,第二、三个为延时周期,另用4个周期传送一个块。读操作的总线传输速率为多少?343MB/s(2)写操作时,第一个时钟周期接收地址,第二个为延时周期,另用4个周期传送一个块。写操作的总线传输

2021-07-18 18:07:12 2172 6

原创 计组——关于二进制除法的一些思考

由于时间比较紧张,所以这次写的博客比较粗糙,望各位海涵,如果哪里写错了,您可以评论或者私聊指出我的错我,我一定马上改正。谢谢。原码除法恢复余数法????我们面临的问题如何确定某个位置应该商几?如果这个位置商1的话,则如下好家伙,根本不够减,赶紧拿出橡皮擦擦掉刚刚的1,换成0,然后继续计算。但是计算机还是比人笨的,我们人类能直接擦掉重新改,但是计算机可以吗?如果您看过我之前的博文,或者了解计算机内部的乘法计算,就应该知道,计算机在计算乘除法的时候使用寄存器来存储中间结果,比如乘法的部

2021-07-11 21:50:52 1265 10

原创 计组——关于补码乘法的一点思考

文章目录原码一位乘原码两位乘补码一位乘校正法????前置知识:????校正法的原理:Booth算法????前置知识????Booth算法基本思想温馨提示,本文章着重于理解算法思路,充斥着大量的推导以及笔者说梦话似的自言自语,能力有限,无法完整详实地把这个过程表达出来,自己的理解也很不到位,望多包涵。错误请直接指出,我看到后会立马改正,谢谢大家监督。原码一位乘符号位单独计算,对于数值部分,则只需要像正常乘法那样比如x=−0.1110,y=−0.1101x=-0.1110,y=-0.1101x=−0.1

2021-07-03 23:06:06 1758 9

原创 计算机网络课程设计——路由表查询

要求设计题目: 路由器查表过程模拟设计要求: 编程模拟路由器查找路由表的过程,用(目的地址 掩码 下一跳)的IP路由表以及目的地址作为输入,为目的地址查找路由表,找出正确的下一跳并输出结果。温馨提示:①:本项目使用python完成②:由于时间紧张,只做了基本的路由表查询,默认路由表和指定路由表没有做③:本项目在老师要求的基础上做了进一步拓展,使用了数据库,并添加了自动构造路由表的功能,参考时请谨慎选择④:构造路由表的时候我想使用BellmanFord算法,但是没有成功,只采用了BFS单元最短路

2021-06-29 11:21:32 3181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除