自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 vscode jupyter 如何关闭声音

然后把user和remote的以下设置都设置为off就行了!网上之前搜的zen模式失败。仅仅降低sound失败。

2024-03-16 18:17:59 654 1

原创 怨种的服务器之旅

新的显卡的电源线是一转2的,因为昨天我安装的时候,没有找到第三根电源线,然后我还以为那个一转二,就和一转二的数据线一样,只需要插入一个。但是这样面临新的问题,现在的precision7920(大概是这个型号 瞎打的) 一共只能安装3个显卡,只有3个电源线。然后服务器原本是有一个显卡的,是之前安装显卡的工程师已经帮忙安装进了服务器的,这个显卡的转接电源线是一头的。(可以先试一下第二块新的显卡 用1转1的电源线 能否被识别,也就是电源啊供得上)所以以后如果要安装新的显卡,得记得买两个1转1的显卡的电源转接线。

2023-07-04 12:45:19 124

原创 【python/plt】散点图scatter 参数散点图绘制

观察最后一列数据,这里指的是一共4列,每一列第一个数据是深蓝色(?),第二个数据是浅灰,第三个数据是红色,第四个数据,也就是c[3]和第一个数据c[0]一样,都是用数字1代表,所以也是深蓝色。前面的0,1,2,3表示y第0列到第3列的数据。观察第一列,其实坐标(0,1)出现了三次,三个圈圈颜色不一样都在坐标(0,1)的位置,但是现在被最后出现的红色覆盖了。这里的s=args.s1代表散点中散点的大小,我这里设置为100,这可能是和画布大小有关。当c为浮点数的时候,就会按照浮点数的大小显示cmap的颜色了。

2023-04-07 00:42:27 2066 1

原创 Git 和Bitbucket|Git和Github

git push --set-upstream origin master 这一行是push到Bitbucket的仓库。将所有更改的文件提交,要注意不能直接在最初的初始文件中(就是我们小黑框GIT中绿色master的那一行 地址)提交。git commit -m “输入提示信息” 表示 将暂存区的内容输入到本地仓库(不是很理解其实hh)2.2 我们新建一个空的文件夹,然后选择用Git Bash打开。第一行是输入的代码 接下来的都是提示信息。复制之后直接粘贴在Git中。1.创建一个新的仓库。

2022-11-08 20:06:52 1238 1

原创 【论文阅读】Category-aware Collaborative Sequential Recommendation

以前看过的 顺手做个笔记然而,大多数现有的解决方案都将用户的操作历史视为一个长序列。这种简化通常忽略了动作序列中的细粒度依赖结构。考虑图1所示的示例。对于用户Lily来说,从衣服到鞋子的重复转换表明她的下一个动作很可能与鞋子有关,而她之前浏览的鞋子系列表明她对运动鞋的总体偏好。但她最近浏览的商务套装表明,她目前的意图是穿正装。因此,系统不再适合按照她的一般喜好来推荐运动鞋;相反,推荐正式的鞋子成为更好的选择。这样的观察告诉我们,再次考虑图1中的示例。

2022-10-26 23:06:33 1049 2

原创 【论文阅读】先验规则-Controlling Neural Networks with Rule Representations

提出一个模型:DEEPCTRL下图是模型算法的描述我们建议通过引入数据编码器ϕ和规则编码器ϕ这两个通道来改进规范化训练方法。这样,我们的目标是,对应于从标记数据和规则中。然后,将这两个表示,得到一个。我们使用的是小批量训练,就是有D的存在。为了调整数据与规则编码的相对贡献,我们使用,它也将(zd, zr)与相应的目标(Ltask, Lrule)耦合(算法1中的第4和第5行)。。

2022-10-25 11:12:30 1020 1

原创 【论文阅读】A statistical analysis based recommender model for heart disease patients

在这种技术中,计算信息增益,即给定类的每个特征的熵。数据划分为训练集和测试集->数据预处理->选择重要的特征->用一些基础的分类器进行分类->预测结果。我们主要是对心脏病进行一个疾病预测(四选一),然后进行建议的匹配,这个建议来源于专家建立的知识库。F代表critical属性集合(f1:氧饱和度,f2:血压,f3:胆固醇,f4:血糖)第一阶段实现一种属性计算器技术,该技术针对输出类计算数据集的特征。使用了阈值对信息增益进行了一个下线的划分,以得到最重要的属性。这里主要是把建议也给分类了,分成了5类。

2022-10-24 23:37:32 600 1

原创 【论文阅读】Dual-level diagnostic feature learning with recurrent neural networks for treatment sequence r

接着我们使用element attention 来学习 治疗项目和对应的CTRs的优先级(不同的治疗项目和结果会对后续产生影响,我们给他们分配一个权重,然后把治疗项目和对应的CTRs的嵌入进行一个结合,得到一个新的embedding,(或者是先contact成新的embedding,然后使用attention学习weight)(计算损失的时候计算的是 用户本来的治疗顺序集 以及 推荐的治疗顺序集)我们对治疗方案和治疗方案结果分别使用CBOW,进行一个密集的嵌入表示(主要原因:原本的数据维度又多,又稀疏)

2022-10-24 20:51:43 859 1

原创 【latex】latex排版/overleaf在线/画图那些事

by the waylatex事情是真的多排版永远都不在我希望它呆着的位置希望广大程序员努努力做出一个傻瓜式操作。

2022-10-06 22:31:50 1707

原创 plt画图那些事(配色+上下标)

提供几个链接emm系列色——十六进制颜色码:系列色——RGB颜色值:

2022-09-28 10:03:28 1635

原创 【】评价指标 mrr accuracy recall

来自。

2022-09-26 22:59:12 563

原创 【python plt】解决画布和绘图区的问题

主要注意一个 bbox_inches=‘tight’ 这个代码会让你的绘图框周围的空白被自动裁剪到合适的位置,所以其实会改变前面的画布设置。第一行是调整画布大小,7和5的单位是inch,也就是说你产生的图片实际上的大小像素是 宽:7 * 450,高:5 * 450。这一行是 调整绘图框相对于画布的距离的,注意这边会对绘图框进行压缩,然后float取值在0到1内。然后现在的问题是实际上的绘图框还是会收到画布的限制,就是还是会动。我希望是改变画布,但是绘图框大小不改变的。这个问题今天没有解决。

2022-09-22 21:12:36 7218

原创 optuna笔记

optuna.samplers.TPESampler 实现的 Tree-structured Parzen Estimator 算法。optuna.samplers.CmaEsSampler 实现的 CMA-ES 算法。optuna.samplers.RandomSampler 实现的随机搜索。optuna.samplers.GridSampler 实现的网格搜索。

2022-09-16 23:18:48 266

原创 【python】pyi文件

pyi文件是一个Python skeleton,具有适当的结构、调用签名和返回值,以匹配模块中定义的函数、属性、类和方法。pyi文件中允许使用"…"代替任何实现细节。它是仅包含类型信息的文件,没有运行时代码。rnorm是通过那个只有申明类型的pyi文件得到的?就是只有类型的声明 我不知道具体是怎么实现的。存根文件仅包含模块公共接口的描述,没有任何实现。pyi文件是存根文件(stub file)我想查看细节但是不知道怎么看。怎么生成pyi文件的教程在。pyi文件具体的作用在。

2022-09-09 15:14:15 979

原创 【推荐系统】顶会文章

最近略读的几篇推荐系统的文章,稍微整理一下相关的内容、方法和模型,便于学习补充,之后有需要会在这个基础上补充整理。

2022-08-21 19:15:52 678

原创 【python】locals使用

简单记录一下K是变量locals()[‘recallM3K{}’.format(K)]=recall_df。

2022-07-25 20:57:46 303

原创 【python】关于matplotlib.pyplot的一些使用

图例的设置font1={‘family’‘TimesNewRoman’,‘weight’‘normal’,‘size’15,}plt.legend(prop=font1)坐标轴字体的设置frommatplotlib.font_managerimport*myfont=FontProperties(fname=‘C\Windows\Fonts\STSONG.TTF’)matplotlib.rcParams[‘axes.unicode_minus’]=Falseplt.yt。......

2022-07-23 13:02:58 185

原创 【论文阅读】【HLLDA】 A Hierarchical Model of Web Summaries

我们认为文档层次结构H(例如DMOZ层次结构)是一棵树,其中内部节点(类别节点)和叶子节点(文档),以及连接它们的边是先验已知的。关于DMOZ,网上搜到的一个dmoz网站进行了截图,不知道是不是这个意思。H中的每个节点Ni被映射到一个多项词分布MultNi,而到 叶节点D(文档)的每个路径cd 与 出现在这条路径上的多项混合物(MultC0 . . . MultCk, MultD) 相关。(好长一句话【原文(部分)】Each node Ni in H is mapped to a multi-nomi

2022-06-18 02:56:17 192 1

原创 【LDA】吉布斯采样

吉布斯采样是用条件概率得到联合概率分布。其实是得到我们想要东西的近似解蒙特卡洛方法是为了解决一些不太好求解的求和或者积分问题。其实就是一个近似方法,通过采样的多个样本代替原本的连续函数,帮助我们把这个式子解出来。对于一些常见的概率分布p(x),如正态分布等,我们先通过一些公式将其转换为0-1之间的数,(均一化处理嘛,)然后进行采样。对于不太常见的概率分布f(x),我们用一个常见的概率分布(如高斯分布)q(x)把他蒙上,就是让 f(x)...

2022-06-16 03:19:30 1709

原创 【LDA】基础知识笔记——主要是AE、VAE

似然函数

2022-06-06 23:29:26 265

原创 【LDA】EM变分推理 粗略版笔记【待完善

大佬说的很详细了 :csdn_机器学习之潜在狄利克雷分配(LDA)变分EM算法及python实现简单概括一下:思想:(原文摘录:)假设模型是联合概率分布p(x,z),其中 观测变量x , 隐变量 z ,包括参数。目标是学习模型的后验概率 p ( z ∣ x )。[tip:已知x,求隐变量z]但是这个分布复杂无法直接求解,所以考虑用概率分布 q ( z ) 来近似条件概率分布 p ( z ∣ x ),之后用KL散度KL(q(z)||p(z|x)) 计算两者之间的相似度,q(z)称为变分分布。KL散度

2022-06-06 22:59:51 123

原创 【Python】爬虫基础练习(jd wap为例)-selenium+详情页

仅作学习练习python使用。jd(wap)一面有60个商品,有100页。打算就爬前15面的商品练一下能跑通就行。主要用selenium\dataframe粗略分为这几步:1.打开搜索主页

2022-06-05 23:45:00 390

原创 【LDA】LDA主题模型笔记—主要是狄利克雷

d表示文章,z表示主题,w表示单词这里意思是,狄利克雷先验分布 产生 一组 多项式分布集合也就是说 狄利克雷分布 产生 主题分布 (也就是doc-topic分布)(超参数 α\alphaα情况下 )贝叶斯思想中:先验概率+参数估计=后验概率在beta分布中 beta分布研究的是 “一个长度为k的乱序序列(序列中每个数符合均匀分布)中,第k个大的数满足什么分布”的问题。(链接中对应部分的含糊自我概括版),也就是说,对于序列中每个数,beta可以给出这个数的一个分布,也就是说,对序列中的每个数,只要知道

2022-06-04 04:24:28 770

原创 【pytorch】expected scalar type Double but found Float

总结,发现了两种解决方法。大佬1解释的很详细了,tensor.to(torch.float32) 但其实这里面的tensor指的是tensor类型的数据在你自己的代码上他可能是x可能是data 这个要你自己多尝试我的代码例子:bow=[[1,0,1,1,1,0,0],[1,1,1,0,0,0,1],[0,1,1,0,0,1,0]]enc_1=torch.nn.Linear(7, 10)en1=torch.relu(enc_1(bow))#原本我的转变方式:(float32->64

2022-05-06 04:30:19 1217

原创 【论文阅读】Out-of-Town Recommendation with Travel Intention Modeling

[1] Xin H , Lu X , Xu T , et al. Out-of-Town Recommendation with Travel Intention Modeling[J]. 2021.这篇之前我好像看过,这次做好详细的笔记吧、——话虽如此,基本就是原文的翻译了。目录0.Abstract1.Introduction传统的不足我们的工作我们的贡献一句话概括2.Problem Definition 问题定义Definition 1 (POI)Definition 2 (Check-in

2022-03-23 05:32:41 258 1

原创 【日常】codeblocks无法运行c++

这个问题百度了很久,都说是没有MinGW-w64,然后一直试登录MinGW-w64的官网,进不去。知乎这个链接有人放了一个压缩包。下载解压,打开codeblocks的setting-compiler.把compiler’s installation directory的地址改了一下,改成MinGW-w64文件的地址,就能运行了。...

2022-03-19 23:36:34 1899 1

原创 【论文阅读】Attributed Graph Clustering via Adaptive Graph Convolution(2019 IJCAI)

[1] Zhang X , Liu H , Li Q , et al. Attributed Graph Clustering via Adaptive Graph Convolution[J]. 2019.这篇没看透呢。后面的没有精读下去,公式太多,半懂不懂。有两个相关链接可以参考。文章目录Abstract1 Introduction3 The Proposed Method3.1 Problem Formulation3.2 Graph ConvolutionAbstract属性图聚类具

2022-03-19 04:48:23 927

原创 【论文阅读】未仔细阅读论文列表-相关性可能不大

目录可以略读一下1.Improving Neural Text Style Transfer by Introducing Loss【摘要】【一点内容】2.Knowledge-based Review Generation by Coherence Enhanced Text PlanningSIGIR ’21, July 11–15, 2021, Virtual Event, Canada【摘要】3.LAST at SemEval-2021 Task 1: Improving Multi-Word Com

2022-03-19 02:44:39 671

原创 【论文阅读】Merging Statistical Feature via Adaptive Gate for Improved Text Classification基于自适应门的统计特征合并改进

Merging Statistical Feature via Adaptive Gate for Improved Text Classification来自期刊AAAI 2021年的文章信息如下图所示(作者…)和之前的论文阅读专栏一样,只对部分进行翻译、截取、笔记。目录1. Introduction2.Related Work2.1 Text classification2.2 Classifier with additional knowledge3. Methodology3.1 Glob

2022-03-12 03:12:24 847

原创 【论文阅读】Heterogeneous Graph Neural Network via Attribute Completion (WWW ‘21)【异构图神经网络】

同构图 homogeneous graphs异构图 heterogeneous graphs异构信息网络 Heterogeneous information networks (HI

2022-03-08 21:54:20 5448

原创 【论文阅读】 略读 融合FastText模型和注意力机制的网络新闻文本分类模型

[1]王婉,张向先,卢恒,张莉曼.融合FastText模型和注意力机制的网络新闻文本分类模型[J].现代情报,2022,42(03):40-47.

2022-03-08 02:35:08 316

原创 【论文阅读】略读 基于注意力门控图神经网络的文本分类

基于注意力门控图神经网络的文本分类[1]邓朝阳,仲国强,王栋.基于注意力门控图神经网络的文本分类[J/OL].计算机科学:1-14[2022-03-06].http://kns.cnki.net/kcms/detail/50.1075.TP.20220223.1642.022.html.本文将每个输入的目标文本转换为独立的图结构数据,将文本中的单词作为节点,在节省内存资源消耗的同时保证了节点的特征表达能力.同时,为了有效地利用单词的语义特征信息,并在单词节点之间进行充分的语义信息交互,本文提出了注意力

2022-03-07 03:30:24 2605

原创 【论文阅读-未完待续】A Novel Neural Topic Model and Its Supervised Extension

来源百度就可以一篇之前看过的文章,但是有些记不住,打算做成博客记录完善一下。首先直接上模型图。1.输入层(g, d):n-gram g = w1,···,wn,文档ID d∈D,其中D是文档集2.n-gram嵌入层(le∈R 1×300):这一层的目标是用分布式嵌入表示来表示每个n-gram。使用在大型谷歌News数据集(大约1000亿个单词)上训练过的可用工具word2vec1,每个单词或短语由一个300维的嵌入向量表示。那么对于任意n-gram g,如果g在词汇表中,我们直接使用它的嵌入

2022-03-05 18:33:59 383

原创 【深度学习】神经网络CNN-基础整理

主要来源:《卷积神经网络研究综述》周飞燕等会在这个框架上慢慢补充。一.CNN基本知识1.神经元神经元是人工神经网络的基本处理单元,一般是多输入单输出的单元.输入与输出之间的对应关系其中:xi : 输入信号;n个输入信号同时输入神经元j.wij : 输入信号xi与神经元j连接的权重值;bj : 神经元的内部状态即偏置值;yj : 为神经元的输出.f(·)为激励函数,其可以有很多种选择,可 以 是线性纠正函数 (ReLu)、sigmoid函数、tanh(x)函数、径向基函数等2.多层

2022-02-22 03:07:14 2437

原创 【论文阅读】基线论文 Deep Neural Networks for YouTube Recommendations

Deep Neural Networks for YouTube Recommendations ,百度就可以。推荐YouTube的视频会在三个主要角度上受限:规模(Scale)(YouTube的数据太大的,比以往算法成熟应用的数据集都要大),(新鲜度)(Freshness)(YouTube视频库动态更新快,推荐系统对新内容建模),噪音(noise)(算法需要对个别特征有鲁莽性)

2022-02-21 03:09:35 714

原创 【机器学习-分类】决策树预测

用一些机器学习的算法对数据进行一个分类,下面是一些需要用到的基础代码,并不包括针对项目的模型处理和修改,留作记忆学习。对于数据划分训练集直接省略def Tree_score(depth = 3,criterion = 'entropy',samples_split=2): #构建树 tree = DecisionTreeClassifier(criterion = criterion,max_depth = depth,min_samples_split=samples_split) #训

2022-02-17 16:45:21 1501

原创 负采样Negative Sampling

1.噪声对比估计(Noise contrastive estimation)语言模型中,根据上下文c,在整个语料库V中预测某个单词w的概率,一般采用softmax形式,公式为:为了避免巨大的计算量,NCE的思路是将softmax的参数估计问题 转化成 二分类。二分类两类样本分别是真实样本和噪声样本:正样本:经验分布生成的(即真实分布)标签D=0,负样本:噪声,由q(w)生成 对应标签D=1。从正样本中提取一个,从噪声分布中提取k个噪声样本,在总样本(真实样本+噪声样本)中,w代表预测的目标词。

2022-02-13 23:20:18 2327

原创 【损失函数】熵/相对熵/交叉熵

便于理解但是不够精确的说法:熵:一种可能性的所有的信息量相对熵(KL散度):真实分布与预测的分布的信息量的差(真实-预测),值越小说明与真实约接近。交叉熵:由kl散度公式变形而得,式子拆开来前半部分是熵后半部分就是交叉熵。因为前面的熵不变,所以优化的时候直接用交叉熵计算损失更加方便。参考文献https://blog.csdn.net/tsyccnh/article/details/79163834...

2022-02-11 23:25:03 522

转载 【python-matplotlib学习】plt保存图片 (保存空白,dpi)

今天用plt.savefig保存的图片是空白的,而且很糊,百度了一下把修改写在下面记录一下,方便以后复习查阅。 plt.savefig('pic1.jpg', bbox_inches='tight', dpi=450)如果保存的图片是白色的空白,检查一下前面是不是写了plt.show,至于原因俺也不知道为什么dpi是设置清晰度。参考:https://blog.csdn.net/weixin_45237889/article/details/104137880...

2022-01-26 19:41:07 3617

原创 18章记录过程

进入虚拟环境虚拟环境中安装django新建一个文件夹记得使用django-admin 而不是django-admin.py 这里和书上不一样输入dir可以查看目录被创建出来的文件夹里的东西创建数据库:python manage.py migrate检查是否创建了项目 runserverpython manage.py runserver打开浏览器 输入之前打印的网址 查看状态激活虚拟环境打开另外一个终端 切换到manage.py的目录 激活虚拟环境 starta

2020-06-14 03:30:22 75

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除