追赶早晨-CSDN博客

sklearn类库基于Numpy 和 Scipy构建；Numpy拓展了Python以支持大数组和多维矩阵更高效的操作（基本元素都是array）；Scipy提供了用于科学计算的模块；（有出名的稀疏矩阵）matplotlib也经常会联合一起使用包含了转换器和估计器这三个方法是所有特征预处理中都会有的！sklearn.preprocessing 中都是保存了各种特征处理函数！里面主要是fit 和 transform以及 fit_transformfitfit方法进行了一些转换准备工作，比如将标签字

2022-05-31 19:13:19 834

原创 python编程中的经验（一直更新）

怎么让两个list或者其它可以迭代的放到一起1. 可以使用zip2. 可以使用索引for i in range(len(xxx)): list[i]

2022-05-20 01:28:34 470

原创推荐系统常用评价指标和代码实现

一、评价指标Recall名称：召回率（真阳性率）意义：在推荐系统中，我们只关心正确推荐的有多少，也就是用户真实喜欢的，并不会关心推荐错的，所以我们用召回率，而不是准确率；理解这个前提：混淆矩阵混淆矩阵：详细的可以自己去了解Recall = TP / (TP + FN)也就是你所有预测为True的里面，到底有多少是真实值！Recall@n指的是推荐的前n个的召回率有多少代码实现比较简单ROC(AUC)名称： Curve曲线， AUC是ROC下面的面积意义：R

2022-04-08 22:29:48 2461

原创（二十七）【2021 WWW】Learning Intents behind Interactions with Knowledge Graph for Recommendation

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OpZWgm7T-1634540652258)(C:\Users\小轩\AppData\Roaming\Typora\typora-user-images\image-20211018091530075.png)]创新性提出了新的GNN聚合方案提出了意图图，每个意图图是将每个intent建模为KG关系的attentive combination！关系和关系之间也是有关系的，他们相互依赖可以同时决定了用户的选择摘要差

2021-10-18 15:05:34 605 2

原创（二十六）【2021 WWW】Knowledge-Preserving Incremental Social Event Detection via Heterogeneous GNNs

题目： Knowledge-Preserving Incremental Social Event Detection viaHeterogeneous GNNs中文题目：基于异构gnn的知识保持增量社会事件检测学习目标学习怎么知识增强的？学习怎么处理时间等多个因素的？学习怎么构建子图的？学习怎么对新类型有鲁棒性的？ABSTRACTSocial events: 就是比较大型的新闻，引起了人们的关注！检测和分析这些事件有助于提取有价值的洞见。在危机管理、产品推荐和决策等领域有很多应用.

2021-09-27 21:30:31 651 1

原创【KPGNN】运行错误与成功后的合集

出错合集1. AssertionError这句话的意思是： DGLGraph.readonly已经不可用了，而现在高版本的DGLGraph总是支持mutable！记住是总是，一直！！！所以现在由于版本问题，使用了高版本，原文中 DGLGraph.readonly肯定是False的，所以直接默认为True了2. 安装en_core_web_md第一种方法：https://blog.csdn.net/Jean001100/article/details/106203318/第二种方法：从

2021-09-26 23:19:19 632 2

原创常见报错原因

因为经常犯这个错，但是还不记住！以此来告诫自己！1. KeyError表示当前Key就没有！！！去检查一下，你出错的字典或者是列表（一般出这个错误肯定有个对照！）！是不是这个key值就没在里面？总结一定要自己看出错信息！要遵循源代码的输入输出格式！看看它怎么读的！明白数据的变化形式...

2021-09-26 16:01:21 1242

原创记录F1分数和召回率

参考博文：F1分数对于上面说的矩阵是不是挺懵的，它的真名叫混下矩阵，看下面混淆矩阵所有正确的预测结果都在对角线上，所以从混淆矩阵中可以很方便直观的看出哪里有错误，因为他们呈现在对角线外面。它允许我们做出更多的分析，而不仅仅是局限在正确率。准确率对于分类器的性能分析来说，并不是一个很好地衡量指标，因为如果数据集不平衡（每一类的数据样本数量相差太大），很可能会出现误导性的结果。例如，如果在一个数据集中有95只猫，但是只有5条狗，那么某些分类器很可能偏向于将所有的样本预测成猫。整体准确率为95%，但是

2021-09-26 14:26:17 346

原创（二十五）【NIPS 2017】Prototypical Networks for Few-shot Learning

完全参考博文用来记录和学习Introduction原型网络的思路非常简单：对于分类问题，原型网络将其看做在语义空间中寻找每一类的原型中心。原型中心：针对Few-shot的任务定义，原型网络训练时学习如何拟合中心。学习一个度量函数，该度量函数可以通过少量的几个样本找到所属类别在该度量空间的原型中心。聚类中心：测试时，用支持集（Support Set）中的样本来计算新的类别的聚类中心，再利用最近邻分类器的思路进行预测。本文主要针对Few-Show／Zero-Shot任务中过拟合的问题进行研究，将原

2021-09-23 09:36:23 225

原创【Text_classification】 PaddlePaddle框架下出错调整到运行的实验和记录

下载的模型存储到这里了！！是不是包含了头介绍：就是是不是有第一行的标签！！！是这个函数有问题：我们在base_NLP_dataset中将源码调整为label 是第一列！ text文本是第二列！但是这样是有问题的！原因一：我们pycharm中改正可能在linux下没有改正原因二：这样改正还是不行的！所以我们直接在原文件中将两列互换！两列互换 DF yydsimport pandasimport pandas as pd实现行列互换 DF yydspath = ".

2021-09-22 22:44:59 270

原创【Text_Classification】学习到的语法知识

1. 主任务：字典中每个种类的准确率1.1 分母：首先计算每个种类的总数！for value in label: # get(value, num)函数的作用是获取字典中value对应的键值, num=0指示初始值大小。 label_cout[value] = label_cout.get(value, 0) + 1 label_acc[value] = label_acc.get(value, 0)print(label_cout)print(label_acc)

2021-09-22 22:42:28 192

原创安装pp框架

第一步：创建环境conda create --name pp37 python=3.7第二步：激活环境conda activate pp37第三步：官方安装conda install paddlepaddle-gpu==2.1.3 cudatoolkit=10.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/...

2021-09-19 21:51:36 133

原创（二十四）【2021 ACL】OntoED: Low-resource Event Detection with Ontology Embedding

题目： OntoED: Low-resource Event Detection with Ontology Embedding论文链接： https://arxiv.org/abs/2105.10922论文代码：https://github.com/231sm/Reasoning_In_EE创新本体嵌入，这里的本体指的是？是不是指的是包含了事件类型，事件的属性？摘要存在的问题：Event Detection(ED)事件检测的目的是从给定的文本中识别事件触发词，并将其分类为事件类型。.

2021-09-17 22:39:41 669

原创知识图谱论文阅读（二十三）【SIGIR2020】Multi-behavior Recommendation with Graph Convolutional Networks

题目： Multi-behavior Recommendation with Graph Convolutional Networks论文地址：论文代码：想法将相同行为的交互方式进行了聚合来计算user Embedding和item Embedding创新模型要做的事情就是user-item传播层学习行为影响力度，item-item传播层去捕获行为语义摘要过去的问题：传统的推荐模型仅仅利用一种用户-物品的交互数据，如购买行为，因而综述遭受数据稀疏和冷启动的问题，但是该用户可能没有购买，只.

2021-09-14 20:32:19 1875 6

原创知识图谱论文阅读（二十一）【SIGIR2019】NGCF: Neural Graph Collaborative Filtering

题目：Neural Graph Collaborative Filtering代码： https://github.com/xiangwang1223/neural_graph_collaborative_filtering本文参考了博文想法创新摘要难点：原有的基于推荐系统的方法（早期是矩阵分解，现在是深度学习）都是根据ID和属性等存在的特征来获得一个用户或者是item的表示，我们认为现在方法的缺点就是没有考虑collaborative signal，这是潜伏在用户-物品交互中，没有编码的.

2021-09-13 19:53:08 553 2

原创知识图谱论文阅读（二十）【WWW2020】Heterogeneous Graph Transformer

题目： Heterogeneous Graph Transformer论文链接： https://arxiv.org/abs/2003.01332代码链接：https://github.com/acbull/pyHGT论文异构图研究之一：使用元路径来建模异构结构heterogeneous graphs 《Mining Heterogeneous Information Networks:Principles and Methodologies》 2012 Morgan & Cl.

2021-09-09 22:36:29 1028

原创（十九）【AAAI2021】Knowledge-Enhanced Hierarchical Graph Transformer Network for Multi-Behavior Recommend

题目： Knowledge-Enhanced Hierarchical Graph Transformer Network for Multi-Behavior Recommendation论文链接：代码链接：https://github.com/akaxlh/KHGT论文时间戳放入到关系中，可以参考这篇《Heterogeneous graph transformer》和《Attention is all you need》想法看题目就可以明白这里的主体是多行为（包括浏览，添加购物车等.

2021-09-08 21:59:31 3209 8

原创知识图谱论文阅读（十八）【KDD2019】AKUPM: Attention-Enhanced Knowledge-Aware User Preference Model for Recommend

论文题目： AKUPM: Attention-Enhanced Knowledge-Aware User Preference Model for Recommendation论文代码：论文链接：想法什么叫折射到关系空间？什么叫做自适应？创新实体和用户；怎么计算重要性的？实体本身；怎么考虑关系引入实体本身特征的？摘要难点：KG的引入确实一定程度改变了冷启动和稀疏问题，但是也包含了许多不相关的实体来表示user的嵌入。很多论文并没有意识到该问题。我们：探索这些实体之间.

2021-09-07 22:33:44 1100 1

原创知识图谱论文阅读（十七）【WWW2021】DGCN: Diversified Recommendation with Graph Convolutional Networks

本论文是很明显是基于KGCN的！如果不懂KGCN，可以看我上一篇博文论文题目： DGCN: Diversified Recommendation with Graph ConvolutionalNetworks论文链接：论文代码：创新（1）和（2）没有改变生成阶段的顺序，而（3）则是存在实际问题。那么我们就是添加上游任务中，生成一个排序结果，而不仅仅是候选items + 多样性排序要有特定于多样性的设计，使的弱势类别更加容易获得摘要动机：多样性是衡量推荐items的一个关键因.

2021-09-06 18:45:48 2513 1

原创知识图谱论文阅读（十六）【WWW2019】Knowledge Graph Convolutional Networks for Recommender

题目： KGCN论文链接：代码链接：https://github.com/hwwang55/KGCN想法创新摘要为了充分利用KG中的信息，我们会扩展某个实体的感受野到multi-hop来捕获KG的高级结构信息和语义信息。数据集：电影、书籍和音乐推荐Introduction常用的KGE方法侧重于建模严格的语义相关性(如TransE[1]和TransR[12]假设头+关系=尾)，更适合KG补全和链接预测等图内应用，而不是推荐。一种常见的方法是设计一种图算法来利用图结构！也就是在图上传.

2021-09-05 22:23:31 952 1

原创【RippleNet】（一）preprocessor.py【未完】

首先读入的文件有movie和book和news三种，肯定会选择一种进行解析！下面我们以movies作为样例分析：本论文中使用的数据集是movie-1mratings.dat：分别是用户：：电影：：评分：：电影编号item_index2entity_id_rehashed.txt文件：内容：import argparseimport numpy as npRATING_FILE_NAME = dict({'movie': 'ratings.dat', 'book': 'BX

2021-09-02 22:24:46 824 1

原创知识图谱论文阅读（十五）【arxiv】A Survey on Knowledge Graph-Based Recommender Systems

论文题目： A Survey on Knowledge Graph-Based Recommender Systems论文链接：论文代码：想法论文摘要难点：当今推荐系统的难点：数据稀疏和冷启动；而基于KG的推荐系统不仅能减轻上面的两个问题，同时能提供可解释性。全文内容：全文将介绍两个方面：一方面，我们通过研究论文如何利用知识图进行准确和可解释的推荐来研究提出的算法。另一方面，我们介绍了在这些工作中使用的数据集。最后，提出了该领域的几个潜在研究方向。1. Introduction.

2021-09-01 21:46:42 1327

原创（十四）【RecSys 2016】Personalized Recommendations using Knowledge Graphs: A Probabilistic【看不懂】

题目： Personalized Recommendations using Knowledge Graphs: A Probabilistic Logic Programming Approach论文链接：代码：ABSTRACT利用知识图谱提高推荐系统的性能是一项重要的任务。过去已经提出了许多混合系统，它们使用基于内容和协作过滤技术的混合来提高性能。最近，一些工作侧重于使用外部知识图(KGs)来补充基于内容的推荐。在本文中，我们研究了使用通用概率逻辑系统ProPPR的三种基于KG的推荐方法...

2021-08-31 22:24:59 497

原创李宏毅机器学习（十一）meta-learning和ML一样是三个步骤

Meta-learning就是教会它怎么学！大家以为AI都是很牛，但其实就是在调参，在工业界怎么样子调参呢？使用1000GPUs，而学业界只有一张！我们知道Machine learning可以学出来，那么hyperparameters是不是能学出来呢？我们回顾一下Machine Learing！其实就是三个步骤：这里，我们定义了函数f(θ\thetaθ)，我们需要找到那个使得L(θ\thetaθ)最小的θ∗\theta^*θ∗! 同时使用fθ∗f_{\theta^*}fθ∗成为最终的模型训练！

2021-08-31 21:05:54 611

原创知识图谱论文阅读（十三）【2020 arXiv】Attentive Knowledge Graph Embedding for Personalized Recommendation

题目： Attentive Knowledge Graph Embedding for Personalized Recommendation论文链接：代码链接：知识图谱特征学习在推荐系统中的应用步骤大致有以下三种方式：BPThrough Time【5】Backpropagation: theory, architectures, and applications.（BPTT）处理数据集【4】Personalized recommendations using knowledge grap.

2021-08-31 19:50:24 1056 1

原创知识图谱论文阅读【十二】【KDD2020】使用贝叶斯图卷积神经网络推荐精确和多样化项目的框架【看不懂，待续】

题目： A Framework for Recommending Accurate and Diverse Items Using Bayesian Graph Convolutional Neural Networks作者：原文链接： https://www.researchgate.net/publication/343780326_A_Framework_for_Recommending_Accurate_and_Diverse_Items_Using_Bayesian_Graph_Convol

2021-08-30 22:06:21 856

原创知识图谱论文阅读（九）【转】推荐系统遇到知识图谱之MKR模型

文哥的学习笔记： https://www.jianshu.com/p/af5226c7fbbb知识图谱特征学习在推荐系统中的应用步骤大致有以下三种方式：依次训练的方法主要有：Deep knowledge-aware Network（DKN）联合训练的方法有： Ripple Network交替训练主要采用multi-task的思路，主要方法有： Multi-task Learning for KG enhanced Recommendation（MKR）1、MKR原理介绍由于推荐系统中的物品和知

2021-08-30 09:30:47 3156 12

原创推荐系统和知识图谱论文推荐

KDD2020Graph-based RecommendationA Framework for Recommending Accurate and Diverse Items Using Bayesian Graph Convolutional Neural Networks 【华为诺亚】An Efficient Neighborhood-based Interaction Model for Recommendation on Heterogeneous Graph 【Amazon】论文：

2021-08-30 08:59:45 5374

原创【十】推荐系统遇到知识图谱RippleNet

首先弄懂的问题：AUC用于二分类！为什么选择正阳性和伪阳性，而不是其它的！因为比如肿瘤，我们既要分对良性肿瘤为良性肿瘤（即便你是百分之百），还要分对恶性肿瘤为恶性肿瘤，否则会有严重的问题！然后这就需要两个标准，正阳性和伪阳性！伪阳性：将真实类别为0的分成了1！至于为什么不选择正阴性，因为伪阳性和正阳性是反方向的！好做图！对于两个而言，本身是无关的！ TPrate和FPrate是无关的！它们只是列相关！行无关！对于一个概率而言，它要么是类1，要么是类0！如果该物体本身

2021-08-27 20:32:33 1604 1

原创知识图谱源码详解【八】init.py

import torchfrom src.model.DKN.KCNN import KCNNfrom src.model.DKN.attention import Attentionfrom src.model.general.click_predictor.DNN import DNNClickPredictor# 就是把整个模型框架梳理到一块了！ class DKN(torch.nn.Module): """ Deep knowledge-aware network.

2021-08-27 14:59:59 506

原创【DKN】（五）attention.py

import torchimport torch.nn as nnimport torch.nn.functional as Fclass Attention(torch.nn.Module): """ Attention Net. Input embedding vectors (produced by KCNN) of a candidate news and all of user's clicked news, produce final user emb.

2021-08-27 14:47:55 259

原创【DKN】（六）KCNN.py

内容import torchimport torch.nn as nnimport torch.nn.functional as Ffrom src.model.general.attention.additive import AdditiveAttentiondevice = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")class KCNN(torch.nn.Module): """ K

2021-08-27 14:38:12 689

原创【DKN】（七）dataset.py【未完】

内容里面有的函数在这里https://blog.csdn.net/qq_35222729/article/details/119882362try: config = getattr(importlib.import_module('config'), f"{model_name}Config")except AttributeError: print(f"{model_name} not included!") exit()class BaseDataset(Data

2021-08-27 11:34:30 269

原创【DKN】（四）train.py

内容try: #不用多言，获得该模块下的model_name函数 Model = getattr(importlib.import_module(f"model.{model_name}"), model_name) config = getattr(importlib.import_module('config'), f"{model_name}Config")except AttributeError: print(f"{model_name} not included!

2021-08-26 22:33:17 608

原创如何并行运行程序

参考了官方文档， torch.nn.parallel.DataParallel以及https://zhuanlan.zhihu.com/p/102697821在运行此DataParallel模块之前，并行化模块必须在device_ids [0]上具有其参数和缓冲区。在执行DataParallel之前，会首先把其模型的参数放在device_ids[0]上，一看好像也没有什么毛病，其实有个小坑。我举个例子，服务器是八卡的服务器，刚好前面序号是0的卡被别人占用着，于是你只能用其他的卡来，比如你用2和3号卡，如

2021-08-25 14:38:30 815

原创【DKN】（二）config.py

class BaseConfig(): """ General configurations appiled to all models """ num_epochs = 2 #迭代次数 num_batches_show_loss = 100 # Number of batchs to show loss num_batches_validate = 1000 # Number of batchs to check metrics on validatio

2021-08-24 22:15:42 275

原创【DKN】（三）data_preprogress.py

内容try: # 以绝对导入的方式导入cofig对象，并获取其{model_name}Config！ config = getattr(importlib.import_module('config'), f"{model_name}Config")except AttributeError: print(f"{model_name} not included!") exit()这里就是config下的属性类下面是解析behavior.tsv文件， behav

2021-08-24 22:15:26 1356 4

空空如也

空空如也