自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 基于 图神经网络 + 知识图谱 的推荐系统 1

ACM2019论文阅读KGAT: Knowledge Graph Attention Network for Recommendation1.前言​ 首先是对于阅读的总结,收集了最近的知识图谱在推荐中的应用,简单分类,先从知识图谱和图神经网络的融合开始.把对于论文的一些总结写在最开始:动机1.传统的推荐系统只是将用户的行为作为独立的实例来进行训练模型,但是实体之间是存在很多的高阶的关系的,为了捕获这些高阶的关系,考虑将知识图谱和 用户-项目图进行融合,对传统的协同过滤进行一些补充2.传统的混合

2020-12-29 19:18:17 4993 1

原创 回溯-数独问题-Python实现

重新开始刷算法题了,在这记录一些题型的解法1.回溯问题1.1数独问题解题思路首先构建一个检查函数,传入当前的数独矩阵以及需要检查的位置,返回需要尝试的数字集合 num_choice将需要填写的位置全部存入集合中构建递归函数 输入是位置列表以及当前填写的数独矩阵 1.如果待填为空,表示已经完成,返回True 2.获取第一个需要填写的位置的可能的数字集合,如果为空表示填写失败,返回上一级 3.对数字集合中的每一个数字尝试填入数独矩阵,并递归调用填写下一个 如果返回为True 表示后续填写

2020-09-16 09:56:05 229

原创 sklearn中多分类问题各指标的计算

sklearn中api介绍常用的api有accuracy_scoreprecision_scorerecall_scoref1_score分别是:​ 正确率​ 准确率 P​ 召回率 R​ f1-score其具体的计算方式:accuracy_score只有一种计算方式,就是对所有的预测结果 判对的个数/总数sklearn具有多种的计算方式,其中每一种模式的说明如下:...

2020-02-20 14:37:39 4162

原创 Linux下anaconda安装问题

1.安装首先是在anaconda的官网下载对应版本的anaconda包https://www.anaconda.com/将包传至linux中可以使用xshell的rz传输或者使用xftp直接拖拽式将文件上传然后使用bash 安装包路径进行安装,一路yes到最后即可2.出现的问题完成安装后发现不论是conda还是python都无法正常的使用conda会显示命令不存在pyth...

2020-01-19 14:48:49 192

原创 主题词获取

获取文档的主题词最近工作中需要提取文本数据的主题词,所以就整理了一下相关的方法tf-idf首先是wiki的定义tf-idf(英语:term frequency–inverse document frequency)是一种用于信息检索与文本挖掘的常用加权技术。tf-idf是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成...

2020-01-16 11:43:30 866

原创 python 中的iter()

iter(self)在定义一个类时,添加这个函数,其返回的类就是一个可迭代对象和其一起使用的还有__next__(self)其作用是在调用next函数时执行这个函数下的内容,并返回return后的内容先来看一个示例:class Test(object): n = 0 def __iter__(self): print('iter',self.n) ...

2020-01-13 16:10:14 1786

原创 xshell 无法连接linux

可能是因为ssh服务没有启动无法连接ssh直接输入sudo /etc/init.d/ssh restart出现Restarting OpenBSD Secure Shell server sshd再使用ps -aux | grep ssh查看是否开启了ssh...

2020-01-10 17:36:03 181

原创 LDA模型的封装

#conding=utf-8import codecsimport refrom os import mkdirfrom os.path import exists, isdir, abspath, joinimport gensimimport jieba.posseg as psegimport yamlfrom gensim import corpora#1.数据处理工...

2020-01-09 19:04:23 245

原创 gensim训练LDA实战

gensim中lda模型的使用1.首先是模型的训练1.1 数据格式在使用gensim训练LDA模型之前需要先训练一个词袋模型词袋模型的输入数据是分词后的词列表多个数据时就是列表套列表,如:[[想,买辆,汽车]]1.2 构建词典from gensim import corpora, modelsdictionary = corpora.Dictionary(train)词典可...

2020-01-08 18:22:42 3647 2

原创 nlp中一些好的模型的地址

1.word2vec模型https://github.com/Embedding/Chinese-Word-Vectors

2019-12-31 15:10:31 154

原创 docker 安装问题及解决

在linux18.04中,按照网上的教程安装docker安装完成后使用sudo docker run hello-world 出现错误其原因应该是没有启动docker服务按照网上的教程使用sudo systemctl start docker启动出现以下的错误:System has not been booted with systemd as init system (PI...

2019-12-26 15:57:45 606

原创 Python栈实现数制转换

1.原理数值转换的原理是整除取余,但是计算得出的顺序和输出的顺序是相反的即先算出的结果在最低位,此时就需要使用栈来存储运算结果2.代码实现def transform(x:int,a:int): ''' 输入要转换的数字以及目标进制输出转换后的字符串 :param x: 要转换的数字 :param a: 进制 :return: 字符串 '''...

2019-12-12 10:20:42 618

原创 Python 栈实现对括号的匹配

使用栈实现对括号的匹配性检测能够包含的括号有三种(){}[]每当出现一个类型的左括号,就会期待一个右括号与之匹配,并且后出现的括号应该先匹配到,即紧急程度高.这种问题的描述称为期待急迫程度括号匹配时会出现三种错误:​ 到来的括号不是期待的​ 到来的是不速之客,即右括号多了​ 直到结束也没有到来所期待def check(str1:str): ''' 对输入的表达式检验...

2019-12-12 10:20:17 345

原创 LDA 学习笔记

1.LDA算法的介绍1.1 算法的基本知识隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)​ 和机器学习中的线性判别分析(Linear Discriminant Analysis)不一样首先是对狄利克雷分布的大致介绍​ 其就是对多项分布的先验分布.先验分布就是指对于可能出现的分布给出一个预设分布(根据背景知识),然后根据实际的样本信息去更新这个分布,最...

2019-12-11 17:28:30 1467

原创 西瓜书AdaBoost算法笔记

AdaBoost 算法有多种推导方式,比较容易理解的是基于"加性模 型" (additive model),即基学习器的线性组合即每一个个体学习器会有一个用于累加的权值,该权值是根据个体学习器的准确性来确定的,通过最小化个体学习器的加权损失得来(后面会推导).算法流程的推导过程:1).指数损失函数的可行性证明指数损失函数的表达式为:H(x)是最终学得的集成学习器,而f(x)是样本的真...

2019-08-06 14:05:21 879 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除