- 博客(109)
- 收藏
- 关注
原创 归一化互信息(NMI)评价指标
信息熵对信息进行量化度量。可以理解为某种特定信息的出现概率。计算公式相对熵【百度百科】相对熵(relative entropy),又被称为Kullback-Leibler散度(Kullback-Leibler divergence,KL散度)或信息散度(information divergence),是两个概率分布(probability distribution)间差异的非对...
2019-03-24 23:23:13 44220
转载 SciPy中稀疏矩阵的处理
在矩阵中,若数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律时,则称该矩阵为稀疏矩阵。 ——来自百度百科。为什么会用到稀疏矩阵,最近在做协同过滤算法时,调用评分图和信任图,数据的稀疏程度达到99.9%,这样的数据存储到内存中,0会占据大量的内存,本想无所谓,但奈何内存放不下这样的数据量,无奈进行稀疏矩阵的存储与计算。记录下学习笔记。知识来源:Scipy Lectur...
2018-10-06 18:07:14 5375 5
原创 DialoKG: Knowledge-Structure Aware Task-Oriented Dialogue Generation
《DialoKG: 知识结构感知面向任务的对话生成》学习笔记
2022-12-24 23:27:50 291
翻译 文本分类中的词袋vs图vs序列
图神经网络驱动了基于图的文本分类方法,成为了SOTA(state of the art)。本文展示了使用词袋(BoW)的宽多层感知器(MLP)在文本分类中优于基于图的模型TextGCN和HeteGCN,并且与HyperGAT相当。
2022-11-22 22:47:05 751 1
翻译 GNN for NLP综述
深度学习已经成为处理自然语言处理(NLP)中各种任务的主要方法。尽管文本输入通常表示为一系列标记,但有大量的NLP问题可以用图结构最好地表达。因此,为大量NLP任务开发新的图深度学习技术的兴趣激增。在这项调查中,我们对用于NLP的图神经网络(GNN)进行了全面综述。我们提出了一种新的NLP GNN分类法,它沿着三个轴系统地组织了NLP GNNs的现有研究:图构建、图表示学习和基于图的编码器-解码器模型。我们进一步介绍了大量利用GNN功能的NLP应用程序,并总结了相应的基准数据集、评估指标和开源代码
2022-11-21 13:18:24 789
翻译 新闻个性化推荐综述
MIND: A Large-scale Dataset for News RecommendationACL 20200. 摘要新闻推荐是实现个性化新闻服务的一项重要技术。与已经被广泛研究的产品推荐和电影推荐相比,新闻推荐的研究非常有限,主要是因为缺乏高质量的基准数据集。本文提出了一个名为MIND的新闻推荐大型数据集。MIND由微软新闻的用户点击日志构建而成,包含100万用户和16万多篇英文新闻文章,每篇文章都有丰富的标题、摘要、正文等文本内容。通过对几种最先进的新闻推荐方法的比较研究,证明了MI
2022-05-07 22:02:50 2639 1
原创 Airbnb Embeding学习笔记
Real-time Personalization using Embeddings for Search Ranking at Airbnb 学习笔记18年kdd的best paper0.背景介绍Airbnb提供了一个连接房主(host)挂出的短租房(listing)和主要是以旅游为目的的用户(guest/user,=租客,下文皆使用【用户】)的中介平台(需要注意的是在论文中房源使用的是「listing」进行表示)。Airbnb的交互方式比较简单,用户输入地点,价位,关键词等等,Airbnb会给
2022-03-13 12:40:24 789
转载 今日头条算法原理(全)— 2018
今天,算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时,算法也开始面临质疑、挑战和误解。今日头条的推荐算法,从2012年9月第一版开发运行至今,已经经过四次大的调整和修改。今日头条委托资深算法架构师曹欢欢博士,公开今日头条的算法原理,以期推动整个行业问诊算法、建言算法;通过让算法透明,来消除各界对算法的误解,并逐步推动整个行业让算法更好的造福社会。以下为《今日头条算法原理》全文。本次分享将主要介绍今日头条推荐系统概览以及内容分析、用户标签、评估分析,内容安全等原理。
2022-02-26 18:11:43 1691
转载 图分类研究综述
转载图数据广泛存在于现实世界中,可以自然地表示复合对象及其元素之间的复杂关联。对图数据的分类是一个非常重要且极具挑战的问题,在生物/化学信息学等领域有许多关键应用,如分子属性判断,新药发现等。但目前尚缺乏对于图分类研究的完整综述。首先给出图分类问题的定义和该领域的挑战;然后梳理分析了两类图分类方法—基于图相似度计算的图分类方法和基于图神经网络的图分类方法;接着给出了图分类方法的评价指标、常用数据集和实验结果对比;最后介绍了图分类常见的实际应用场景,展望了图分类领域的未来研究方向并对全文进行总结。图..
2022-02-19 11:39:16 3235
转载 深度解析京东个性化推荐系统
深度解析京东个性化推荐系统一、题记为了在于挖掘用户潜在购买需求,缩短用户到商品的距离,提升用户的购物体验。京东个性化推荐发展史京东推荐的演进史是绚丽多彩的。京东的推荐起步于2012年,当时的推荐产品甚至是基于规则匹配做的。整个推荐产品线组合就像一个个松散的原始部落一样,部落与部落之前没有任何工程、算法的交集。2013年,国内大数据时代到来,一方面如果做的事情与大数据不沾边,都显得自己水平不够,另外一方面京东业务在这一年开始飞速发展,所以传统的方式已经跟不上业务的发展了,为此推荐团队专门设计了新的推荐
2022-02-09 22:40:15 3434
原创 频繁模式挖掘(Frequent Pattern Mining)
频繁模式挖掘(FrequentPatternMining)频繁模式:从样本数据集中频繁出现的模式,是经常一起出现的模式。“模式”是一个比较抽象的概念,举个例子,比如在超市的交易系统中,记载了很多次交易,每一次交易的信息包括用户购买的商品清单。如果超市主管是个有心人的话,他会发现尿不湿,啤酒这两样商品在许多用户的购物清单上都出现了,而且频率非常高。尿不湿,啤酒同时出现在一张购物单上就可以称之...
2021-07-29 17:24:10 2968
原创 defaultdict用法详解
defaultdict用法详解defaultdict与dict区别defaultdict使用方法defaultdict与dict区别在dict中取key的值,若key不在dict中,报错,如下图:若用defaultdict,则不会报错,返回值是工厂函数默认参数值(工厂函数是list,返回[]。工厂函数是str,返回空字符串’’。工厂函数是set,返回set()。)。如下图:defaultdict使用方法from collections import defaultdict # 引入def
2021-06-20 16:01:22 661
原创 字节笔试题,求大数对(1e9+7)值取模结果
字节笔试题求2的100万次方对(1e9+7)取模的结果使用分治法求2的100万次方对(1e9+7)取模的结果提示 A=B*C,则A mod x=((B mod x))×(C mod x)) mod xA\bmod x = \left( {\left( {B\bmod x} \right)) \times \left( {C\bmod x} \right)} \right)\bmod xAmodx=((Bmodx))×(Cmodx))modx使用分治法21000000=2500000×2500000{
2020-09-21 15:21:12 5153 7
原创 centos7服务器安装并配置ssh
使用putty连接centos7服务器,失败如下1、检查是否安装先进入centos7服务器看查看是否安装SSHyum list installed | grep openssh-server若没有没有任何东西,则输入yum install openssh-server2、安装后进行配置安装后进行配置,使用vim编辑/etc/ssh/sshd_config文件...
2019-09-18 11:11:24 1592
转载 GBDT:梯度提升决策树
转载:GBDT:梯度提升决策树综述GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力较强的算法。 GBDT中的树是回归树(不是分类树),GBDT用来做回...
2019-09-04 15:09:57 321
原创 office 2016 中出现‘VBE6EXT.OLB’ 不能被加载
office 2016 中出现‘VBE6EXT.OLB’ 不能被加载VBE6EXT.OLB’ 不能被加载打开word, ppt, excel,会出现以下几个bugVBE6EXT.OLB’ 不能被加载在安装mathtype后,再打开word2016就会出现‘VBE6EXT.OLB’ 不能被加载,试着重装office也无用,找了很长时间。打开word, ppt, excel,会出现以下几个bug...
2019-07-02 10:10:49 5044 7
转载 17 张程序员壁纸推荐
转载:17 张程序员壁纸推荐1、三思后再写代码!!!2、从世界上搜索喜欢你的人!!!其他分辨率下载:1920x1080 1920x1200 2560x1440 2560x16003、代码没写完,哪里有脸睡觉!!!其他分辨率及 PSD 文件下载:http://static.runoob.com/download/mlcf.zip4、程序员的 Home 键!...
2019-06-25 09:58:53 9682
原创 win10安装windows terminal
效果图安装Windows Terminal 系统要求:安装链接,或者打开Microsoft Store,搜索windows terminal。配置背景文件:profile.json{ "globals" : { "alwaysShowTabs" : true, "defaultProfile" : "{61c54b...
2019-06-24 15:28:23 6110 1
原创 使用python按规则将文件复制到指定文件夹
import osimport shutilimport xlrddef open_excel(f_name="./test.xlsx"): """ 打开excel文件 :param f_name: 文件名 :return: data """ try: data = xlrd.open_workbook(f_name) ...
2019-06-01 17:21:04 2732
原创 Windows下R语言的使用
R语言的安装与配置,这篇教程写的挺详细的,这次不做叙述。重要的是安装完成之后,会下载和加载packages的使用最最重要的是下载和加载包的目录${R_HOME}\etc\Rprofile.site在此文件下添加一句.libPaths("C:\Users\codel\Documents\codel\R\win-library\3.5")如果不知道这个目录怎么来的,可以输入hel...
2019-04-15 18:05:41 2241
原创 ubuntu18.04 使用阿里源
与Ubuntu16.04更换源的方法一样但是替换sources.list代码如下:deb http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiversedeb http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted ...
2019-03-13 16:31:51 906
转载 提高git下载速度
对于搭建代理的,在命令行执行以下代码:git config --global http.proxy socks5://127.0.0.1:1080git config --global https.proxy socks5://127.0.0.1:1080
2019-03-13 16:14:02 1102
转载 用python实现 01矩阵写汉字
"""将汉字打印在文件@author: lyh"""import osimport pygameimport csvdef string_list(text, size): pygame.init() font = pygame.font.Font(os.path.join("C:\\Windows\\Fonts", "msyhl.ttc"), size)...
2019-02-28 14:38:38 1551 1
转载 Python将英文标点替换成空格
def remove_symbols(sentence): """ Remove numbers and symbols from ASCII """ import string del_estr = string.punctuation + string.digits # ASCII 标点符号,数字 ...
2018-11-07 22:10:47 14904
转载 为 Ubuntu Dock 启用最小化操作
Ubuntu Dock(位于屏幕左侧的任务栏)可以轻松打开,并且切换和管理应用程序与正在运行的应用程序。你可以点击 Dock 中的应用程序图标来切换它。但默认情况下,Ubuntu Dock关闭了此选项。你只需在 Terminal 应用程序中运行此命令,就可以轻松地为 Ubuntu Dock 启用最小化操作:gsettings set org.gnome.shell.extension...
2018-09-24 14:05:53 2247 1
转载 Ubuntu录制gif图
使用byzanz录制工具sudo apt-get install byzanz然后在命令行运行,查看byzanz的使用byzanz-record --help例如: byzanz-record --duration=3 --x=0 --y=0 --width=600 --height=200 screen.gif...
2018-09-24 14:03:54 346
原创 python numpy.array插入一行或一列
import numpy as npa = np.array([[1,2,3],[4,5,6],[7,8,9]])b = np.array([[0,0,0]])c = np.insert(a, 0, values=b, axis=0)d = np.insert(a, 0, values=b, axis=1)print(c)print(d)>>c[[0 0 0] ...
2018-09-24 11:53:01 36323
原创 Python3中列表del(),remove(),pop()三个函数
del():删除指定值del a[0]remove():移除指定值a.remove("str")pop()获取并删除指定位置元素A = ['a','b','c']# pop的命令,其有返回值,可赋值带出d = A.pop(0) #删除指定位置元素'a',并将删除元素返回值赋值print(A,d)A = ['a','b','c']# pop的命令,其...
2018-09-23 20:51:12 23815 5
转载 anaconda使用清华源
TUNA 还提供了 Anaconda 仓库的镜像,运行以下命令:conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/m...
2018-09-15 19:23:54 7991
转载 去掉小箭头
1、去掉小箭头将下述代码保存为【arrow.bat】,然后通过管理员方式运行reg add "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\Shell Icons" /v 29 /d "%systemroot%\system32\imageres.dll,197" /t reg_sz /fta...
2018-09-15 18:56:16 2439
转载 android 为TextView添加边框
今天需要在TextView上面添加一个边框,但是TextView本身不支持边框,所以只能采用其他方式,在网上查询了一下,主要有三种方式可以实现1.带有边框的透明图片2.使用xml的shape设置3继承TextView覆写onDraw方法。方法一:带有透明图片的背景图,这个没有什么好将的,自己制作一个就行 ,然后设置background就可以了方法二:通过shape来设置背景图片...
2018-08-19 10:39:01 11904
转载 Android中padding与layout_margin的区别与用法
一、定义 android:layout_margin就是设置view的上下左右边框的额外空间 android:padding是设置内容相对view的边框的距离 padding,含义为“填充”,像垫肩压类似的填充物,一个控件的padding及此控件内部的填充,由此可见padding是以所被定义的控件A为parent控件,而内部的内容物与控件...
2018-08-18 15:29:56 20786 3
转载 Android使用SVG矢量图打造酷炫动效
转: FROM GA_studio http://blog.csdn.net/tianjian4592 一个真正酷炫的动效往往让人虎躯一震,话不多说,咱们先瞅瞅效果: --------------------------------------------------如果你想看 GAStudio Github主页,请戳这里; 如果你想看 ...
2018-07-26 11:02:09 586
原创 ERROR 1820 (HY000): You must reset your password using ALTER USER statement before executing this st
解决方法:设置你的密码set password="YOUR_PASSWORD"
2018-06-12 09:27:56 4781 3
转载 Windows下,php5.6+Apache2.4+mysql安装与配置
我将php5.6与apache2.4,与php所需要安装的运行库(vc2012,vc2015,vc2017)都放在我的GitHub里,可以下载配置apache修改[Your download]/Apache24/conf/httpd.conf1、配置ServerRoot,为ServerRoot "C:/server/apache24" #我将更目录为/server2、导入php module,再...
2018-06-11 20:52:58 1112
转载 Microsoft Visual C++ 2017 Redistributable
https://download.microsoft.com/download/4/5/4/454AC59C-DC3F-4AD3-950F-6DCBDF672071/vc_redist.x86.exehttps://download.microsoft.com/download/B/7/A/B7A6D5AB-2606-4942-BE19-996D105376A4/vc_redist.x64.exe
2018-06-05 00:22:47 32845 8
转载 Ubuntu查看系统版本
有时候,我们在升级内核版本或者是从一个版本升级到新的版本之后,想要查看一下自己的ubuntu是否升级成功。可是有没有一种比较快捷的方法比如说在终端里面查看呢?答案是肯定的。为了查看 Ubuntu 的版本号,可以采用以下两种方法之一。方法一在终端中执行下列指令:cat /etc/issue可以查看当前正在运行的 Ubuntu 的版本号。其输出结果类似下面的内容:Ubuntu 8.04 /n /l...
2018-05-29 16:44:33 3310
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人