自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 A knowledge graph embeddings based approach for author name disambiguation using literals论文阅读笔记

学术知识图(SKG)中可用的数据——即“旨在积累和传达现实世界知识的数据图,其节点代表感兴趣的实体,其边缘代表这些实体之间潜在的不同关系”(Hogan等人,2021)——每天都在不断增长,导致了大量挑战,例如,Liu等人(2018)的文章探索与可视化,Beel等人(2016)的文章推荐,Faörber和Jatowt(2020)的引文推荐,以及作者姓名消歧(and)(调查见Sanyal等人(2021)),这与本文的目的相关。特别是,AND是指实体解析的特定任务,旨在解析书目引用中作者对现实世界人物的提及。

2023-04-17 21:10:47 403 2

原创 Estimating Node Importance Values in Heterogeneous Information Networks - ICDE论文阅读笔记

节点重要性估计是图形数据分析中的一项基本任务。广泛的研究集中在这一任务上,各种下游应用程序都从中受益,例如推荐、资源分配优化和缺失值完成。在图分析中,节点重要性估计是一项基本任务。广泛的研究(例如,[24]、[10]、[18]、[36]、[29]、[5])已经聚焦于这个主题,各种下游应用,如建议[4]、查询消歧[26]和资源分配优化[25]都从中受益。最著名的方法是PageRank[24],这是谷歌搜索用来对网页进行排名的算法。PageRank基于网页和网页之间的超链接构建一个图表。

2023-04-14 14:45:18 320 1

原创 Strong Baselines for Author Name Disambiguation with and without Neural Network-PAKDD阅读笔记

作者姓名消歧(AND)是科学计量学中最重要的问题之一,随着高校数字图书馆的快速发展,这一问题已成为一个巨大的挑战。

2022-12-07 16:50:54 350

原创 在jupyter中切换虚拟环境

在jupyter中切换虚拟环境首先,进入prompt,切换到你的虚拟环境然后,安装ipykernel最后,将你的虚拟环境加入到ipykernel中conda activate 你的虚拟环境的名字conda install ipykernelpython -m ipykernel install --name 你的虚拟环境的名字此时,进入jupyter就可以切换虚拟环境了。...

2022-02-09 12:35:27 2173

原创 数据分析4——挖掘建模(监督学习中的分类、回归模型,无监督学习)

def hr_modeling(features,label): #区分训练集和测试集 from sklearn.model_selection import train_test_split #features、label是dataframe f_v=features.values l_v=label.values #我们需要得到6:2:2的比例,需要分两步进行切分 #第一步,先得到验证集的数量,它占总体的20% X_tt

2021-10-27 23:13:34 2036

原创 数据分析3——预处理理论(特征工程、数据清洗、特征预处理)

预处理理论1、特征工程数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程一般包括特征使用、特征获取、特征处理、特征监控四大方面。特征使用包括:数据的选择和数据的可用性判断。这两方面主要关注点放在特征的元数据上。数据选择是分析和我们目标最相关的数据都有哪些,这些数据如何获取。数据的可用性,这里说的可用性是指数据特征是否能持续输出,比如我们需要建立模型,用到的数据是实时更新的,那么只能获取到历史数据是远远不够的。特征获取,数据源已经确定了,下一步就是确定与存储数据的过程,这个过

2021-08-21 17:14:05 4632 1

原创 数据分析2——探索性数据分析(多因子与复合分析)

理论铺垫:假设检验与方差检验;相关系数:皮尔逊、斯皮尔曼;回归:线性回归;PCA与奇异值分解1、假设检验(1)建立原假设Ho(包含等号),H0的反命题为H1,也叫备择假设。(2)选择检验统计量(3)根据显著水平(一般为0.05),确定拒绝域(4)计算p值或样本统计值,作出判断。(若p<显著水平,则假设为假,反之)说明:显著水平:我们一般可以接受的假设的最大失真程度。它和相似度加和为1。显著水平一般是人为定的,值越低,表示对数据和分布程度的契合度要求越高。检验方法:P检验常用来比较两组样本分

2021-08-07 23:08:06 2139

原创 数据分析学习1——数据获取,单因子探索分析与可视化

数据分析学习数据分析含义:数据分析就是在数据中利用统计分析方法提取有用的信息并且进行总结和概况的过程。一、数据获取数据获取的手段:数据仓库,监测与抓取,填写、日志、埋点,计算。1、数据获取手段——数据仓库数据仓库含义:将所有业务数据经汇总处理,构成数据仓库( DW )(包括全部事实的记录、部分维度与数据的整理(数据集市-DM ))数据库VS仓库数据库面向业务存储(面向业务需要保证高并发,快速读写,数据精简等,主要是为用户提供最为优质的体验),仓库面向主题存储(主题:较高层次上对分析对象数据的

2021-08-06 15:24:32 998

原创 台大陈蕴侬老师应用深度学习课程笔记(一)

台大陈蕴侬老师应用深度学习课程笔记(一)第一课 什么是机器学习机器学习机器学习框架第二课 什么是深度学习深度学习概念深度学习模型深和浅的比较speech recognitionimage recognition机器学习VS深度学习A Single NeuronDeep Netural Network深度学习的历史深度学习突破为什么会用GPU去做深度学习?(这里的思路仅供参考)为什么速度很重要?为什么越深越好?普遍性定理数据分析论证第一课 什么是机器学习机器学习概念:给机器一大堆数据(训练数据),有输入

2021-06-30 10:57:06 691

原创 Django管理网站

Django管理网站为应用程序定义模型时,Django提供的管理网站让你能够轻松的处理模型。网站管理员可使用管理网站,但普通用户不能使用。1.创建超级用户创建超级用户,用户名可以自己起,不一定要ll_admin。下面的电子邮件地址也可以为空,除此之外,还需要输入两次密码。2.向管理网站注册模型Django自动的在管理网站中添加了一些模型,如User,Group等,但对于我们创建的模型...

2019-11-21 08:39:47 484

原创 《Python编程从入门到实践》第十八章学习用pycharm创建一个Django项目

用pycharm创建一个Django项目创建一个Django项目在pycharm中创建一个Django项目:新建项目之后,效果图如图所示:其中:**manage.py:**这是一个简单的程序,它接受命令并将其交给Django的相关部分去运行。我们将使用这些命令来管理诸如使用数据库和运行服务器等任务。**settings.py:**指定Django如何与你的系统交互以及如何管理项目。...

2019-11-15 15:50:07 740 2

原创 《Python编程从入门到实践》第十一章学习代码笔记

《Python编程从入门到实践》第十一章学习代码笔记

2019-10-10 17:48:13 223

原创 《Python编程从入门到实践》第十章学习代码笔记

《Python编程从入门到实践》第十章学习代码笔记

2019-10-10 17:45:24 230

原创 《Python编程从入门到实践》第九章学习代码笔记

《Python编程从入门到实践》第九章学习代码笔记

2019-10-02 19:31:00 448

原创 《Python编程从入门到实践》第八章学习代码笔记

《Python编程从入门到实践》第八章学习代码笔记

2019-09-30 18:40:19 282

原创 《Python编程从入门到实践》第七章学习代码笔记

《Python编程从入门到实践》第七章学习代码笔记

2019-09-29 10:06:59 208

原创 《Python编程从入门到实践》第六章学习代码笔记

《Python编程从入门到实践》第六章学习代码笔记

2019-09-27 23:07:36 232

原创 《Python编程从入门到实践》第五章学习代码笔记

《Python编程从入门到实践》第五章学习代码笔记

2019-09-27 16:47:27 214

原创 《Python编程从入门到实践》第四章学习代码笔记

《Python编程从入门到实践》第四章学习代码笔记

2019-09-27 09:32:27 188

原创 《Python编程从入门到实践》第三章学习代码笔记

《Python编程从入门到实践》第三章学习代码笔记

2019-09-24 21:09:53 154

原创 《Python编程从入门到实践》第二章学习代码笔记

《Python编程从入门到实践》第二章学习代码笔记第一次写学习记录,忘记单独截运行结果了,下次改进。

2019-09-24 18:05:52 247

转载 java 中 java.lang.ArrayIndexOutOfBoundsException: 0 异常

java 中 java.lang.ArrayIndexOutOfBoundsException: 0 异常编译时,会报Exception in thread “main” java.lang.ArrayIndexOutOfBoundsException: 0在主函数第一行出现此错误在找了许多解决方法后,得到的结论是没有写参数。在eclipse中如何加入参数?在代码处,右击run点击...

2019-07-22 11:26:16 5294

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除