- 博客(47)
- 资源 (2)
- 收藏
- 关注
原创 CCF推荐期刊/会议历年发表论文数据库:CCF Rec-Paper DB
CCF推荐期刊/会议历年发表的论文数据库,包含数据库构建、数据库检索、数据库更新功能。
2022-03-22 19:37:28 2245
原创 win10下CUDA、cudnn以及pytorch的安装更新
文章目录查看自己电脑支持的cuda信息cuda toolkits与cuda drivernvidia-smi与nvcc -Vdriver API与runtime API下载CUDA和cuDNNpytorch与cuda版本对应cuda与cudnn版本对应安装CUDA和cudnnCUDAcudnn环境变量配置安装完成后的验证CUDA多版本切换下载并安装Pytorchpytorch1.8.2 GPU版安装检查PyTorch GPU版本是否安装成功参考前言:“升级至cuda不需要将老的cuda版本手动卸载”,在安
2021-08-27 23:22:09 5116
原创 (Datawhale)Java Task04:面向对象编程基础
文章目录面向对象概述类与对象成员变量成员方法构造方法this关键字static 关键字静态变量静态方法静态代码块类的主方法继承与多态继承继承类型继承关键字implementssuper与thisfinal继承的特性多态多态的转型参考资料# 类与方法面向对象概述面向机器语言计算机处理信息的早期语言是所谓的机器语言,使用机器语言进行程序设计需要面向机器来编写代码,即需要针对不同的机器编写诸如0101 1100这样的指令序列。面向过程语言随着计算机硬件功能的提高,在20世纪60年代出现了面向
2021-07-19 23:18:50 944
原创 (Datawhale)Java Task03:Java数组
文章目录数组的概念数组的定义数组的初始化数组下标的有效范围与常见异常数组内存分析二维数组创建二维数组二维数组的赋值多维数组不规则数组数组的基本操作数组遍历填充和替换数组元素参考资料数组的概念数组是一种用于存储数据的方式,使用一组连续的存储空间来存储多个相同数据类型的值,也就是说,数组是同一种类型数据的集合。特点:类型相同,长度固定,数组中的元素从0开始编号。数组的定义数组的创建:元素类型[] 数组名 = new 元素类型[元素个数或数组长度];eg:int[] arr = new int[3
2021-07-17 00:32:26 441 1
原创 (Datawhale)Java Task02:初识Java语言基础
文章目录Java程序的基本结构运算符和表达式数学函数与常量结合赋值和运算符自增与自减运算符关系和boolean运算符位运算符括号与运算符级别控制流程条件语句循环语句`while`循环语句`for`循环语句中断控制流程语句多重选择:switch语句参考资料Java程序的基本结构//java程序结构package test; //定义包,必须是小写字母,多个单词用.隔开import java.util.Scanner; //java API 一定在当前库中存在public class Test
2021-07-16 01:29:29 362 1
原创 (Datawhale)Java Task01:Java简介与环境配置
Java简介Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。Java特性1.简单性Java看起来设计得很像C++,但是为了使语言小和容易熟悉,设计者们把C++语言中许多可用的特征去掉了,这些特征是一般程序员很少使用的。例如,Java不支持go to语句,代之以提供break和con
2021-07-13 16:41:43 402
原创 (DataWhale)图深度学习Task08:总结
GNN背景欧几里得空间的数据满足平移不变性和局部可连通性等特点,适用CNN、RNN等传统深度学习模型。图是一种更广泛的数据,且非欧几里得数据,研究图神经网络极有必要。图数据的特征:节点的不均匀分布排列不变性边的额外属性图神经网络的挑战:图数据的不规则性图结构的多样性图数据的大规模性图研究的跨领域性典型图神经网络GCN:每个节点的卷积操作可以看作一阶邻居节点之间的消息传递;GAT:利用注意力机制来定义图卷积;MPNN:将空域图神经网络统一成消息传递方式;GraphSAGE
2021-07-10 21:43:32 181
原创 (DataWhale)图神经网络Task07:按需加载样本到内存的数据集类
文章目录简单数据导入依赖`torch_geometric.data.Data`, `DataLoader`的数据导入依赖`torch_geometric.data.Data`, `Batch`的批次导入自定义数据导入继承`Dataset`基类的自定义数据集类图样本封装成批(BATCHING)小图的属性增值与拼接图的匹配(Pairs of Graphs)二部图(Bipartite Graphs)在新的维度上做拼接超大规模数据集类实践参考背景:当数据集规模超级大,很难在内存中完全存下所有数据,因此要按需将数据
2021-07-10 00:00:28 724
原创 (DataWhale)图神经网络Task06:基于图神经网络的图表征学习
文章目录背景Weisfeiler-Lehman Test (WL Test)Weisfeiler-Leman Test 算法实例WL Subtree Kernel:图相似性衡量图同构网络图表征学习方法简介图同构网络基本思路图同构网络的实现`GINConv`--图同构卷积层`BondEncoder`与`AtomEncoder`基于图同构网络的节点嵌入模块(GINNodeEmbedding Module)基于图同构网络的图表征模块(GINGraphRepr Module)参考背景Weisfeiler-Leh
2021-07-03 19:36:12 636 2
原创 (DataWhale)图神经网络Task05:超大图上的节点表征学习
文章目录背景Cluster-GCN方法简介基本方法Cluster-GCN改进:随机多簇法扩展:深层GCN的设计与训练Cluster-GCN实践数据集采集与预处理Cluster-GCN的构建、训练与测试参考背景图神经网络的局限性:训练效率与可扩展性。基于SGD的图神经网络的训练方法,随着图神经网络层数增加,计算成本呈指数增长;保存整个图的信息和每一层每个节点的表征到内存(显存)而消耗巨大内存(显存)空间;“邻居爆炸(Neighbor Explosion)”:在信息传递网络中,每一层的都需
2021-07-02 01:49:22 339 1
原创 (Datawhale)图神经网络Task04:数据完全存储于内存的数据集类+节点预测与边预测实践
文章目录数据完整存储于内存的数据集类构造PyG规定的使用数据的一般过程`InMemoryDataset`基类继承`InMemoryDataset`的数据集构造实例基于节点表征的节点预测和边预测实践节点预测边预测Cora数据集预处理边预测图神经网络参考数据完整存储于内存的数据集类构造PyG规定的使用数据的一般过程从网络上下载数据原始文件;对数据原始文件做处理,为每一个图样本生成一个**Data对象**;对每一个Data对象执行数据处理,使其转换成新的Data对象;过滤Data对象;保存Data
2021-06-28 00:10:43 706 1
原创 (DataWhale)图神经网络Task03:基于图神经网络GCN/GAT的节点表征与分类
文章目录Cora数据集的准备与分析TSNE可视化节点表征分布图节点分类模型实现与对比(MLP vs. GCN vs. GAT)MLP分类模型GCN分类模型GAT分类模型结果比较与分析参考Cora数据集的准备与分析Cora是一个机器学习论文数据集,其中共有7个类别(num_classes:基于案例、遗传算法、 神经网络、概率方法、强化学习 、规则学习、理论。整个数据集中共有2708篇论文(num_nodes),在词干堵塞和去除词尾后,只剩下1433个独特的单词(num_node_features),文档频
2021-06-24 01:53:11 1326 2
原创 (DataWhale)图神经网络Task02:消息传递图神经网络
文章目录消息传递范式MessagePassingPyG`MessagePassing`基类初识与子类实例MP基类MP子类实例PyG`MessagePassing`自定义函数`message、aggregate、message_and_aggregate、update`覆写示例作业2消息传递范式MessagePassing领域聚合节点更新xi(k)=γ(k)(xi(k−1),□j∈N(i) ϕ(k)(xi(k−1),xj(k−1),ej,i))\mathbf{x}_i^{(k)} = \gamm
2021-06-20 00:56:37 416
原创 (DataWhale)图神经网络Task01:基于PyG包的图数据的表示与使用
文章目录PyG`Data`类初识`graph_data`对象的创建:`graph_data`实例初探PyG`Dataset`类初识内置数据集(Cora)的下载作业1PyGData类初识graph_data对象的创建:通过torch_geometric.data.Data构造函数,即graph_data = Data(x=x, edge_index=edge_index, edge_attr=edge_attr, y=y, num_nodes=num_nodes, other_attr=other_a
2021-06-15 22:33:12 550 6
原创 OCR识别扫描版PDF文件(Python版)
文章目录概述扫描版PDF文字识别Tesseract OCR实现pdf文本识别tesseract-ocr安装与测试python实现基于tesseract的pdf文本识别百度 OCR实现pdf文本识别准备python实现基于百度OCR的pdf文本识别参考概述本文识别扫描版PDF文件(不是文字版)基本原理基于OCR识别。若要处理文字版OCR,百度pdfminer或pdfplumder等使用即可。依赖:应用程序tesseract-ocr https://digi.bib.uni-mannheim.de/
2021-01-19 22:55:19 14201 6
原创 ChiMerge算法:卡方检验+ChiMerge+Python
文章目录卡方分布与卡方检验卡方分布卡方χ2\chi^{2}χ2检验Python实现ChiMerge算法算法原理Python实现参考卡方分布与卡方检验卡方分布定义若n个相互独立的随机变量ξ1,ξ2,…,ξn\xi_{1},\xi_{2},\dots,\xi_{n}ξ1,ξ2,…,ξn均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和Q=∑i=1nξi2Q=\sum_{i=1}^{n}\xi_{i}^{2}Q=∑i=1nξi2 构成一个新的随机变量,其分布规律称为χ2\chi_
2021-01-06 17:04:10 1477 2
原创 PageRank求解(networkx & gephi)
文章目录PageRank求解(networkx & gephi)networkx基本操作Geophi基本操作利用Sigma.js插件把图形导出到HTMLnetworkx的pagerank比较参考PageRank求解(networkx & gephi)networkx基本操作import networkx as nxG = nx.Graph() # 创建空图G.add_node(1, time='5pm') # 添加节点,并赋节点属性G.add_edge(1, 2, weight
2020-12-25 17:46:08 2598 2
原创 (NER经典之作BiLSTM-CRF解读)Bidirectional LSTM-CRF Models for Sequence Tagging
NER经典之作,2015年提出的BiLSTM-CRF序列标注模型解读。文章目录AbstractIntroductionModelsTraining procedureExperimentsDataFeaturesResultsAbstract论文以LSTM为基础,对比LSTM、BiLSTM、CRF、LSTM-CRF和BiLSTM-CRF一系列序列标注模型,实验对比表明BiLSTM-CRF模型在序列标注任务中的极大优势(该模型在后续几年成为NER任务的标杆,几乎知道NER任务的人都有听说过BiLST.
2020-10-27 09:07:22 2611
原创 命名实体识别(NER):BiLSTM-CRF原理介绍+Pytorch_Tutorial代码解析
本文较全面的介绍了命名实体识别(NER),包括NER定义、BiLSTM-CRF模型、Pytorch代码实现,未来将继续完善本文,以求涵盖NER众多方面。文章目录命名实体识别任务(NER)定义BiLSTM-CRF模型模型输入LSTMCRF真实路径得分所有路径得分Pytorch Tutorial NER代码解析#TODO参考命名实体识别任务(NER)定义命名实体识别属于自然语言处理中的序列标注任务,是指从文本中识别出特定命名指向的词,比如人名、地名和组织机构名等。具体而言,输入自然语言序列 ,给出对应.
2020-10-12 20:59:52 32504 14
原创 350. 两个数组的交集 II(python)
问题描述350. 两个数组的交集 II 给定两个数组,编写一个函数来计算它们的交集。示例 1:输入:nums1 = [1,2,2,1], nums2 = [2,2]输出:[2,2]示例 2:输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]输出:[4,9]说明:输出结果中每个元素出现的次数,应与元素在两个数组中出现次数的最小值一致。我们可以不考虑输出结果的顺序。问题分析直接的想法是:遍历数组1,查看是否含于数组2,如果是的话,删除数组2中的该元素
2020-07-13 21:02:44 321
原创 Leecode147.地下城游戏(python)
问题描述174. 地下城游戏一些恶魔抓住了公主(P)并将她关在了地下城的右下角。地下城是由 M x N 个房间组成的二维网格。我们英勇的骑士(K)最初被安置在左上角的房间里,他必须穿过地下城并通过对抗恶魔来拯救公主。骑士的初始健康点数为一个正整数。如果他的健康点数在某一时刻降至 0 或以下,他会立即死亡。有些房间由恶魔守卫,因此骑士在进入这些房间时会失去健康点数(若房间里的值为负整数,则表示骑士将损失健康点数);其他房间要么是空的(房间里的值为 0),要么包含增加骑士健康点数的魔法球(若房间里
2020-07-13 19:13:20 318
原创 Daily Paper 004: Two Forms of Knowledge Representations in the Human Brain
作者通过先天性盲人和普通人对颜色的认知,判断得出人脑存在基于感官体验以及语言和认知推理的两种知识。DOI:https://doi.org/10.1016/j.neuron.2020.04.010导言“玫瑰花是红色的”,你有想过这样关于颜色的知识究竟存储在大脑何处吗?过去有两种观点:一种认为这样的知识来源于感官经验,存储在感觉联想皮层sensory association cortices;另一种则认为这些知识不单来自感官,而是经过加工,在an abstract conceptual level存.
2020-06-23 22:40:27 369
原创 transformers库学习笔记(一):安装与测试
印象中觉得transformers是一个庞然大物,但实际接触后,却是极其友好,感谢huggingface大神。原文见tmylla.github.io。安装我的版本号:python 3.6.9;pytorch 1.0;CUDA 10.0。pip install transformerspip之前确保安装1.1.0+。测试验证代码与结果python -c "from transformers import pipeline; print(pipeline('sentiment-an.
2020-06-21 11:57:17 6270 7
原创 Python下载网络图片方法汇总与实现:含正则,BeautifuSoup及动态爬虫
本文介绍下载python下载网络图片的方法,包括通过图片url直接下载、通过re/beautifulSoup解析html下载以及对动态网页的处理等。原文见tmylla.github.io通过pic_url单个/批量下载已知图片url,例如http://xyz.com/series-*(1,2…N).jpg,共N张图片,其链接形式较为固定,这样经简单循环,直接通过`f.write(requests.get(url).content)'即可以二进制形式将图片写入。import osimport re.
2020-06-18 23:19:35 740
原创 Visdom可视化Pytorch训练过程
使用visdom可视化pytorch训练过程。visdomVisdom是支持torch和Numpy实时数据可视化工具。Support by feakbooksearch 。可视化界面如下:Preparation安装:pip install visdom启动:python -m visdom.server浏览器进入http://localhost:8097Practiceutils.pyimport numpy as npfrom visdom impor.
2020-06-12 22:38:44 903
原创 git 常用命令(本地仓库到远程仓库的上传与更新)
git 上传本地文件夹到GitHub$ git init$ git add .$ git commit -m "添加注释"$ git remote add origin https://github.com/uesrname/upload_folder.git$ git push -u origin masterNote:git remote 出错:fatal: remote origin already exists.$ git remote rm origin$ g
2020-06-11 20:50:15 213 1
原创 DAILY PAPER 003 -- DialogueGCN: A Graph Convolutional Neural Network for ERC
TITLE:DialogueGCN: A Graph Convolutional Neural Network for Emotion Recognition in ConversationAUTHOR(S):Deepanway Ghosal:目前是新加坡科技设计大学ISTD(Information Systems Technology and Design)博士生,师从Soujanya ...
2020-02-17 16:48:05 463 1
原创 DAILY PAPER 002 -- Message Passing for Complex Question Answering over Knowledge Graphs
TITLE:Message Passing for Complex Question Answering over Knowledge GraphsAUTHOR(S):Svitlana Vakulenko:阿姆斯特丹大学语言理解和信息搜索研究所(ILPS)数据科学博士后,研究方向为自然语言处理、对话系统、问答、对话搜索;Javier David Fernandez Garcia;Axe...
2020-02-10 12:24:33 712
原创 DAILY PAPER 001
TITLE:Cognition, perception and action: processes underlying problem-solving and well-being in single and double worldsAUTHOR(S):Cognition, perception and action: processes underlying problem-solv...
2020-01-28 11:59:17 179
原创 【Little Tips】Protege-5.2.0下载与安装
在王昊奋老师的“知识图谱”课程中,第二讲“知识表示与知识建模”中提到Protege,便想要安装尝下鲜。Protégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具,也是基于知识的编辑器,属于开放源代码软件。这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具,现在的最新版本为5.5.0版本(截止2017年9月29日 )。...
2019-09-27 19:42:12 1084
转载 sublime+anaconda的使用(自留待查)
让你用sublime写出最完美的python代码–windows环境Python开发工具:Anaconda+Sublime
2019-05-06 15:26:07 927
转载 pytorch实现CNN手写数字识别(MNIST)
导入依赖包import torch import numpy as npfrom torch.utils.data import DataLoaderfrom torchvision.datasets import mnistfrom torch import nnfrom torch.autograd import Variablefrom torch import optimf...
2019-04-18 21:54:15 2812 2
原创 深度学习优化器
优化器优化器种类SGD: 随机梯度下降,每次迭代只训练一个样本,不能利用 CPU 或 GPU 并行计算 speed up,且每个样本都进行gradient descent,这无疑增加了样本中的概率,所以学习速度较慢。torch.optim.SGD(params, lr=, momentum=0, dampening=0, weight_decay=0, nesterov=False)AS...
2019-04-16 20:19:29 671
转载 PyTorch实现L1,L2正则化以及Dropout
正则化(Regularization)机器学习中,许多策略被显式的设计来减少测试误差(可能会以增大训练误差为代价),这些策略统称为正则化。正则化的目的是限制参数过多或者过大,避免模型更加复杂。L1正则化和L2正则化是在损失函数后面会添加一个额外项,可以看做是损失函数的惩罚项。所谓“惩罚”是指对损失函数中的某些参数做一些限制。L1正则化和L2正则化的作用:L1正则化可以产生稀疏权值矩阵...
2019-04-14 21:43:41 1974
原创 用PyTorch实现多层网络:从感知机到多层神经网络
概念理解感知机感知机(perceptron)是二分类的线性分类模型,输入为实例的特征向量,输出为实例的类别(取+1和-1)。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面,为求得超平面导入了基于误分类的损失函数,利用梯度下降法 对损失函数进行最优化(最优化)。从神经网络模型的角度看,感知机是最简单的分类模型。多层感知机多层感知器(Multilayer P...
2019-04-13 09:20:17 3878
转载 PyTorch实现Logistic regression
逻辑回归(Logistic regression)回归方法是对数值型连续随机变量进行预测和建模的监督学习算法。其特点是标注的数据集具有数值型的目标变量。回归的目的是预测数值型的目标值。逻辑回归对应线性回归,旨在解决分类问题,即将模型的输出转换为0/1值。逻辑回归直接对分类的可能性进行建模,无需事先假设数据的分布。最理想的转换函数是单位阶跃函数(也称Heaviside函数),但单位阶跃函数...
2019-04-10 15:06:34 2480
转载 pytorch(二)
numpy实现梯度下降import numpy as np def func(x,y): return (1-x)**2+100*(y-x**2)**2#函数对x求导def dz_dx(x,y): return 2*x-400*(y-x**2)*x-2#函数对y求导def dz_dy(x,y): return 200*(y-x**2) value = n...
2019-04-08 17:42:27 212
原创 PyTorch安装与基础概念
Pytorch是Facebook 的 AI 研究团队发布了一个 Python 工具包,是Python优先的深度学习框架改进现有的神经网络。Pytorch提供了更快速的方法——不需要从头重新构建整个网络,这是由于 PyTorch 采用了动态计算图(dynamic computational graph)结构,而不是大多数开源框架(TensorFlow、Caffe、CNTK、Theano 等)采用...
2019-04-06 21:22:33 367
原创 Anaconda安装与配置
Anaconda安装与配置下载安装包,可到国内清华镜像下载。安装过程中一直点击下一步即可。(注:在安装目录步,你可以自主选择anaconda的安装目录,不一定非得安在C盘;配置系统环境变量步骤默认没有勾选,问题不大,我们可以在安装完成后自己配置系统变量)配置环境变量。计算机->右键选择属性->高级系统设置->环境变量->系统变量->PATH,在path中加入a...
2019-04-06 15:52:17 526
原创 MySQL实战(六个小练习)
练习一创建Employee表并插入数据CREATE TABLE Employee( id INT NOT NULL PRIMARY KEY, name CHAR(10), salary INT, department_id INT);INSERT INTO EmployeeVALUES (1, 'Joe', 70000, 1), (2, 'Henry', 80000, 2...
2019-04-05 23:37:47 994
知识图谱发展报告(2018)思维导图(仅含.xmind文件)
2019-03-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人