学习
文章平均质量分 86
ysq96
还想更厉害
展开
-
【论文笔记】Attention,please!A survey of neural attention models in deep learning
Attention mechanismsSoft attention(global attention):Soft attention会确认输入数据的每个element的权重,这个值决定了需要放多大的注意在当前element上,Soft attention的计算考虑了深度学习模型的输入以及目标。weight的范围是0~1。 Hard attention(local attention):Hard attention考虑的是这个元素被看见or忽略,取值只有0或1,不可微 Self-attention(原创 2021-04-08 16:41:17 · 725 阅读 · 0 评论 -
【Pytorch】GNN学习填坑记
参考:https://blog.csdn.net/YPP0229/article/details/106328173/pycharm执行代码出现错误No module named 'torch_sparse’解决办法h https://pytorch-geometric.com/whl/,在这里找到自己pytorch对应的版本,下载.whl 直接在下载的路径执行 pip install xxx.whl即可 ...原创 2020-11-05 13:35:56 · 1263 阅读 · 0 评论 -
【机器学习】 Local Outlier Factor(LOF)算法
转载自:https://blog.csdn.net/Zhang_Chen_/article/details/90612028转载 2020-07-28 14:40:05 · 657 阅读 · 0 评论 -
【论文笔记】HARP: Hierarchical Representation Learning for Networks
目录AbstractIntroduction问题定义Method源码【code】[paper]https://arxiv.org/pdf/1706.07845v2.pdf[code]https://github.com/GTmac/HARPAbstractOur proposed method achieves this by compressing the input graph prior to embedding it, effectively avoiding原创 2020-07-14 15:44:04 · 1340 阅读 · 7 评论 -
【机器学习】聚类算法、社区发现
目录前言前言最近方向是团案挖掘,关于聚类算法,其实之前不怎么了解,最近得补补了。聚类和社区发现首先要先明白这两者的差别。[参考地址]社团检测通常是指将网络中联系紧密的部分找出来,这些部分就称之为社团,那么也可以认为社团内部联系稠密,而社团之间联系稀疏 [1]。显而易见,其中有一个非常重要的点,稠密是如何定义的。不管现在想到的定义是什么,但都包含顶点,边,度,或许还有路径这些字眼,它们有一个共同的特征–网络的结构。所以,社团检测侧重于找到网络中联系紧密的部分,而经常忽略节点的.原创 2020-07-14 15:35:06 · 8002 阅读 · 1 评论 -
【学习】评价指标理解
目录ROC曲线AUCKS曲线P-R曲线准确率(precision)召回率(recall)F1系列ROC曲线ROC的全称是Receiver Operating Characteristic Curve,中文名字叫“受试者工作特征曲线”,顾名思义,其主要的分析方法就是画这条特征曲线。ROC曲线的横轴是FPR(假阳性率、误诊率)、纵轴是TPR(真阳性率、灵敏度)。这条曲线代表的是在不同的阈值下,FPR和TPR的一个变化曲线,通常,我们希望FPR尽可能的小,而TPR尽可.原创 2020-07-07 15:14:48 · 935 阅读 · 0 评论 -
【LeetCode】基本数据结构
注意:和大雪菜刷题https://www.bilibili.com/video/BV1T441167eG1. 两数之和思路:利用哈希表存储每个数字的下标。 遍历数组的同时,检查哈希表里target-nums[i]是否存在,存在则返回答案class Solution: def twoSum(self, nums: List[int], target: int) -> List[int]: hashtable = {} for index, n原创 2020-06-27 23:24:07 · 433 阅读 · 0 评论 -
【论文笔记】node2vec: Scalable Feature Learning for Networks
[论文]https://dl.acm.org/doi/pdf/10.1145/2939672.2939754[code]https://github.com/eliorc/node2vec abstract We define a flexible notion of a node’s network neighborhood and design a biased random walk procedure, which efficiently explores diverse neigh原创 2020-06-18 15:18:18 · 596 阅读 · 0 评论 -
【论文笔记】LINE: Large-scale Information Network Embedding
[paper] https://dl.acm.org/doi/pdf/10.1145/2736277.2741093[code] C++\PYTHON TF 摘要 In this paper, we propose a novel network embedding method called the “LINE,” which is suitable for arbitrary types of information networks: undirected, directed, and原创 2020-06-18 15:11:53 · 1049 阅读 · 8 评论 -
【论文笔记】Learning Structural Node Embeddings via Diffusion Wavelets
[paper]https://arxiv.org/pdf/1710.10321.pdf[code]https://github.com/benedekrozemberczki/GraphWaveMachine abstract In this paper, we develop GraphWave, a method that represents each node’s network neighborhood via a low-dimensional embedding by leve原创 2020-06-18 15:05:36 · 1342 阅读 · 0 评论 -
【论文笔记】DeepWalk: Online Learning of Social Representations
[paper]http://www.perozzi.net/publications/14_kdd_deepwalk.pdf[code]https://github.com/phanein/deepwalk abstract DeepWalkuses local information obtained from truncated random walks tolearnlatent representations by treating walks as the equivalen...原创 2020-06-18 15:02:15 · 369 阅读 · 0 评论 -
【LeetCode】滑动窗口、双指针、单调队列和单调栈
167. 两数之和 II - 输入有序数组思路:原创 2020-06-14 22:55:02 · 296 阅读 · 0 评论 -
【LeetCode】树专题
注意主要和b站大雪菜一起刷题,宝藏up主(https://www.bilibili.com/video/BV19t411w7Ep/?spm_id_from=333.788.videocard.0)98. 验证二叉搜索树思路:这个题只需要判断是否是BST即可 题目条件限制的也很清晰,不会出现节点相等的情况 考虑划分范围的做法,假如当前节点的值为x,则左子树的取值范围为[-∞,x-1],右子树的取值范围为[x+1,∞]# Definition for a binary tree node原创 2020-06-02 23:31:13 · 274 阅读 · 0 评论 -
【学习】PSI、IV、WOE的计算
PSI PSI(模型分布稳定性):稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。 其中,bins是分箱数量,Actual是实际占比,Expected是预期占比。 一般来说,PSI小于0.1模型稳定性较高,0.1至0.2之间稳定性.原创 2020-06-01 17:34:07 · 3066 阅读 · 0 评论 -
【论文笔记】NRL-Heterogeneous Information Network
Abnormal Event Detection via Heterogeneous Information Network Embedding论文地址摘要In this paper, we propose a novel deep heterogeneous network embedding method which incorporates the entity attributes and second-order structures simultaneously to address原创 2020-05-28 11:57:24 · 560 阅读 · 0 评论 -
【实习日记】每日问题总结(持续更新......)
2020.05.18堡垒机:堡垒机,即在一个特定的网络环境下,为了保障网络和数据不受来自外部和内部用户的入侵和破坏,而运用各种技术手段监控和记录运维人员对网络内的服务器、网络设备、安全设备、数据库等设备的操作行为,以便集中报警、及时处理及审计定责。DQCETLXT系统强 、弱依赖UDF魔数kylinOLAPMPPBG/BU2020.05.19SLASPARKHOPEZEPPELINSCALAKS值2020.05.20HIVE分区表concat_wspar原创 2020-05-21 18:48:26 · 827 阅读 · 0 评论 -
【实习日记】SQL语句学习
一些最重要的SQL命令SELECT:从数据库中提取数据UPDATE:更新数据库中的数据DELETE:从数据库中删除数据INSERT INTO:向数据库中插入新数据CREATE DATABASE:创建新数据库ALTER DATABASE:修改数据库CREATE TABLE:创建新表ALTER TABLE:变更(改变)数据库表DROP TABLE:删除表CREATE INDEX:创建索引(搜索键)DROP INDEX:删除索引SQL SELECT 语句SELECT column原创 2020-05-19 14:10:43 · 330 阅读 · 0 评论 -
【LeetCode】链表专题
注意:和b站up主大雪菜一起刷题https://www.bilibili.com/video/BV1jt411J7tC19. 删除链表的倒数第N个节点思路:首先,链表题一般可以直接画图得到思路 要删除倒数第N个节点的话,我们实际需要找到的是倒数第N+1个节点的位置,然后令其的next=next.next 由于可能头结点被删除,则可以添加一个虚节点指向头结点 题目要求只扫描一次...原创 2020-05-02 00:15:05 · 234 阅读 · 0 评论 -
【LeetCode】动态规划专题(持续更新......)
注意:和b站up主大雪菜一起刷的https://www.bilibili.com/video/BV15441117yb53. 最大子序和思路:状态表示dp[i]:以i结尾的最大子段和 状态转移:dp[i] = max(dp[i-1],0)+nums[i],优化后,因为状态转移只与前一个dp[i-1]有关,可以直接用last代替 初始化:dp[0]=nums[0]clas...原创 2020-04-28 21:48:57 · 339 阅读 · 0 评论 -
【LeetCode】DFS+回溯
注意:https://www.bilibili.com/video/BV1M4411Q7td参考刷题视频17. 电话号码的字母组合思路:主要是需要枚举所有的字母组合,可以利用循环class Solution: def letterCombinations(self, digits: str) -> List[str]: if not digit...原创 2020-04-24 16:32:43 · 300 阅读 · 0 评论 -
【LeetCode】二分专题
注意:主要和b站大雪菜一起刷题,宝藏up主(https://www.bilibili.com/video/BV1Vt411M741)模板# 模板1while l<r: mid = (l+r)>>2 if 性质: l = mid + 1 else: r = midretrun l# 模板2while l...原创 2020-04-22 21:43:50 · 315 阅读 · 0 评论 -
【数据分析】数据预处理
4.1 数据清洗数据清洗主要是删除原始数据集中的无关数据、重复数据、平滑噪声数据、筛选掉与挖掘主题无关的数据,处理缺失值、异常值等4.1.1 缺失值处理删除记录、数据插补、不处理插补方法:均值/中位数/众数插补使用固定值最近邻插补回归方法插值法:拉格朗日插值法、牛顿插值法、hermite插值法、分段插值、样条插值法4.1.2 异常值处理删除含有异常值的记录视为缺...原创 2020-04-19 21:49:24 · 336 阅读 · 0 评论 -
【数据分析】数据探索
参考书《Python数据分析与挖掘实战》3.1 数据质量分析数据质量分析主要任务是检查原始数据中是否存在脏数据,脏数据主要包括:缺失值,异常值,不一致的值,重复数据以及含有特殊符号(#、*等)的数据3.1.1 缺失值分析产生的原因:有些数据暂时无法获取,或者获取的代价过大被遗漏掉属性值不存在(一个儿童的固定收入、一个未婚者的配偶姓名)带来的影响:数据挖掘建模将...原创 2020-04-18 19:20:58 · 333 阅读 · 0 评论 -
【LeetCode】字符串专题
目录注意:38. 外观数列49. 字母异位词分组151. 翻转字符串里的单词165. 比较版本号929. 独特的电子邮件地址5. 最长回文子串6. Z 字形变换3. 无重复字符的最长子串208. 实现 Trie (前缀树)273. 整数转换英文表示注意:主要和b站大雪菜一起刷题,宝藏up主(https://www.bilibili.com/...原创 2020-04-18 18:02:50 · 313 阅读 · 0 评论 -
【机器学习】树类模型总结
前言想对自己所学的东西进行一个总结。决策树算法决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得对各个子数据集有一个最好的分类的过程。1. ID3信息增益:表示得知特征X的信息而使得类Y的信息的不确定性减少的程度 使用信息增益准则选择特征 分裂至信息增益很小或者没有特征可选为止 只有树的生成,容易过过拟合2. C4.5信息增益倾向于选...原创 2020-04-01 14:07:39 · 906 阅读 · 0 评论 -
【剑指offer】刷题记录(持续更新....)
注意题源是在LeetCode平台上《剑指offer》。使用的是Python面试题03. 数组中重复的数字思路:在一个长度为 n 的数组 nums 里的所有数字都在【0~n-1】 的范围内。 请找出数组中任意一个重复的数字。 因为每个数字都在【0~n-1】中,利用哈希table就可以找到第一个重复的数字进行返回class Solution: def findRep...原创 2020-03-31 11:53:21 · 251 阅读 · 0 评论 -
【Git】 ! [rejected]master -> master (fetch first)
刚开始使用github,有些问题没有注意。记录下自己的错误。提交新文件到远程仓库的时候出现了这个错误,我有点懵。查了查反应过来,我在github上加了个readme,而本地没有添加,导致本地仓库和远程仓库不一样。所以我们需要先同步一下a.--> git pull origin masterb.--> git push origin master...原创 2019-05-11 17:46:54 · 134 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(16)
第十六章 下载数据16.1 CSV文件格式16.1.1 分析CSV文件头打开文件,获得文件对象调用csv.reader(文件对象),读取文件,得到与文件相关联的阅读器next(阅读器):返回文件的下一行16.1.2 打印文件头及其位置enumerate():获取每个元素的索引及其值16.1.3 提取并读取数据for循环使用阅读器读下一行再用int()将字符串转换成int类型16.1.5 模块dat...原创 2018-06-04 10:22:31 · 706 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(7)
第七章 用户输入和while循环7.1 函数input()的工作原理input():让程序暂停运行,等待用户输入一些文本,获取输入后,存储在一个变量中input()只接受一个参数:即要向用户现实的提示或说明7.1.1 编写清晰的程序用“:”分隔程序所问的问题用“ ”分隔用户的回答,让用户好定位用“\n”换行较长句子,让程序有结构7.1.2 使用int()来获取数值输入int():将数字的字符串转换...原创 2018-05-23 10:50:28 · 245 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(6)
第六章 字典6.1 一个简单的字典基本格式:{'key':'value'}6.2 使用字典字典是一系列键-值对键和值之间用“:”键-值对之间用“,”6.2.1 访问字典中的值获取与键相关联的值,可依次指定字典名和放在方括号内的键6.2.2 添加键-值对字典是动态结构添加键-值对,依次指定字典名、用方括号括起的键和相关联的值键-值对的排列顺序和添加顺序不同,python只关心键和值之间的关联关系。6...原创 2018-05-22 11:32:04 · 183 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(9)
第九章 类9.1 创建和使用类9.1.1 创建Dog类在Python中,首字母大写的名称指的是类,__init__():每当创建类的实例时,就会自动调用它,第一个形参是selfPython2.7:class Dog(object)括号中包含一个object9.1.2 根据类创建实例在括号中给实例化类所需的初始参数访问属性:使用“.”+所需的属性即可调用方法:使用“.”+所需的方法即可创建多个实例:...原创 2018-05-26 11:42:59 · 512 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(5)
第五章 if语句5.1 一个简单示例if语句让你能够检查程序的当前状态,并据此采取相应的措施5.2 条件测试条件测试:if语句的核心都是一个值为true或false的表达式5.2.1 检查是否相等“=”:陈述,赋值“==”:发问,是否相等5.2.2 检查是否相等时不考虑大小写python检查是否相等时区分大小写5.2.3 检查是否不相等“!=”:!表示不有时候效率更高5.2.4 比较数字“==”、...原创 2018-05-21 11:31:53 · 131 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(4)
第四章 操作列表4.1 遍历整个列表for循环4.1.1 深入地研究循环对列表中的每个元素,都将执行循环指定的步骤,不管列表里包含多少个元素4.1.2 在for循环中执行更多的操作for循环中想包含多少代码都可以靠缩进来分辨for循环里面的内容4.1.3 在for循环结束后执行一些操作for循环后没有缩进的代码都只执行一次,而不会重复执行4.2 避免缩进错误python根据缩进来判断代码行与前一个...原创 2018-05-20 12:29:15 · 170 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(3)
第三章 列表简介3.1 列表是什么列表由一系列按特定顺序排列的元素组成。[]来表示,","来分隔其中的元素如果print出来,会打印方括号和列表内部表示3.1.1 访问列表元素列表是有序集合访问里面的元素可以指出列表名称及元素索引3.1.2 索引从0而不是1开始索引-1返回倒数第一个元素,以此类推3.2 修改、添加和删除元素3.2.1 修改列表元素同理访问元素,直接修改即可3.2.2 在列表中添加...原创 2018-05-19 15:14:57 · 350 阅读 · 0 评论 -
【C++】String类型的begin、end、rbegin、rend方法
begin 方法:begin(); 解释:begin()函数返回一个迭代器,指向字符串的第一个元素.end 方法:end(); 解释:end()函数返回一个迭代器,指向字符串的末尾(最后一个字符的下一个位置).rbegin 方法:rbegin(); 解释:rbegin()返回一个逆向迭代器,指向字符串的最后一个字符。rend 方法:rend(); 解释:rend()函数返回一个逆向迭代器,指向字符...原创 2018-05-18 12:23:06 · 17910 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(2)
第二章 变量和简单数据类型2.1 运行hello_world.py时发生的情况.py:这是一个python程序语法突出:用不同颜色标注2.2变量每个变量都存储了一个值,与变量相关联的信息python始终记录最新的变量的值2.2.1变量的命名和使用变量名只能包含字母、数字和下划线。变量名可以字母或下划线打头,但不能以数字打头,例如,可将变量命名为message_1,但不能将其命名为1_message...原创 2018-05-18 10:35:45 · 132 阅读 · 0 评论 -
【MySQL】com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Unknown column
今天连接数据库出现一个错误。com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Unknown column 'Hdu' in 'where clause'后来发现是数据库里,这一列是char型数据,传递数据要加上“”。像这样。String sql="select * from test.student where id="+ID+...原创 2018-04-08 18:50:52 · 1543 阅读 · 1 评论 -
【C++】C++中#include <climits>
转自:https://blog.csdn.net/u011762313/article/details/48184109climits文件包含以下常量:CHAR_MIN char的最小值SCHAR_MAX signed char 最大值SCHAR_MIN signed char 最小值UCHAR_MAX unsigned char 最大值SHRT_MAX short 最大值SHRT_MIN sho...转载 2018-03-25 19:32:53 · 775 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(8)
第八章 函数8.1 定义函数def:函数定义function_name():括号里可以包含参数,也可以为空冒号结尾""":标注文档字符串,python使用它们来生成有关程序中函数的文档函数调用则直接调用function_name()及它需要的参数8.1.1 向函数传递信息定义函数时,在function_name()括号中指定需要传递的参数8.1.2 实参和形参形参:在函数定义中的那个参数实参:实际...原创 2018-05-24 13:18:39 · 194 阅读 · 0 评论 -
【Python】Python编程:从入门到实践读书会(17)
第十七章 使用API17.1.2 使用API调用请求数据输入网址:https://api.github.com/search/repositories?q=language:python&sort=stars返回GitHub当前托管了多少个python项目,还有有关最受欢迎的python仓库的信息https://api.github.com/:将请求发送到GitHub网站中响应API调用的...原创 2018-06-05 10:13:52 · 315 阅读 · 0 评论