自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 算法题整理

字符串1、反转字符串2、判断回文字符串3、替换字符数组1、斐波那契数列2、寻找峰值4、顺时针输出二维数组数学1、最大公约数2、跳台阶(每次只能跳1或2级)3、跳台阶(每次可以跳1…n级)链表1、从尾到头打印链表栈1、用两个栈实现队列的先进先出...

2021-08-01 10:52:34 197

原创 ValueError: Object arrays cannot be loaded when allow_pickle=False

问题描述ndarray数组1:data1ndarray数组2:data2操作:data = data1+data2报错:ValueError: Object arrays cannot be loaded when allow_pickle=False问题分析Numpy 1.16.3发行版本中说明:“函数np.load()和np.lib.format.read_array()采用allow_pickle关键字,默认为False (我的环境中numpy=1.19.5>1.16.3)解决办法

2021-07-23 09:20:09 150

原创 SQL语句整理

sql语句对大小写不敏感,以";"隔离语句select语句SELECT name,country FROM Websites;SELECT * FROM Websites;SELECT DISTINCT country FROM Websites;where子句的使用and、or、in、like、betweenSELECT * FROM Websites WHERE country='CN';SELECT * FROM Websites WHERE id=1; int和str应区.

2021-07-02 16:15:29 245

原创 logger打印日志-python

代码if __name__ == '__main__': #log设置 logger = logging.getLogger(__name__) logger.setLevel(logging.INFO) handler = logging.FileHandler('export_record.log') handler.setLevel(logging.INFO) console = logging.StreamHandler() console

2021-04-21 15:23:47 119 3

原创 vue官网学习笔记2——模板语法

1. vue.js是基于html的语法模板,使得开发者可以声明式地将DOM绑定到底层的vue实例,所以vue.js模板能被遵循规范的浏览器和html解析器解析。2. vue将模板编译成虚拟dom渲染函数,vue可以智能计算出最少需要渲染多少组件(组件化的原因之一),并把dom次数减到最少。3. v-html可实现动态渲染html内容,但对于用户提交的部分不可使用此属性(易遭受xss攻击)<div id="app"> <p v-html="rawhtml"></p>

2021-02-06 22:56:37 85

原创 vue官网学习笔记2——vue实例

1. 每个vue应用都是通过vue函数创建一个新的vue实例开始的var vm = new Vue({el:"#vm",data:{}})2. 当一个vue实例被创建时,data中的数值(property)加入到vue的响应式系统中,党property发生变化时,“视图”(html)就会产生响应。3. 实例生命周期钩子- 生命周期钩子函数,给用户在不同阶段添加自己代码的机会在实例生命周期的不同阶段被调用,如 mounted、updated 和 destroyed。生命周期钩子的 th

2021-02-05 23:38:01 128

原创 vue官网学习笔记1——vue.js介绍

1. vue.js特点使用一个简洁的语法模板将数据渲染进DOM系统实例化vue对象,将数据挂载到DOM元素上v-if 等将vue实例与DOM结构绑定(具体表现形式为显示/不显示)v-bind 将元素属性与vue实例绑定1 v-bind:title="name" //对dom元素的title值进行绑定,name为vue对象的data中的数据2 v-on:click="reverse" //点击即触发方法,reverse为vue对象的methods中的方法3 v-if="show" /

2021-02-05 23:18:58 110

原创 多模态谣言检测:消息文本内容+图像信息+图像内嵌文本信息

刘金硕, 冯阔, Jeff Z. Pan, 邓娟, 王丽娜. MSRD: 多模态网络谣言检测方法[J]. 计算机研究与发展, 2020, 57(11): 2328-2336.一、创新点的提出二、数据集1、数据集样例2、公开数据集twitter数据集:微博数据集三、总体框架...

2020-12-09 17:13:28 2830 2

原创 一些有用的链接

中文分词综述文本相似度算法总结自然语言预训练模型总结顶会论文解析合集博主主页

2020-11-11 18:31:17 244

原创 各种常用数据链接

1、中级网络工程师2008-2018年历年真题链接:2008-2018(真题+部分答案解析)提取码:uzqv

2020-11-04 11:55:47 392

原创 Majing-2017ACL-Detect Rumors in Microblog Posts Using Propagation Structure via Kernel Learning

主要内容提出基于内核的传播树方法,通过评估传播树之间的相似性来识别谣言基本思想是寻找和捕捉Ru-MORS的传播树中的显著子结构。将PTK(传播树核)扩展为上下文丰富的PTK(CPTK),通过考虑从源Tweet到子树根的不同传播路径来增强模型,从而捕获传输的上下文。分类粒度更细:假谣言、真谣言、未经正式的谣言、非谣言(数据集的分类更多,每个集合中的数据更少)。具体模型实验设置twitter15twitter16对两个原始数据集中的数据进行了筛选:只提取了热门的推文,这些推文都是被转

2020-09-09 16:31:15 1008

转载 谣言数据集链接

FakeNewsNet下载链接:https://github.com/KaiDMML/FakeNewsNet说明:该数据集包含新闻内容和正确标注真假新闻标签的社会语境特征。使用论文:(1)A Stylometric Inquiry into Hyperpartisan and Fake News(2)Exploiting Tri-Relationship for Fake News DetectionBuzzFeedNews链接:https://github.com/BuzzFeedNews.

2020-09-09 14:56:31 4988 6

原创 2015C-CIKM-Detect Rumors Using Time Series of Social Context Information on Microblogging Websites

主要内容提出一个动态时间序列结构模型(Dynamic Series-Time Structure model——DSTS),能够抓取多种社会上下文特征随时间流逝的变化。实验结果表明,在得知谣言完整生命周期的情况下,以及谣言扩散早期,DSTS都有较大的改进。研究动机现有的谣言检测方法大多基于与用户、信息内容和传播模式相关的特征的监督式的机器学习模型。这些模型的缺陷是他们将信息的社会内容的整体统计特征视为特征,如转发总数、传播的时间长,忽视了这些特征随时间的变化。具体模型基于DSTS的功能和带注释的

2020-09-02 13:10:32 576

原创 2018C-predicting stance in twitter conversation for detecting veracity of rumor :a neural approach

一、创新点和主要内容利用卷积神经网络和注意力机制对推文的文本内容进行编码得出立场预测,使用RNN(双向GRU)和注意力机制对推文序列进行学习,最后结合两个子模型进行谣言的预测。检测过程分为两步:根据推文的文本内容、时间戳和目标推文的顺序对话结构得出每条推文的stance;然后使用conversation中所有推文的stance来对原始谣言的真假进行预测。二、模型介绍1、数据集pheme数据集的一部分2、立场预测结合文本表示、上下文表示、时间特性学习得到推文的立场。- 立场检测架

2020-08-19 21:35:23 280

原创 2018C-BigData-multiple time series data analysis for rumor detection on social media

2020-08-19 17:04:54 195

原创 数据酷课—中文分词匹配方法

分词是中文文本数据结构化处理的关键步骤,搜索引擎、机器翻译、自动摘要生成等技术都涉及到分词技术,合理的分词结果对于后续的文本分析效果是至关重要的,所以说分词是文本数据分析过程中不容忽视的重要环节。当然了,分词的算法也是层出不穷,从最初的字典匹配到后来的统计模型,从隐马尔科夫HMM到CRF.分词精度都在不断提高,下面我就简单介绍下基本的分词算法。从形式上看,每一段中文文本都可以被认为是由汉字与标点符号组成的一个字符串。由字可组成词,由词可组成词组,由词组可组成句子,进而由一些句子组成段、节、章、篇。在我们.

2020-08-14 11:08:41 342

原创 基于深层结构学习的twitter谣言检测

Deep Structure Learning for Rumor Detection on Twitter,Qi Huang,2019(IJCNN)主要内容考虑用户关系网络的结构特征,使用GCN学习用户行为中存在的图形结构信息。三个结构:用户编码器、传播树编码器、集成器。问题描述事件集每个事件集中包含【帖子集合、用户集合】帖子集合根据转发回复关系生成传播树用户集合形成一个图模型介绍用户编码器结合了之前的用户特征(如粉丝数量、粉丝数量和注册年龄),加入了用户行为信息(通过.

2020-08-13 20:16:58 933

转载 转载----Majing谣言检测成果

第一篇《Detect Rumors Using Time Series of Social Context Information on Microblogging Websites》由于谣言检测模型只是对用户信息,模式传播和文本内容进行建模,忽略了时间的变化这一信息。作者提出了一种DSTS模型。第二篇《Detecting Rumors from Microblogs with Recurrent Neural Networks》作者使用了循环神经网络对谣言进行建模,使用TFIDF对词语进行建模,随.

2020-08-12 15:58:37 795 1

原创 用户可信度-注意力机制-多任务学习(2019ACL)

Rumor Detection By Exploiting User Credibility Information, Attention and Multi-task Learning,Quanzhi Li,2019,ACL主要内容数据集:pheme提出一种新的谣言检测和立场分类任务的多任务学习方法。所提出的神经网络模型包含一个共享层和两个特定任务层。谣言检测层融入了用户可信度信息,使用注意力机制。模型结构多任务网络模型网络结构立场检测层输入:推特embeding(TE)+.

2020-08-12 15:48:40 486

原创 基于深度视觉感知的RNN在谣言检测中的语义挖掘-2019(big data)

主要内容将社交事件流转换成连续时间序列,利用无偏CNN相关帖子的潜在语义,得到VIP注意向量,使用VIP注意向量指导RNN从上下文信息学习长距离依赖关系提出方法构建社会事件的可变长度时间序列对事件中的帖子进行块的划分,保证块之间仍然存在时间顺序和相互影响。对所有事件采取同样的划分原则在时间轴上距离较近的帖子被分到同一批次,使得事件阶段不中断爆发期的帖子应妥善划分所以,最终的划分结果是:对帖子进行均等划分,使得每个时间段的贴子数量一致normal all time steps to 0

2020-08-12 15:48:22 404

原创 Rumor Detection with Hierarchical Social Attention Network,2018,CIKM

主要内容一个事件被分为几个包含多个帖子的子事件,每个帖子被进一步分割为几个单词,实现了将事件进行结构化表示。将结构化的事件用双向LSTM进行学习,引入注意力机制。实验模型对文本结构进行分层:将事件中的帖子分成不同的时间间隔,每个时间间隔可认为是一个子事件;子事件由多条帖子构成;每条帖子由多个词语构成提取了22个社会特征模型结构(如下图)单层LSTM只能学习到前边的上下文,双向LSTM可以学习前后的上下文词级部分:双向LSTM+注意层帖子部分:双向LSTM+社会特征注意层子事件部分

2020-08-10 16:48:50 579 1

原创 基于卷积神经网络的谣言检测(刘政(未志华)-计算机应用2017)

基于卷积神经网络的谣言检测,刘政、未志华、张韧弦,《计算机应用》-2017主要内容(与周志远2018类似)使用Majing数据集将谣言事件向量化,改进传统的卷积层过滤操作,使用CNN进行谣言检测本文模型模型结构数据集处理通过新浪微博官方辟谣平台取得某条具体的谣言对其相关的微博进行聚类,得到N个谣言事件取得跟谣言事件数目近似相同的M个非谣言事件将每一个事件作为一个整体,对其中的每一条微博向量化,组成一个输入矩阵,以此类推,完成向量化操作输入卷积神经网络模型进行训练实际上.

2020-08-09 11:29:58 1210

原创 唐宇迪深度学习笔记

【b站视频—唐宇迪深度学习网址】https://www.bilibili.com/video/BV1CE411Q7dn?from=search&seid=4714546485764005493图片在计算机中的表示通常一张图片在计算机中会被表示为三维数组的形式,每个像素的取值在【0-255】之间,如300*200**3,其中3表示R、G、B三个颜色通道。K近邻算法是一种分类算法算法流程对于未知类别属性数据集中的点:计算已知类别数据集中的点与当前点的距离;按照距离依次排序.

2020-08-07 11:49:09 1601

原创 基于树结构递归神经网络的twitter谣言检测

主要内容提出一个基于递归神经网络(RvNN)的谣言检测方法,桥接内容语义和传播线索。与解析不同,本文模型的输入是源于原帖子的传播树,而不是单独句子的解析树。帖子的内容语义以及他们之间的响应关系可以通过沿树结构的特征递归学习过程来捕获。主要贡献第一个基于树结构递归神经网络深度集成内容语义和深度语义来实现谣言检测的研究。提出基于自上而下、自下而上的树状结构的RvNN的两个变体,捕获谣言的结构和文本特征,对claim生成更好的集成表示。问题陈述C={C1,}...

2020-08-05 17:30:16 942

原创 数据酷客【深度学习:理论与应用】深度学习介绍

多层感知机(MLP)多个神经元以全连接层次相连前馈神经网络万能逼近原理:非线性函数的有限次复合来无限接近目标函数多层感知机:误差函数模型的目标是让预测误差最小一般使用梯度下降法(求导)来更新参数链式法则计算梯度后向传播计算梯度MLP的困境目标函数通常为非凸函数,不易求导获得最小值极容易陷入局部最优值网络层数增加后,链式法则计算梯度会出现梯度消失或爆炸问题典型网络结构卷积神经网络(CNN)适合处理网格型数据:物体识别,图片分类全连接网络并不适合图像:像素大、参

2020-08-02 14:43:18 2225

原创 登录页面实现隐藏导航栏

最近做的一个项目中,除了登录页面,其他页面都要显示导航栏,那么要如何实现在登录页面隐藏导航栏呢【v-show] 实现隐藏某些页面项目描述,除了登陆页面,其余页面都是要显示导航栏的,所以入口component直接使用【router-view】无条件的显示此component中涉及的所有组件,用【router-link】来进行一一区分没有必要,所以可以直接在导航栏部分的代码添加【v-show】条件来控制哪些组件中需要显示导航栏。具体实现定义一个变量isTrue来控制显示导航栏与否ro

2020-07-30 20:26:06 1510

原创 一种用于谣言检测的C-GRU神经网络

主要内容提出结合了CNN和GRU的C-GRU模型。首先对谣言事件进行矢量化表示(3.1),使用CNN自动构建微博谣言的特征(3.1),继而利用GRU挖掘谣言事件中相关微博的时间信息(3.2)。CNN提取谣言深层特征的优势+RNN(GRU)处理序列信息的优势。实验设置数据集直接使用了Ma的公开数据集,使用正则表达式匹配的方法进行了降噪(超链接、@)实验设置Ma的工作:分别实现了tanh-RNN(tanh-递归神经网络)、LSTM(长短期记忆)、GRU(门控递归单元)。CNN模型:通

2020-07-30 20:25:30 875 3

原创 vue单页面,多路由,页面跳转但不清除之前页面的记录

【router-view】 + 【keep-alive】单页面多路由实现component跳转但不覆盖原来页面记录【router-view】用于页面渲染指定路由对应的组件<router-view></router-view>假如所有组件都要缓存历史记录,实现返回该组件时能显示原始记录,则可以直接套上【keep-alive】,此component中涉及的所有组件都会被缓存。<keep-alive> <router-view></rou

2020-07-20 15:08:09 3183

原创 anaconda的一些基本操作

anaconda简介anaconda是便捷获取包且对包能够进行管理,同时可以对环境进行统一管理的发行版本。anaconda包含了conda、python在内的超过180个科学包机器及其依赖项。常用命令创建新环境安装指定的python环境:conda create --name python2 python=2.7(安装了名为python2,python版本为2.7的虚拟环境)安装指定的依赖包:conda create -n python3 python=3.7 numpy pandas=

2020-07-19 15:54:18 257

原创 唐宇迪数据分析与机器学习实战笔记(1)

数据的基本查询操作csv数据的读入import numpy as npimport pandas as pd//前提:csv文件与该python文件在同一目录下food_info = pd.read_csv("food_info.csv") 查看数据基本属性// 查看数据的整体类型(dataframe、ndarray)type(food_info)//查看各列元素的数据类型属性(int32、string、float...)food_info.dtype// 查看数据形状(几

2020-07-17 11:27:50 404

原创 JavaScript学习笔记(1)

1. 计算机语言计算机语言指的是人与计算机之间实现通信的语言,一般可以分成机器语言、汇编语言、编程语言三大类。机器语言就是计算机直接能识别的语言。汇编语言和机器语言实质上是相同的,都是直接对硬件进行操作,只不过指令采用了英文缩写的标识符,方便识别和记忆。编程语言是相对于低级语言而言的高级语言,常用的有c语言、java、python、php、javascript,需要借助解释器将其解释为机器能识别的语言。2.编程语言和标记语言的区别编程语言有很强的逻辑和行为能力,比如for循环、if条件语句

2020-07-16 10:47:36 101

原创 基于IPv4和TCP的socket通信

使用python实现简单的socket通信基于IPv4和TCP1. 服务端程序1 # 导入socket库from socket import *2 # 定义主机地址和端口,供客户端进行连接IP= "127.0.0.1"PORT = 200003 # 定义一次从socket缓存区最多读入的数据大小BUFLEN = 5124 # 实例化一个socket对象listenSocket = socket(AF_INET,SOCK_STREAM)5 # 将IP地址、端口号和socket进行绑定

2020-07-16 09:28:17 391

原创 谣言检测日常笔记(1)

谣言检测笔记(1)谣言检测的实现主要涉及五个主要问题(流程)定义:选定检测的对象——假新闻、虚假信息、或是谣言,基于事件或是单个帖子数据收集:收集平台——新浪微博、twitter、Facebook或是其他社交平台(现有研究以前两个平台为主);具体的数据收集方式——公共数据集或是自己采取其他爬虫策略…特征提取:早期机器学习——按照先验知识(经验)提出能将谣言和非谣言区分开的特征,以便进行分类;后期深度学习——神经网络自动学习实现分类的特征。分析和检测技术:研究者设计或改进的各种机器学习或深度学

2020-07-15 21:27:02 1752 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除