- 博客(226)
- 收藏
- 关注
原创 什么是编程语言?
以下内容摘自《Web前端开发精品课HTML CSS JavaScript基础教程》编程语言我们人类有非常多的语言,例如汉语、英语、法语等。实际上,计算机也有很多语言,例如C、C++、Java等。简单来说,JavaScript就是众多计算机语言(也叫编程语言)中的一种。跟人类语言类似,计算机语言也有一些共性,例如我们可以将C语言代码转化为JavaScript代码,这就像将英语翻译成汉语一样,虽然语言不一样了,但是表达出来的意思是一样的。我们都知道,学习任何一门人类语言,都得学这门语言的词汇、语法和.
2022-04-08 14:20:33 1134
原创 信息孤岛的由来,以及如何改善
文章目录1. 什么是信息孤岛?2. 信息孤岛产生的原因3. 数据中台-让数据用起来什么是数据中台?参考1. 什么是信息孤岛?信息孤岛,顾名思义就是大家就像在一个个岛上,只拥有自己的信息,与其他的岛屿完全没有交流,从而造成信息闭塞,发展缓慢。企业的信息孤岛就是在整个企业内部,各个部门之间信息的不到有效及时的沟通交互,企业管理系统之间在功能上不能关联互助、信息不共享也不能互换以及信息与业务流程和应用相互脱节。信息孤岛是一个普遍的问题,信息孤岛的类型有很多,不仅企业内各环节存在着信息孤岛,企业间也存在信息孤
2022-03-11 11:32:40 5658
原创 用户画像及应用
文章目录用户画像大数据应用场景用户画像运营商在数据获取方面得天独厚。其自身不仅积累了庞大的用户群,而且能够通过多渠道多形式持续性地收集用户通信、身份、上网以及社交等各维度数据,进而形成庞大的数据资源库。大数据应用场景基于网络信令的客户上网行为触点营销,运用云计算等技术构建Hadoop结构的大数据精确营销平台,实时捕获手机上网用户的号码、机型、位置、软件使用、关键字捜索和网站浏览行为等具有营销价值的信息。当客户捜索关注的关键字,或浏览特定网站及栏自,或使用运营商同类功能的软件时,及时触发预设定的场景
2022-03-09 17:11:34 2535
原创 数据的产生
数据产生是数据平台的源头,没有数据,所谓的大数据也无从谈起。所以首先要保证有数据。随着近年来互联网和移动互联网的蓬勃发展,数据已经无处不在,毫无疑问,这是一个数据和信息爆炸的时代。所以,即使一个企业和个人没有数据,通过爬虫工具和系统的帮助,也可以从互联网上爬取到各种各样的公开数据。但是更多的、高质量的数据是爬取不到的,这些数据存在于各个公司、企业、政府机关和机构的系统内部。...
2022-03-09 10:19:11 1748
原创 一文区别数据库、数据仓库、数据湖、数据中台
文章目录前言数据库前言你是否和我一样,对数据库、数据仓库、数据湖、数据中台的概念傻傻分不清楚,明明都是用来存数据,哪来这么多叫法呢。其实,我们首先要明白,任何一种事物的诞生都不是平白无故的,一定是为了解决某一种问题,或者说痛点。在展开介绍之前,不妨先看一下下面这张图,大致清楚它们之间的一个关系。数据库...
2022-02-24 15:39:03 1169
原创 实时计算知识,最详细的整理
随着云计算、大数据等名词的流行,涌现出一大批相关的技术,其中Hadoop是较早出现的一种分布式架构,得到了大量的应用。本章先说明大数据和Hadoop的基本概念,之后介绍HDFS、MapReduce、YARN三个基本的Hadoop组件。除了基本组成部分,Hadoop生态圈中还有很多其他的工具组件,它们可以提供创建数据仓库所需的大部分功能。
2022-02-23 11:11:57 3910
原创 “云“系列概念
“云”系列概念什么是云?何谓云技术何谓云计算?何谓云计算平台?二级目录三级目录什么是云?云和本地是相对的,云可以看作是一个庞大的网络系统。一个云内可以包含数千,甚至上万台服务器;何谓云技术云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。何谓云计算?云计算,是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。传统的应用正在变
2021-07-15 19:34:06 605
原创 常用资料
图神经网络资料https://github.com/thunlp/GNNPapershttps://github.com/Jiakui/awesome-gcnhttps://github.com/joeat1/GNN_notehttps://github.com/weslynn/AlphaTree-graphic-deep-neural-network
2021-03-31 10:59:58 194
原创 《A Survey of Fake News: Fundamental Theories, Detection Methods, and Opportunities》
综述 1 introduction1.1 what is fake news1.2 fundamental theories1.3 an overview of this survey(I) knowledge-based methods(section 2)(II) style-based methods (Section 3)(III) propagation-based methods (Section 4)(IV) source-based methods (Section 5)(VI)In Sec
2021-03-26 14:48:36 436
原创 谣言检测论文+代码
Weak Supervision for Fake News Detection via Reinforcement Learninghttps://github.com/yaqingwang/WeFEND-AAAI20Gephi for graph visualizations https://gephi.org/Fighting an Infodemic: COVID-19 Fake News Dataset: https://github.com/parthpatwa/covid19-fake-.
2021-03-24 14:54:53 2486 3
原创 configure: error: please install libssl-dev or openssl-devel
libssl-dev 、 openssl-devellibssl-dev是一个Linux平台下提供加密安全支持的库文件。安装xrdp时遇到问题:configure: error: please install libssl-dev or openssl-devel解决办法:下载 libssl-dev:https://packages.ubuntu.com/xenial/libssl-dev下载适合自己Ubuntu的文件包,需要版本适合、符合系统:https://ubuntu.pkgs.
2021-01-06 16:37:30 866
原创 Ubuntu16.04常用包下载地址
网址https://launchpad.net/ubuntu/xenial/amd64https://launchpad.net/ubuntu/xenial/amd64/需要的包的名字示例https://launchpad.net/ubuntu/xenial/amd64/gnome-panel
2021-01-06 16:35:52 699
原创 Win10通过远程桌面连接连接不上Ubuntu16.04(下)
卸载xrdp、vnc4server、xbase-clientssudo apt-get purge xrdpsudo apt-get purge vnc4serversudo apt-get purge xbase-client安装xrdp、vnc4server、xbase-clients1、sudo apt-get install xrdp vnc4server xbase-clients2、手动下载1.xrdp 下载: https://github.com/neutrinola
2021-01-03 17:32:56 1271
原创 Ubuntu镜像源不可用
Ubuntu更改镜像源两种方式:https://blog.csdn.net/laoluobo76/article/details/108302191执行:sudo apt-get update出现错误:dell@dell-PowerEdge-T630:~$ sudo apt-get update忽略:2 https://mirrors.tuna.tsinghua.edu.cn/ubuntu xenial InRelease获取:1 http://ppa.launchpad.net/gra.
2020-12-29 10:27:30 4791 4
原创 Win10通过远程桌面连接连接不上Ubuntu16.04(上)
sudo vi /etc/xrdp/sesman.ini在[Xvnc]下面添加param8=-SecurityTypesparam9=None保存退出,Esc + :wq重启xrdp服务sudo /etc/init.d/xrdp restart
2020-12-28 21:57:53 1771
原创 There was a problem confirming the ssl certificate: [SSL: CERTIFICATE_VERIFY_FAILED]
https://www.cnblogs.com/yinhaiping/p/13375375.html
2020-12-28 21:05:21 2462
原创 pip安装包时,出现UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 151:
参考:https://my.oschina.net/jms0755/blog/1612950?tdsourcetag=s_pctim_aiomsg
2020-12-23 11:04:00 2698 1
原创 failed build torch_scatter.whl
参考:win10下python3安装torch_scatter、torch_sparse出错的解决方案:https://blog.csdn.net/wangs1996/article/details/96424937(对我无用)https://github.com/rusty1s/pytorch_geometric/issues/87提供一个whl文件的下载网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml(并没有torch_scatter的)...
2020-12-23 11:02:53 2568 3
原创 加载.npz文件时,出现错误:OSError: Failed to interpret file ‘xxx.npz‘ as a pickle
.npz文件的内容是怎样的,怎么打开?加载.npz文件时,出现错误:OSError: Failed to interpret file ‘xxx.npz’ as a pickle首先了解pickle的定义:pickle: 用于python特有的类型和python的数据类型间进行转换pickle提供四个功能:dumps,dump,loads,loadpickle可以存储所有python支持的原生类型(bool,int,float,string,byte,none等),由任何原生类型组成的列表、元
2020-12-22 16:05:19 10558 2
原创 Pytorch1.1.0 + cuda10.0+torch_geometric
1. 创建一个Pytorch1.1.0的虚拟环境conda create -n (环境名)(python版本)2. Pytorch官网看Pytorch1.1.0的安装命令https://pytorch.org/get-started/previous-versions/# CUDA 10.0conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=10.0 -c pytorch...
2020-12-17 17:21:28 5156 3
原创 运行谣言检测代码时,遇到的一些问题
服务器上装了pytorch,并且在服务器的命令行,import torch是可以导入成功的,但是在pycharm里面导入Pytorch就导入不成功,这是为什么呢?
2020-12-17 10:28:49 338
原创 Ubuntu上操作文件夹
1、pwd:查看当前某个文件的路径记住一个指令最好的方法是,了解它的英文全称. pwd 的英文全称为P : Print 打印W : Working 工作(当前)D : Directory(路径)默认Terminal打开之后,进入的路径是Linux当前用户的主目录.其中所有的用户目录都在linux系统的home路径下, 用户目录以用户的用户名命名. 个人的文件都会放在/home/用户名 这个目录下.2、ls:查看这个当前位置下共有多少个文件夹ls:list directory conten
2020-12-16 10:50:30 646
原创 管理Anaconda环境
怎样查看当前Anaconda版本?conda --version查看当前创建了哪些虚拟环境?conda env list创建一个anaconda环境?conda create -n (环境名)(python版本)例如: conda create -n botnet python=3.6Anaconda怎么把删除的环境删除干净conda remove -n learn --all如何给创建的anaconda环境重命名?conda 其实没有重命名指令,实现重命名是通过clone 完成
2020-12-16 10:24:07 166
原创 生活中的小问题
哈哈,自己用CSDN记录生活,而不是代码程序,着实有点搞笑了.冬天穿大衣,袖子在桌子上蹭,容易起毛怎么办?在网上百度了一圈儿,也没啥好的办法,总的来说,要想使你的袖套不起毛,你可以:脱掉外套(haha)戴上袖套(haha)双十二安排上!...
2020-12-07 09:59:30 286
原创 写论文时候,使用word遇到的基本问题
怎样插入目录https://jingyan.baidu.com/article/e2284b2b381386e2e6118d88.html怎样在想要的页面,使得插入的页码编号为1?https://zhidao.baidu.com/question/399858035.html为什么当我只想删除论文封皮的页码,其他页的页码全没了?首先将删除bai页码页通过插du入分节符使之成zhi为单独一节,然后分别dao断开 该页(节)zhuan 与 前一节、后shu一节 .
2020-12-03 19:25:42 254
原创 社交网络中的恶意行为
什么是互联网账号恶意注册黑产?危害性有多大? https://baijiahao.baidu.com/s?id=1619527302240860414&wfr=spider&for=pc威胁猎人:2017年度中国互联网黑产报告https://mp.weixin.qq.com/s/evGK8v2rjM4IGYODYXFvtA?2018上半年互联网黑产研究报告 https://guanjia.qq.com/news/n1/2382.html...
2020-11-16 22:02:00 319
原创 谣言检测常用资料
全连接层全连接层、softmax的loss :https://blog.csdn.net/u014380165/article/details/77284921
2020-11-05 10:58:23 2006
原创 词向量
用数字表示文本要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,词向量就是用来将语言中的词进行数学化的一种方式,然后再其馈入模型。独热编码对词汇表中的每个单词进行“独热”编码。考虑这样一句话:“The cat sat on the mat”。这句话中的词汇(或唯一单词)是(cat、mat、on、sat、the)。为了表示每个单词,我们将创建一个长度等于词汇量的零向量,然后在与该单词对应的索引中放置一个 1。下图显示了这种方法。为了创建一个包含句子编码的向量,我们可以将每个单词
2020-10-18 15:42:15 346
原创 Ubuntu16.04升级Cuda版本到10.1
必须强调一下,一定检查自己的系统版本、显卡、gcc、Linux内核是否支持cuda10.1。下图是支持cuda10.1的系统要求。使用以下指令查询自己的显卡、gcc、Linux内核$ lspci | grep -i nvidia$ uname -m && cat / etc / * release$ gcc --version$ uname -r...
2020-10-06 14:40:18 8982
原创 初次使用Ubuntu
1、怎样查看自己使用的Ubuntu版本?以下三种命令都行:1. uname -a 2. lsb_release -a 3. cat/proc/version3、Ubuntu下查看NVIDIA驱动版本号sudo dpkg --list | grep nvidia-*怎么查看Ubuntu上的Cuda版本?方法一:nvcc -V方法二:cat/usr/local/cuda/version.txt...
2020-09-26 20:10:03 269
原创 cant find model en. It doesn’t seem to be a shortcut link...
错误1:OSError: [E050] Can’t find model ‘en’. It doesn’t seem to be a shortcut link, a Python package or a valid path to a data directory.解决办法:python -m spacy download en输入上面的安装命令之后,安装速度真的是感人,一直出现目标服务器拒绝连接的问题,那么怎么提高下载速度呢?第一种办法就是在网速极佳的时间段下载,第二种办法是去官网下载
2020-09-26 11:12:15 1201 1
转载 python的函数、类
1. 创建函数函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。内建函数vs.自己创建函数你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。1.1 定义一个函数你可以定义一个由自己想要功能的函数,以下是简单的规则:函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()。任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。函数的第一行语句可以选择
2020-09-23 10:35:23 272
转载 Python的层级结构
什么是Python程序概念层级?python分为4层:表达式 --> 语句 --> 模块 -->包1. 表达式表达式是python程序中最小的构成单位。表达式最基本的功能就是创建和处理对象(可以是任意类型的)。name="王大锤" 程序做了两件事情:第一:在内存中开辟一块区域存储一个字符串对象"王大锤";把对象"王大锤"在内存中的唯一标识指向name。就可以通过name这个引用来操作"王大锤"对象了。2. 语句个人理解:表达式说的是内存中有个什么对象 ;语句就是
2020-09-23 10:11:05 3088
原创 Python中的数组(ndarrary)、矩阵(matrix)
二维数组多维数组最简单的形式是二维数组。一个二维数组,在本质上,是一个一维数组的列表。一个二维数组可以被认为是一个带有 x 行和 y 列的表格。下面是一个二维数组,包含 3 行和 4 列:多维数组一个数组的元素可以是另外一个数组,这样就构成了多维数组(Multi-dimensional Array)。从概念模型上看,这个二维数组是三行两列的表格,元素的两个下标分别是行号和列号。从物理模型上看,这六个元素在存储器中仍然是连续存储的,就像一维数组一样,相当于把概念模型的表格一行一行接起来拼成一串
2020-09-23 09:49:20 980
原创 决策树
划分数据集的最大原则是:将无序的数据变得更加有序。在划分数据集之前之后发生的变化称为信息增益。需要了解的几个名词,信息、熵(entropy)、信息增益(information gain)熵定义为信息的期望值。信息 :如果待分类的事物可能划分在多个分类之中,则符号xix_ixi的信息定义为l(xi)=−log2p(xi)l(x_i)=-log_2p(x_i)l(xi)=−log2p(xi)其中p(xi)是选择该分类的概率p(x_i)是选择该分类的概率p(xi)是选择该分类的概率;为了计
2020-09-15 11:28:59 171
原创 区分贝叶斯定理、贝叶斯推断、贝叶斯网络
从条件概率推导得贝叶斯定理通常,我们想知道某些事件发生时其它事件也发生的概率。我们将事件 B 发生时事件 A 也发生的条件概率写为 P(A∣B)P(A | B)P(A∣B),读作“在B发生的条件下A的概率”。如果一个事件的概率不以任何方式影响另一个事件,则该事件被称为独立事件。根据文氏图,可以清楚地看到,在事件B发生的情况下,事件A发生的条件概率就是:P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB)所以,P(AB)=P(A∣B)
2020-09-14 15:54:36 930
原创 论文阅读笔记:Rumor Detection on Social Media with Bi-Directional Graph Convolutional Networks
这篇论文好像是第一篇将图神经网络应用到社交媒体谣言检测的论文。摘要摘要中,有几个关键性的词,有助于我们从全局了解这篇paper的内容,以下:Bi-Directional:意思是“双向的”,分别指“top-down”,“down-top”;top-down:指的是谣言自顶向下传播(propagation);“down-top”:指的是谣言模型采用了two-layer 1stChebNet实验用到的数据集Weibo(2016)Twitter15()Twitter16(201)
2020-09-09 11:15:09 1886
原创 归一化、标准化、正则化
归一化(Normalization)1.把数据变为(0,1)之间的小数。主要是为了方便数据处理,因为将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。2.把有量纲表达式变换为无量纲表达式,成为纯量。经过归一化处理的数据,处于同一数量级,可以消除指标之间的量纲和量纲单位的影响,提高不同数据指标之间的可比性。例子:把数变为(0,1)之间的小数。例1:{2.5 3.5 0.5 1.5}归一化后变成了{0.3125 0.4375 0.0625 0.1875}解:2.5+3.5+0.5+1.5=
2020-09-08 15:45:13 1011
原创 论文阅读笔记:GAS---spam review detection with graph convolutional networks
Time-related sampling strategy如下图,假设{e0,e1,e2}\{e_0,e_1,e_2\}{e0,e1,e2}是将被检测的一个batch里的三条边,这时,如果我们要更新 e0e_0e0的embedding,就需要先计算 item i0i_0i0和 user u0u_0u0的embedding。假设我们的最大采样数是2,从 item 的角度来看,我们将从{e3,e4,e5}\{e_3,e_4,e_5\}{e3,e4,e5}里选择与e0e_0e0发布...
2020-09-07 16:41:04 741
原创 论文阅读笔记 : FdGars---Fraudester detection via Graph Convolutional Networks in Oline App Review System
首先,从每位 reviewer 的评论日志里,提取 review 的content features 和 behavior features。content features 主要关注评论的内容特征,比如, symbol ratio、相似评论的数量,等。behavior features 是考量在指定的一段时期,对评论者发布的评论数量,评论的星级、24小时内评论的分布情况,等。建立一个Graph,reviewer 为节点,如果两个reviewer 评论了同一个APP,就在它们中间建立一条连边。这样,就把.
2020-09-07 14:52:32 803
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人