- 博客(44)
- 收藏
- 关注
转载 各个域名后缀含义
转自:https://jingyan.baidu.com/article/1974b289a649daf4b1f774cb.html 很多人在注册域名的时候不明白域名后缀的含义,在这里就介绍两种最为常用的域名,介绍下他们的区别以及适用的范围。需要先查询是否被注册,我们经常去的就是西部数据和万网,查询并注册未被注册的域名,一般无论是什么域名 首年都为50元之下,第二年可能会加几元
2017-05-29 15:51:31 17559
转载 了解黑客的关键工具---揭开Shellcode的神秘面纱
了解黑客的关键工具---揭开Shellcode的神秘面纱2008-02-01 14:01:57标签:黑客 Shellcode 入侵 休闲 网络安全原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://zhaisj.blog.51cto.com/219066/61428了解黑客的关键工具---揭开Shellcod
2017-05-29 15:17:43 3458
转载 Shellcode的原理及编写
转自:http://blog.csdn.net/maotoula/article/details/185026791.shellcode原理Shellcode实际是一段代码(也可以是填充数据),是用来发送到服务器利用特定漏洞的代码,一般可以获取权限。另外,Shellcode一般是作为数据发送给受攻击服务的。 Shellcode是溢出程序和蠕虫病毒的核心,提到它自然就会和漏洞联想在一起,毕竟
2017-05-29 15:17:12 3768
转载 开源爬虫larbin分析
转自:http://www.cnblogs.com/FengYan/archive/2012/02/04/2338630.html1. larbin简介(百度百科) larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发,用c++语言实现。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 La
2017-05-29 15:15:17 3440
转载 爬虫Larbin解析(一)——Larbin配置与使用
转自:http://www.cnblogs.com/kaituorensheng/p/3676851.html介绍功能:网络爬虫开发语言:c++开发者:Sébastien Ailleret(法国)特点:只抓取网页,高效(一个简单的larbin的爬虫可以每天获取500万的网页) 安装安装平台:Ubuntu 12.10下载:http://sourceforge.net/projects/larbi
2017-05-29 15:14:36 3460
转载 Larbin学习小结
转自:http://blog.csdn.net/neo_2011/article/details/7026917Larbin是一个用C++开发的开源网络爬虫,有一定的定制选项和较高的网页抓取速度。下图表示了一般爬虫抓取网页的基本过程。抓取以/Larbin.conf中的startUrl做为种子URLs开始。 下面先来看用于处理url的类:上面的类图只显示了
2017-05-29 15:13:19 3075
转载 网站被黑检测-网页挂马及暗链检测
转自:网站被黑检测-网页挂马及暗链检测网页挂马及暗链检测 什么是网页挂马 网页挂马是指恶意攻击者攻击WEB网站后,在网页中嵌入一段代码或脚本,用于自动下载带有特定目的木马程序,而恶意攻击者实施恶意代码或脚本植入的行为通常称为“挂马”。 什么是SEO暗链 SEO暗链是SEO黑帽手法中相当普遍的一种手段。笼统地说,它就是指一些人用非正常的手段获取其他网站的权限后,修改
2017-05-27 18:43:03 9916
转载 Sina微博模拟登录获取Cookies
转自:http://blog.sina.com.cn/s/blog_53e1aa480101fj66.html1.在登录之前我们需要先从新浪服务器获取两个变量:servertime,nonce。其中servertime中新浪的服务器时间,nonce是一个随机生成的字符串。获取的需要通过这样一个网络接口:http://login.sina.com.cn/sso/prelogin.php?en
2017-05-26 18:21:01 6236
转载 穷人的语义处理工具箱之二:语义编辑距离
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林转自:http://blog.csdn.net/malefactor/article/details/50957815语义编辑距离其实是去年和语义Jaccard一起做的,这篇文
2017-05-26 11:35:20 3245
转载 新浪微博用户兴趣建模系统架构
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林转自:http://blog.csdn.net/malefactor/article/details/51448202/*作者注:这是2011年左右新浪微博个人兴趣
2017-05-26 11:33:47 3638
转载 微博环境下利用综合策略构建推荐引擎
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林转自:http://blog.csdn.net/malefactor/article/details/53291266本文内容是2012年在新浪微博的工作,是关于微群综合推荐系统的PPT,曾在QCON2013上海
2017-05-26 11:32:46 3570
原创 python之word2vec实战学习
1.简介 在这里我是用的是python下的gensim模块中提供的word2vec,除此之外还有其他语言版本的。word2vec简单的来说就是:用来将单词文本转化成计算机可以计算使用的向量的一个转化工具,利用向量的距离或者夹角等可以反映出来向量在空间上的相似度的方法来得到文本在语义上的相似度。当然我们都知道在NLP领域最简单最常用的就是词袋模型了,这里的向量维数很大,包含了整个的语料库,
2017-05-25 16:04:42 5231 4
原创 MongoDB数据库读书笔记
这里是我在第一次接触到MongoDB数据库的时候在网上查找资料的总结以及MongoDB权威指南的读书笔记,在这里将自己的记录传到百度云,希望可以帮到同样是刚入门或者是对MongoDB数据库感兴趣的同学,希望我的学习笔记可以简明扼要的介绍一些MongoDB数据库中常用的概念以及一些基础的知识,达到快速入门的作用,节省一定的时间,欢迎留言交流!链接:http://pan.baidu.com/s/1
2017-05-23 17:51:35 3284
原创 Java 虚拟机学习
因为考虑到接下来的找工作的事情需要学习一点java的相关知识才可以,于是乎,就拿来《深入理解Java虚拟机》这本书,没事看看,这里记录一下自己的读书笔记,作为自己日后回顾的备份,也希望帮到需要的朋友。Java体系结构包括了四个独立的但相关的技术: Java程序设计语言、Java class文件格式、java应用编程接口(API)、Java虚拟机 当编写并运行一个J
2017-05-23 17:42:21 3276
原创 python神奇函数之eval()学习
python中有很多内置的很有用的工具函数,熟练地使用这些小工具绝对可以帮助你在工作中达到事半功倍的效果,今天由于需要用到了eval()函数,这个函数其实之前就用过了但是由于最近一直忙于看论文和方向上的一些其他的事,这个东西也就慢慢忘掉了,今天要用,索性直接再学一下,这里就作为是学习的记录了。eval()官方文档里面给出来的功能解释是:将字符串string对象转化为有效的表达式参与求值运算返回
2017-05-23 15:44:02 72885 2
原创 浅谈人工免疫算法
人工免疫算法简介生物的免疫系统是一种自适应的、自组织的、分布式的系统,是一种能够抵挡外来病原体的具有复杂功能的防御系统,人工免疫系统是一种灵感来源于生物体免疫系统,用于解决计算机领域问题的新兴算法。免疫系统是哺乳动物抵御外来病毒侵害的防御系统,动物的生命过程中会遇到各种伤害可能,免疫系统为其正常的活动起着重要的作用。免疫系统的一大特点就是用有限的资源有效地应对了数量庞大且种类多变的病毒入侵。受此特性
2017-05-23 10:53:13 24959 5
转载 Gephi简介
转自:http://blog.csdn.net/cleverlzc/article/details/50930658第一章.Gephi简介 1.1 最简单的8个图形: 简单的节点连线图: 1.2 Gephi图形界面 主界面中的Data Laboratory界面,这里主要用来查看数据,注意:节点和边的数据是分开的。 就像GML文件中的节点和边是有各自的标签的。
2017-05-22 20:55:49 21373 4
原创 浅谈社交网络中垃圾用户检测
马上就步入研二的时期了,研究方向也是换了又换几经波折,最近定下来的研究方向为:社交网络数据中的垃圾用户检测,这是一个比较新的领域,毕竟中文博客sina微博起步和鼎盛也没有多久的时间嘛,从最开始的仿冒网站检测到接下来的社交网络中用户隐私保护又到社交网络中的个性化服务推荐到最终的垃圾用户检测这里,可以说是一个很漫长的曲折的道路,中间每个方面都看了很多的论文,在这里也不敢说自己很懂这个领域,只是说以我现
2017-05-22 20:46:29 7332
原创 Markdown编辑器初步使用
Markdown是一款难得的优秀文本编辑器,苦于自己之前一次都没有使用过,今天在网上下载了Markdown的安装包然后找到了注册码激活之后就变成了Markdown pro版本的,学习一下Markdown 的一些书写习惯,下面是一些简单的记录。Markdown语法说明:http://daringfireball.net/projects/markdown/syntaxMarkdown语法说明
2017-05-21 20:30:47 3342
转载 布隆过滤器 (Bloom Filter) 详解
转自:http://www.cnblogs.com/allensun/archive/2011/02/16/1956532.html布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经
2017-05-21 14:55:26 3130
转载 【OpenCV入门指南】第一篇 安装OpenCV
转自:http://blog.csdn.net/morewindows/article/details/8225783/【OpenCV第一篇】安装OpenCV本篇主要介绍如何下载OpenCV安装程序,如何在VS2008下安装配置OpenCV,文章最后还介绍了一个使用OpenCV的简单小例子。《OpenCV入门指南》系列文章地址:http://blog.csdn.net/morewind
2017-05-19 22:13:19 3141
原创 数据挖掘数据的资料分享
最近整理电脑文档的时候发现了之前存储的一些数据挖掘相关的数据(应该是之前微信群里面的,具体来源忘记了),在这里贴出来,希望可以帮到别人国内数据:链接:http://pan.baidu.com/s/1i5nyjBn 密码:26bm好玩的数据集:链接:http://pan.baidu.com/s/1bSDIEi 密码:25zr微软数据:链接:http://pan.baidu.com/s/1
2017-05-19 15:38:35 3760 2
原创 AES-128\192\256加密算法及其安全脆弱分析
这是我的计算机网络通讯保密协议的课程报告,因为给定的课题就是关于AES相关的分析研究,但是我本人不是密码方面的,所以在完成这份课程报告期间查阅和参考了很多的资料,报告中相关的图均来源于网上知名资料和博客,实验性能分析部分是我独立完成的分析和测试,在这里贴出来是希望可以帮到需要的同学。AES-128\192\256加密算法及其安全脆弱分析摘 要 随着20世纪末差分密码分析及线性
2017-05-19 10:22:04 24140
转载 Cookie与Session的区别-总结很好的文章
转自:http://blog.csdn.net/qq_27093465/article/details/65662252本文分别对Cookie与Session做一个介绍和总结,并分别对两个知识点进行对比分析,让大家对Cookie和Session有一个更深入的了解,并对自己的开发工作中灵活运用带来启示。cookie机制Cookies是服务器在本地机器上存储的小段文本并随每一个
2017-05-17 19:33:14 3008
转载 使用Robomongo 连接MongoDB 3.x 报 Authorization failed 解决办法(转)
最近安装了mongodb3.1.4,并启用了权限验证,在dos窗口下操作没有任何问题,为了维护方便就下载了一个客户端工具Robomongo 0.8.5,用户名、密码的等配置好点解测试,结果连接服务没有问题,权限验证没有通过,如图查看日志,发现有一句:Failed to authenticate admin@admin with mechanism MONGODB-CR: Authent
2017-05-17 18:12:01 4532
转载 MongoDB数据库学习
转自:http://www.cnblogs.com/xiaoran1129/archive/2012/10/30/2746133.htmlMongoDB数据库学习教程 首先上mongodb官网(www.mongodb.org)看了一下开始文档,下了个windows版的,装了一下,玩起。 1,安装并启动数据库 从官网(www.mongodb.org/downl
2017-05-17 11:24:09 3668
原创 sublime text编辑器修改python代码的缩进设风格
sublime text2着实是一款轻量级的很受欢迎的代码编辑器,最右侧还提供了整个代码的缩略图,方便查看,个人感觉用起来还是很方便的,sublime中提供了很多的插件控制和安装功能,对于安装插件来说很便利,在这里主要想说的是:在sublime中修改python代码的缩进设置,不知道是自己电脑或者说是自己网上下载的sublime版本的问题还是什么,我的sublime编辑器中代码换行自动缩进风格不是
2017-05-17 09:41:49 7719
原创 python '/'与'//'学习
今天再使用python做除法的时候温习了一个知识点就是符号:”/“和”//“,这两个本质上都是用来在python中做除法的工具,不同的是:”/“是用来做浮点数的除法,而”//“是用来做整数的除法,很简单也很方便,下面通过一个简单的实例程序来说明一下:#!usr/bin/env python#encoding:utf-8from __future__ import division''
2017-05-17 09:28:51 3185
转载 一些机器学习(Machine Learning)的网站总结
转自:http://blog.csdn.net/chinaliping/article/details/12624621这里搜集了一些常见的和 machine learning 相关的网站,按照 topic 来分。RMw平坦软件园Active LearningRMw平坦软件园http://active-learning.net/,这里包括了关于Active Learning
2017-05-15 16:48:53 3192
转载 IT笔试面试资料大全
转自:http://blog.csdn.net/chinaliping/article/details/11634037c++笔试题汇总.pdf: http://www.t00y.com/file/11977106C++经典面试题大全.pdf: http://www.t00y.com/file/11977113c++面试题.chm: http://www.t00y.com/file
2017-05-15 16:45:49 4911
转载 高人对libsvm的经典总结(全面至极)
转自:http://www.ilovematlab.cn/thread-35262-1-1.htmlSVM相关资源汇总[matlab-libsvm-class-regress](by faruto) ----关于SVM的那点破事 by faruto 可以了,终于
2017-05-15 16:40:17 3484
转载 开发者成功使用机器学习的十大诀窍
转自:开发者成功使用机器学习的十大诀窍基于云的机器学习工具带来了使用机器学习创造和提供新的功能的可能性。然而,当我们使用不当时,这些工具会输出不好的结果。想要在应用程序中成功地融入机器学习的开发者,需要注意十大关键要点。在提供发现埋藏数据深层的模式的能力上,机器学习有着潜在的能力使得应用程序更加的强大并且更能响应用户的需求。精心调校好的算法能够从巨大的并且互不相同的数据源中
2017-05-14 10:52:37 3101
转载 张量初步学习
内容来源于:张量百科 张量分解张量(tensor)理论是数学的一个分支学科,在力学中有重要应用。张量这一术语起源于力学,它最初是用来表示弹性介质中各点应力状态的,后来张量理论发展成为力学和物理学的一个有力的数学工具。张量之所以重要,在于它可以满足一切物理定律必须与坐标系的选择无关的特性。张量概念是矢量概念的推广,矢量是一阶张量。张量是一个可用来表示在一些矢量、标量和其他张量之间的线
2017-05-14 10:49:57 6665
转载 二分图的最大匹配、完美匹配和匈牙利算法
转自:http://www.renfei.org/blog/bipartite-matching.html二分图的最大匹配、完美匹配和匈牙利算法August 1, 2013 / 算法这篇文章讲无权二分图(unweighted bipartite graph)的最大匹配(maximum matching)和完美匹配(perfect matching),以及用于求解匹配的匈牙利算法
2017-05-11 22:26:08 3241
转载 关于Beta分布、二项分布与Dirichlet分布、多项分布的关系
From : http://www.cnblogs.com/wybang/p/3206719.html http://cos.name/2013/01/lda-math-beta-dirichlet/ 在机器学习领域中,概率模型是一个常用的利器。用它来对问题进行建模,有几点好处:1)当给定参数分布的假设空间后,可以通过很严格的数学推导,得到模型的似然分布,这样模型可
2017-05-08 21:58:44 5093
转载 幂律分布
最近开始学习社交网络方面的知识,作为一个入门级的菜鸟,先了解一下基础的只是理论和方法是很有必要的,今天在社交网络图分布这一块看到了一个幂律分布,感觉很陌生因为之前的概率论和数理统计课程是不学习这个东西的,所以就上网查一些资料,作为自己的的学习资料,放在这里,也希望能帮到有同样需要的同学,欢迎有同样研究兴趣的一起交流。摘自:http://www.baike.com/wiki/%E5%B9%82%
2017-05-08 09:39:27 38174 4
转载 推荐站点
转自:http://blog.csdn.net/fangaoxin/article/details/6736337WindySky 个人图书倌 http://www.360doc.com/forumfocus.aspx Java基础例子 http
2017-05-07 18:14:31 3390
转载 十道海量数据处理面试题与十个方法大总结
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率
2017-05-07 18:12:38 3044
转载 softmax、GLM
转自:http://blog.csdn.net/acdreamers/article/details/44663305在上一篇文章中,讲述了广义线性模型。通过详细的讲解,针对某类指数分布族建立对应的广义线性模型。在本篇文章中,将继续来探讨广义线性模型的一个重要例子,它可以看成是Logistic回归的扩展,即softmax回归。 我们知道Logistic回归只
2017-05-07 17:32:30 3260
转载 协同过滤Collaborative Filtering
转自:http://blog.csdn.net/acdreamers/article/details/44672305今天要讲的主要内容是协同过滤,即Collaborative Filtering,简称CF。 Contents 1. 协同过滤的简介 2. 协同过滤的核心 3. 协同过滤的实现 4. 协同过滤的应用
2017-05-07 17:23:45 3697
hadoop-mysql-hbase环境部署套装.zip
2020-09-08
Ubuntu下gcc-7.5.0安装完整依赖.zip
2020-05-22
猫狗大战迁移学习项目.zip
2020-04-03
Microsoft Visual C++ 安装包【14.0和9.0】.rar
2019-09-05
pyltp安装包whl文件.rar
2019-08-08
中科院自动化所宗成庆-自然语言处理方法与应用.rar
2019-08-08
2018知识图谱发展报告.rar
2019-08-08
SQL SERVER查增改删,导入导出简便工具.rar
2019-08-08
Python数据分析与数据化运营.zip
2019-07-15
坦克大战tank.zip
2019-06-14
Docker技术入门与实战
2018-12-16
第一本Docker书(完整版)
2018-12-16
Deep Learning with PyTorch
2018-12-07
Python高效开发实战——Django、Tornado、Flask、Twisted
2018-11-27
python2和python3版本可用的OpenCV安装包
2018-11-16
Python计算机视觉编程(含源码)
2018-11-16
linecache安装包(python2和python3兼容)
2018-11-15
数据算法 Hadoop Spark大数据处理技巧
2018-10-31
sklearn超详细实践文档说明
2018-09-16
大规模网页相似度计算
2017-06-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人