![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
文章平均质量分 77
FredaQ
这个作者很懒,什么都没留下…
展开
-
SOAP 安全性扩展 数字签名
SOAP 安全性扩展:数字签名(SOAP-DSIG)定义了用数字方式签名SOAP 消息及确认签名的句法和处理规则。本文讨论了SOAP-DSIG 和SSL 有着怎样的关系,并描述了这两项技术是如何互补的。数字签名使初始用户和软件能够可靠地发送信息。可惜的是,简单对象访问协议(SimpleObject Access Protocol,SOAP)1.1并不包括签名消息的规定,因此也无此安翻译 2013-07-02 18:04:23 · 966 阅读 · 0 评论 -
初始Hive —— 深入浅出学Hive
目录:初始HiveHive安装与配置Hive 内建操作符与函数开发Hive JDBChive参数Hive 高级编程Hive QLHive Shell 基本操作hive 优化Hive体系结构Hive的原理 配套视频课程 第一部分:Hive简介什么是Hive•转载 2014-02-15 16:19:43 · 834 阅读 · 0 评论 -
几个hash算法的实现
1)几种经典的Hash算法的实现(源代码)URL:http://blog.minidx.com/2008/01/27/446.htmlByMinidxer| January 27, 2008哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段 明文而且哪怕只更改该段落的一个字母,转载 2014-02-15 18:49:40 · 765 阅读 · 0 评论 -
Heritrix使用的初步总结
一、框架介绍 公司最近项目要用到全文检索,检索对象是一些网站的网页内容,要使用到网络爬虫工具。 目前技术选型对象主要有两个:Heritrix 和 Nutch。二者均为Java开源框架,Heritrix 是 SourceForge上的开源产品,Nutch为Apache的一个子项目,它们都称作网络爬虫/蜘蛛( Web Crawler),它们实现的原理基本一致:深度遍历网站的资源,将这些资源转载 2013-12-16 17:56:02 · 630 阅读 · 0 评论 -
开源爬虫Labin,Nutch,Neritrix介绍和对比
-----------------------------------------------------------------------------------**************Larbin开发语言:C++http://larbin.sourceforge.net/index-eng.htmllarbin是个基于C++的web爬虫工具,拥有易于操作的界面,不过只转载 2013-12-16 14:14:38 · 663 阅读 · 0 评论 -
Nutch全文搜索学习笔记
1. Nutch 1.1.安装配置 1.1.1.Linux 一、安装JDK 如果你已经安装了JDK,并且已经设置了JAVA_HOME,那么跳过这一步 安装jdk 代码 sudo apt-get install sun-java5-jdk 或者从sun公司网站下载bin文件执行安装设置了JAVA_HOME代码sudo vi ~/.bash转载 2013-12-16 18:24:10 · 626 阅读 · 0 评论 -
如何保证数据传输过程安全性
对称加密:加密和解密使用同一个密钥特点:保证了数据的保密性。局限性:无法解决密钥交换问题。常用的算法有:DES,3DES,AES; 公钥加密:生成一个密钥对(私钥和公钥),加密时用私钥加密,解密时用公钥解密特点:解决了密钥交换问题。局限性:对大的数据加密速度慢。 单向加密:提取数据的特征码特点:定长输出,不可逆,可检验数据的完整性。局限性:无原创 2013-12-16 16:02:53 · 6514 阅读 · 1 评论 -
链表基本操作的实现
1 #include 2 #include 3#define LEN sizeof(struct student) 45 /*----------------数据定义----------------------*/6 7 //定义一个学生信息的结构体,包括学号,姓名和结构体类型的指针 8struct student 9{ 10 long num; //学号11转载 2013-11-15 09:23:04 · 648 阅读 · 0 评论 -
如何挖掘GA自然流量里的Not Provided数据?
感谢Fimen的投稿:经常用GA(Google Analytics)的朋友可能会对GA 自然流量报告里的not provided很头痛,not provided是谷歌为了保护用户隐私而有意过滤了那些已登陆用户的搜索信息。通常这些搜索信息会体现在url里面(如下图),对于匿名用户来说,GA会截取这部分字段来提取关键词数据,(图一:点击看大图)一旦登陆了谷歌之后,情况就不一样了。我们注转载 2013-07-29 15:07:44 · 1162 阅读 · 0 评论 -
电子公文数据交换的解决方法
XML在数据交换中的作用越来越大。在公文无纸化传输中,传输的不仅有文本,还有签名、word文件、其他附件等等,如何将这些二进制文件嵌入XML中进行传输,这里以嵌入一个签名图片为例,做简单介绍。转1.将二进制文件以Base64格式写入XML public void InsertFileToXml() { File转载 2013-07-18 12:55:12 · 727 阅读 · 0 评论 -
SOAP消息全面解析
SOAP消息可以是XML文件,该文件中一定要包含SOAP Envelope(封装)和SOAPBody(体),而SOAP Header(头)则是可以选择性的。 SOAP消息包含下列各项: ·Envelope是XML文件的顶层元素,代表该文件为SOAP消息。 ·Header提供了向SOAP消息中添加关于这条SOAP消息的某些要素(feature)的机制,不需要事先与商业伙伴建转载 2013-07-18 12:57:17 · 1787 阅读 · 0 评论 -
程序集的混淆及签名
一般地,用.NET编写的程序集在发布前,通常需要对代码进行混淆和强签名,下面简要介绍一下程序集的混淆和强签名的步骤及在实际开发中的实施。1.创建一个公钥/私钥对 首先,需要创建一个公钥/私钥对。密钥如果有密码保护,则生成pfx文件,没有密码生成snk文件,pfx比snk文件较大些,在Visual Studio命令提示符下:Sn -k Certify.snk 该转载 2013-07-12 16:51:30 · 905 阅读 · 0 评论 -
SOA需要怎样的事务控制方式
在一个基于SOA架构的分布式系统体系中,服务(Service)成为了基本的功能提供单元,无论与业务流程无关的基础功能,还是具体的业务逻辑,均实现在相应的服务之中。服务对外提供统一的接口,服务之间采用标准的通信方式进行交互,各个单一的服务精又有效的组合、编排成为一个有机的整体。在这样一个分布式系统中某个活动(Activity)的实现往往需要跨越单个服务的边界,如何协调多个服务之间的关系使之为活动功能转载 2013-07-05 14:58:13 · 664 阅读 · 0 评论 -
去哪儿网SEO定量分析和流量提升方案
感谢Frank的投稿:从SEO技术上来讲,去哪儿网SEO已经做的非常不错了。不过,SEO的目的是为了获取定向的潜在客户,所以一切可以获得潜在客户的推广方法都可以应用在SEO中。下面我就根据自己的经验和对去哪儿网的了解分析一下。一 去哪儿网SEO定量分析第一,从SEO数据上分析可知,去哪儿网百度收录1010万、谷歌收录821万,这说明了去哪儿网的内容非常多。有27181个关键词排转载 2013-07-19 09:16:27 · 929 阅读 · 0 评论