自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (41)
  • 收藏
  • 关注

转载 API钩挂技术

l  什么是API钩挂技术:API挂钩技术的目的就是:用自己的函数替换别人程序里的函数。当程序试图调用它原来应该使用的函数A的时候,我们将函数A替换成函数B,让程序调用B去进行我们想要的处理。一个例子就是我们经常使用的屏幕取词软件,例如金山词霸和博雅等等。当鼠标指向一个英文或者中文单词的时候,就会在旁边给出相应的翻译。实现该类软件的一个方法就是使用API钩挂技术。当鼠标在屏幕上移动时系统会

2013-07-26 11:12:48 1751

转载 Python的50个模块,满足你各种需要

Python具有强大的扩展能力,我列出了50个很棒的Python模块,包含几乎所有的需要:比如Databases,GUIs,Images, Sound, OS interaction, Web,以及其他。推荐收藏。 Graphical interface wxPython http://wxpython.org   Graphical interface pyGtk http://ww

2013-07-26 10:23:24 910

转载 python列表去重

Suppose you have a list in python that looks like this:['a','b','a']# or like this:[1,2,2,2,3,4,5,6,6,6,6]and you want to remove all duplicates so you get this result:['a','b']# or[

2013-07-25 15:21:51 1470

转载 python之加密解密模块pycrypto

This is a collection of both secure hash functions (such as SHA256 and RIPEMD160), and various encryption algorithms (AES, DES, RSA, ElGamal, etc.). The package is structured to make adding new modu

2013-07-24 18:09:04 21244

转载 ubuntu12.04搭建git服务器

ubuntu12.04搭建git服务器git是一个快速的分布式版本控制系统一、安装配置git1、安装git和openssha@ubuntu:~$ sudo apt-get install git-coreopenssh-server openssh-client添加用户git, 该用户将作为所有代码仓库和用户权限的管理者:a@ubuntu:~$ sudo useradd -

2013-07-24 17:35:26 1085

转载 python之zipfile模块(zip压缩)

zipfile是Python里用来做zip格式编码的压缩和解压缩的module,zipfile里有两个非常重要的class:ZipFile和ZipInfo。ZipFile是主要的类,用来创建和读取zip文件,而ZipInfo是存储的zip文件的每个文件的信息。#打包成zip文件import zipfilef = zipfile.ZipFile('archive.zip','w',zipfi

2013-07-22 11:32:23 26897 1

转载 python字符串操作

在python有各种各样的string操作函数。在历史上string类在python中经历了一段轮回的历史。在最开始的时候,python有一个专门的string的module,要使用string的方法要先import,但后来由于众多的python使用者的建议,从python2.0开始, string方法改为用S.method()的形式调用,只要S是一个字符串对象就可以这样使用,而不用impor

2013-07-19 10:44:45 1026 1

转载 windows PE结构解析

1 基本概念下表描述了贯穿于本文中的一些概念:名称描述地址是“虚拟地址”而不是“物理地址”。为什么不是“物理地址”呢?因为数据在内存的位置经常在变,这样可以节省内存开支、避开错误的内存位置等的优势。同时用户并不需要知道具体的“真实地址”,因为系统自己会为程序准备好内存空间的(只要内存足够大)镜像文件包含以EXE文件为代表的“可执行文件

2013-07-18 18:15:20 4710

转载 python之pefile模块(解析PE)

发现很多的朋友经常用到PE格式相关的开发,如解析PE文件的格式,获取相关的内容。比如常常用到的静态的病毒启发式检测模型的建立、病毒样本分类、查壳脱壳等。搜索了一下发现论坛里面没有我要讲的这个东西,于是我在这里向大家推荐pefile这个python库。这个是基于MIT licence的一个开源项目,你可以在上面做更多的开发。开发包的下载地址http://code.google.c

2013-07-18 18:07:09 15452 1

转载 Python之struct模块(处理二进制)

有的时候需要用python处理二进制数据,比如,存取文件,socket操作时.这时候,可以使用python的struct模块来完成.可以用 struct来处理c语言中的结构体.struct模块中最重要的三个函数是pack(), unpack(), calcsize()pack(fmt, v1, v2, ...) 按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构

2013-07-18 18:05:20 1600

转载 python文件操作

我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容最直

2013-07-18 13:43:37 1059

转载 Python 设置系统默认编码

python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置

2013-07-17 18:06:47 874

转载 python模块之xml.etree.ElementTree

python有三种方法解析XML,SAX,DOM,以及ElementTree###1.SAX (simple API for XML )       pyhton 标准库包含SAX解析器,SAX是一种典型的极为快速的工具,在解析XML时,不会占用大量内存。但是这是基于回调机制的,因此在某些数据中,它会调用某些方法进行传递。这意味着必须为数据指定句柄,以维持自己的状态,这是非常困难的

2013-07-17 17:00:19 10614

转载 python模块之hashlib

hashlib是个专门提供hash算法的库,现在里面包括md5, sha1, sha224, sha256, sha384, sha512,使用非常简单、方便。 md5经常用来做用户密码的存储。而sha1则经常用作数字签名。下面看看代码吧:#-*- encoding:utf-8-*-import hashliba = "a test string"print hashlib.md5

2013-07-17 16:43:47 1132

转载 python模块之binascii

二进制和ASCII互转Python版本:1.5及以后版本         binascii模块包含很多在二进制和ASCII编码的二进制表示转换的方法。通常情况不会直接使用这些功能,而是使用像UU,base64编码,或BinHex封装模块。 binascii模块包含更高级别的模块使用的,用C语言编写的低级高效功能。         偶有使用于字符串和ASCII的转换,比如

2013-07-17 16:35:42 35474

转载 python模块之os和os.path

os模块os.listdir(dirname):列出dirname下的目录和文件os.getcwd()函数得到当前工作目录,即当前Python脚本工作的目录路径。os.getenv()和os.putenv()函数分别用来读取和设置环境变量。os.curdir:返回但前目录(’.')os.chdir(dirname):改变工作目录到dirnameos.sep 可以

2013-07-17 16:01:00 932

原创 Computer.Systems.A.Programmers.Perspective笔记

#include int main(){ printf("hello, world\n");}unix> gcc -o hello hello.c,gcc编译器编译流程:                                                           Figure: The compilation systemHere, the

2013-07-10 13:57:25 1289

转载 排序算法

http://blog.csdn.net/morewindows/article/category/859207

2013-07-07 13:40:17 570

转载 聚类算法之CHAMELEON(Java实现)

CHAMELEON是一种两阶段聚类法。第一阶段把点分成很多小的簇;第二阶段根据相近程度合并这些小的簇。第一阶段采用K最邻近法,即把一个点和它最邻近的K个点连接起来。第二阶段计算任意两个簇的互连性RI和紧密性RC,当两个指标都比较大时才合并这两个簇。相对互连度相对紧密度|Ci|表示簇i内数据点的个数;EC(Ci)表示簇i内所有边的权重和;EC(Ci,Cj)表示跨越两个簇的所有边的权重和。

2013-07-01 17:14:30 947

转载 聚类算法之CHAMELEON(Java实现)

CHAMELEON是一种两阶段聚类法。第一阶段把点分成很多小的簇;第二阶段根据相近程度合并这些小的簇。第一阶段采用K最邻近法,即把一个点和它最邻近的K个点连接起来。第二阶段计算任意两个簇的互连性RI和紧密性RC,当两个指标都比较大时才合并这两个簇。相对互连度相对紧密度|Ci|表示簇i内数据点的个数;EC(Ci)表示簇i内所有边的权重和;EC(Ci,Cj)表示跨越两个簇的所有边的权重和。

2013-07-01 17:13:54 974

原创 DM NLP AI有用博客记载

http://www.cnblogs.com/zhangchaoyang/category/311107.html

2013-07-01 16:13:37 979

转载 主成分分析PCA

降维的必要性1.多重共线性--预测变量之间相互关联。多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯。2.高维空间本身具有稀疏性。一维正态分布有68%的值落于正负标准差之间,而在十维空间上只有0.02%。3.过多的变量会妨碍查找规律的建立。4.仅在变量层面上分析可能会忽略变量之间的潜在联系。例如几个预测变量可能落入仅反映数据某一方面特征的一个组内。降维的目的:1.减

2013-07-01 16:04:05 1763

转载 聚类算法之BIRCH(Java实现)

BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)天生就是为处理超大规模(至少要让你的内存容不下)的数据集而设计的,它可以在任何给定的内存下运行。关于BIRCH的更多特点先不介绍,我先讲一下算法的完整实现细节,对算法的实现过程搞清楚后再去看别人对该算法的评价才会感受深刻。你不需要具备B树的相关知识,我接下来会讲

2013-07-01 16:02:07 1349

转载 FP-Tree算法的实现

在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概念。设事务数据库为:

2013-07-01 16:00:51 3011

转载 聚类算法之DBScan(Java实现)

DBScan是一种基于密度的聚类算法,它有一个核心点的概念:如果一个点,在距它Eps的范围内有不少于MinPts个点,则该点就是核心点。核心和它Eps范围内的邻居形成一个簇。在一个簇内如果出现多个点都是核心点,则以这些核心点为中心的簇要合并。下图给出DBScan的聚类结果:  可以看到DBScan可以发现噪声,即它把(3,14)判定为噪声。到这里你一定有个疑问:为什么(8,

2013-07-01 15:59:44 2213

转载 聚类算法之CHAMELEON(Java实现)

CHAMELEON是一种两阶段聚类法。第一阶段把点分成很多小的簇;第二阶段根据相近程度合并这些小的簇。第一阶段采用K最邻近法,即把一个点和它最邻近的K个点连接起来。第二阶段计算任意两个簇的互连性RI和紧密性RC,当两个指标都比较大时才合并这两个簇。相对互连度相对紧密度|Ci|表示簇i内数据点的个数;EC(Ci)表示簇i内所有边的权重和;EC(Ci,Cj)表示跨越两个簇的所有边的权重和。

2013-07-01 15:59:19 2818

转载 聚类算法之KMeans(Java实现)

KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。当初始簇心选行不好时,KMeans的结果会很差,所以一般是多运行几次,按照一定标准(比如簇内的方差最小化)选择一个比较好的结果。下图给出对坐标点的聚类结果:下面给出核心算法的代码:

2013-07-01 15:57:58 1712

转载 朴素贝叶斯分类

先上问题吧,我们统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些天气是否打球(play)。如果给出新一天的气象指标数据:sunny,cool,high,TRUE,判断一下会不会去打球。table 1outlooktemperaturehumiditywindyplay

2013-07-01 15:51:52 1174

转载 决策树CART

分类回归树(CART,Classification And Regression Tree)也属于一种决策树,上回文我们介绍了基于ID3算法的决策树。作为上篇,这里只介绍CART是怎样用于分类的。分类回归树是一棵二叉树,且每个非叶子节点都有两个孩子,所以对于第一棵子树其叶子节点数比非叶子节点数多1。表1名称体温表面覆盖胎生产蛋

2013-07-01 15:50:32 11040 5

转载 决策树C4.5

C4.5决策树在ID3决策树的基础之上稍作改进,请先阅读ID3决策树。C4.5克服了ID3的2个缺点:1.用信息增益选择属性时偏向于选择分枝比较多的属性值,即取值多的属性2.不能处理连贯属性OutlookTemperatureHumidityWindyPlayGolf?sunny8585FA

2013-07-01 15:48:52 1468

转载 决策树ID3(Java实现)

先上问题吧,我们统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些天气是否打球(play)。如果给出新一天的气象指标数据:sunny,cool,high,TRUE,判断一下会不会去打球。table 1outlooktemperaturehumiditywindyplay

2013-07-01 15:44:58 1816

转载 信息论

信息论(Information Theory)是概率论与数理统计的一个分枝。用于信息处理、信息熵、通信系统、数据传输、率失真理论、密码学、信噪比、数据压缩和相关课题。基本概念先说明一点:在信息论里面对数log默认都是指以2为底数。自信息量联合自信息量条件自信息量信息熵条件熵联合熵根据链式规则,有可以得出信息增益Inform

2013-07-01 15:41:51 1341

日历选择组件

自定义java swing日历选择组件,可选择年月日时分秒

2013-03-16

Swing日期选择组件

Swing日期选择组件,有三种方案,由简到难

2013-01-19

数学之美pdf

数学之美.pdf

2012-12-06

C数值算法程序代码大全

C数值算法程序代码大全pdf

2012-08-19

innosetup制作安装包

innosetup将exe打包成安装包

2012-07-27

exe4j_windows

exe4j_windows将jar打包成exe

2012-07-27

EditPlus-v3.10.rar

EditPlus-v3.10.rar

2012-07-21

java 界面美化开源jar包

java 界面美化开源jar包

2012-07-21

commons java处理IO的一些工具类包

commons java处理IO的一些工具类包

2012-07-21

cpdetector.jar java检测文件编码开源jar包

cpdetector java检测文件编码开源jar包

2012-07-21

jfreechart java画图表开源jar包

jfreechart java画图表开源jar包

2012-07-21

java 应用程序绑定系统热键

java 应用程序绑定系统热键

2012-07-21

fatjar.jar eclipse打包成可执行的jar

fatjar.jar---eclipse打包成可执行的jar

2012-07-21

poi java操作office开源包

poi java操作office开源包

2012-07-21

MFC类库详解.chm

MFC类库详解.chm

2012-07-19

编译原理pdf

编译原理.pdf

2012-07-19

MFC入门教程pdf

MFC入门教程.pdf

2012-07-19

Oracle10g默认目录结构

Oracle10g默认目录结构

2012-07-19

mysql时间日期函数

mysql时间日期函数

2012-07-19

Swing速度慢和反映迟钝原因

Swing速度慢和反映迟钝原因

2012-07-19

基于MVC模型的swing图形组件的设计

基于MVC模型的swing图形组件的设计

2012-07-19

你必须知道的495个C语言问题

你必须知道的495个C语言问题

2012-07-19

C与指针高清版

C与指针,很经典,值得一看,不多说,看看就知道!

2012-07-18

论文撰写辅助工具.jar

论文撰写辅助系统小工具 Java Swing mysql数据库

2010-06-04

Swing深入及其详解

Swing深入及其详解 Swing深入及其详解

2010-06-04

Java计算器源代码 awt+swing图形界面

Java计算器源代码 awt+swing图形界面.doc

2010-06-04

Swing组件详解与指导

精通Java Swing程序设计 精通Java Swing程序设计

2010-06-04

精通Java Swing程序设计

精通Java Swing程序设计 精通Java Swing程序设计

2010-06-04

图形界面开发--AWT,Swing,SWT.pdf

图形界面开发--AWT,Swing,SWT

2010-06-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除