自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 常用排序算法分析与实现

排序分为两类:内排序和外排序。内排序:指排序过程中,待排序列全部存放在内存中处理,不需涉及数据的内、外存交换。适用于元素序列不太大的小文件。外排序:指排序过程中,待排序列不能全部存放在内存中处理,内、外存之间需要多次进行数据交换。适用于元素序列太大,不能一次将其全部放入内存的大文件。 内排序分为六类:插入排序、交换排序、选择排序、归并排序、分配排序和计数排序。这里主要介绍前四类。

2015-10-27 15:23:38 497

转载 Callable接口与Runnable接口的区别

Java代码public interface Executor {    /**     * Executes the given command at some time in the future.  The command     * may execute in a new thread, in a pooled thread, or in the calling   

2015-09-07 16:38:41 6271

转载 Java RMI 框架(远程方法调用)

RMI(即Remote Method Invoke 远程方法调用)。在Java中,只要一个类extends了java.rmi.Remote接口,即可成为存在于服务器端的远程对象,供客户端访问并提供一定的服务。JavaDoc描述:Remote 接口用于标识其方法可以从非本地虚拟机上调用的接口。任何远程对象都必须直接或间接实现此接口。只有在“远程接口”(扩展 java.rmi.Remote 的接口)中

2015-09-07 16:31:18 788

原创 Servlet是否线程安全

servlet是线程安全的吗?这个问题,在网上没有看到一个确切的答案,所以我们来分析一下:首先什么是线程安全? 引用概念:如果你的代码所在的进程中有多个线程在同时运行,而这些线程可能会同时运行这段代码。如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是一样的,就是线程安全的。我们都知道servlet是多线程的,同时一个servlet实现类只会有一个实例对象,

2015-08-11 11:09:35 1920

原创 机器学习--Apriori算法

一、基本原理    关联分析(association analysis)就是从大规模数据集中寻找物品间的隐含关系。这里的主要问题是,寻找物品的不同组合是一项十分耗时的任务,所需计算代价很高,蛮力搜索方法并不能解决这个问题,所以需要用更智能的方法在合理的时间内找到频繁项集。Apriori算法正是基于该原理得到的。    关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系分为两种形式:

2015-05-21 19:51:35 937

原创 机器学习--k均值聚类(k-means)算法

一、基本原理    分类是指分类器根据已标注类别的训练集,通过训练可以对未知类别的样本进行分类。分类被称为监督学习。如果训练集的样本没有标注类别,那么就需要用到聚类。聚类是把相似的样本聚成一类,这种相似性通常以距离来度量。聚类被称为无监督学习。    聚类是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。它的

2015-05-20 20:19:18 2192

原创 机器学习--AdaBoost元算法

一、基本原理        假设有一些数据点,用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。训练分类器就是为了寻找最佳拟合参数,使用的是最优化算法。              现实生活中有一些情况,如判断邮件是否为垃圾邮件,判断患者癌细胞为恶性的还是良性的,以及预测患有疝病的马的存活问题等,这就属于分类问题了,是线性回归无法解决的。这里以线性回归为基础,讲解L

2015-05-12 21:36:32 620

原创 机器学习--Logistic回归算法案例

案例:从疝气病症预测病马的死亡率        准备数据时,数据中的缺失值是个非常棘手的问题。因为有时候数据相当昂贵,扔掉和重新获取都是不可取的,所以必须采用一些方法来解决这个问题。        在预处理阶段需要做两件事:第一,所有的缺失值必须用一个实数值来替换,因为我们使用的NumPy数据类型不允许包含缺失值。这里选择实数0来替换所有缺失值,恰好能适用于Logistic回归。第二,如果

2015-05-07 20:15:57 1406

原创 机器学习--Logistic回归算法

一、基本原理       假设有一些数据点,用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。       Sigmoid函数是一种阶跃函数,具体计算公式如下:                       二、算法流程        计算每个类别中的文档数目        对每篇训练文档:               对

2015-05-04 21:04:46 846

原创 机器学习--朴素贝叶斯算法案例

电子邮件垃圾过滤 1、如何从文本文档中构建自己的词列表。使用正则表达式切分句子,并将字符串全部转换为小写。##################################### 功能:切分文本# 输入变量:大字符串 big_string# 输出变量:字符串列表####################################def text_parse(b

2015-04-30 19:28:16 1023

原创 机器学习--朴素贝叶斯算法

一、基本原理       贝叶斯决策理论的核心思想是选择具有最高概率的决策,通俗的说就是待分类的数据分到哪个类别的概率最高就 属于哪个类别。 其基本原理非常简单:即待分类数据分到哪个类别的概率最高就属于哪个类。这就是“朴素”的原因。那为何要用贝叶斯公式?首先,先看贝叶斯公式: P(c/x) = P(x/c)*P(c) / P(x)如果我们容易求出等式右边的概率:P(x/c)

2015-04-28 20:27:09 646

原创 MySQL窗口输入密码后消失,解决办法

输入密码消失有两个原因:1)密码输入错误;2)MySQL服务没有开启。如果密码输入错误,重新输入正确的密码即可。如果MySQL服务没有开启,课通过如下步骤完成服务开启操作:开始 --> 附件 --> 运行。在运行框里面输入:services.msc,会弹出一个服务窗口,在服务窗口的条目下选择MySQL并双击打开。将服务状态改为开启,将启动类型改为自动,这样的话,每次开机

2015-04-26 23:02:27 4560

原创 机器学习--决策树(ID3)算法案例

#######################################功能:决策树的分类函数#输入变量:input_tree, feat_labels, test_vec# 决策树,分类标签,测试数据#输出变量:class_label 类标签######################################def classify(input_tree,

2015-04-24 17:57:56 2345

原创 MySQL加载JDBC驱动程序

首先安装MySQL数据库,我安装的是MySQL5.5,具体安装步骤这里就不介绍了。需要提醒的是,如果安装进程一直停在start service那里,无法继续进行下去的话,请参照我的博文《安装MySQL5.5时,到了start service没反应,解决方案》,应该能帮你解决困难。 接下来进入MySQL官网http://dev.mysql.com/downloads/connector/j/

2015-04-21 20:12:26 3403

原创 机器学习--决策树(ID3)算法

一、基本原理    决策树由决策结点、分支和叶子组成。在选择哪个属性作为结点的时候,采用信息论原理,计算信息增益,获得最大信息增益的属性就是最好的选择。信息增益是指原有数据集的熵减去按某个属性分类后数据集的熵所得的差值。然后采用递归的原则处理数据集,并得到了我们需要的决策树。   二、算法流程    检测数据集中的每个子项是否属于同一分类:        If 是,则回类标签;

2015-04-20 21:16:57 972

原创 机器学习--k-近邻(kNN)算法案例

一、改进约会网站的配对效果       想要预测的目标变量:不喜欢的人、魅力一般的人、极具魅力的人       样本特征:每年获得的飞行常客里程数、玩视频游戏所耗时间百分比、每周消费的冰淇淋公升数       约会数据信息存放在文本文件datingTestSet.txt中,每个样本数据占据一行,共有1000行。 实现步骤1、将文本文件中的数据进行解析##########

2015-04-17 10:29:22 1007

原创 机器学习--k-近邻(kNN)算法

一、基本原理        存在一个样本数据集合(也称训练样本集),并且样本集中每个数据都存在标签。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。我们一般只选择样本集中前k(k通常是不大于20的整数)个最相似的数据,最后选择k个最相似数据中出现次数最多的分类,作为新数据的分类。二、算法流程

2015-04-16 21:15:28 954

转载 安装MySQL5.5时,到了start service没反应,解决方案

安装MySQL5.5到了配置的最后一步时,停在start service那里一直不继续进行下去,卸载重装发现也是一样。网上搜索了一些解决方法,有些说是my.ini的配置问题,经过尝试,此路不通。另外说是卸载后要删掉注册表相关路径下的信息:【在命令行中,输入“regedit”后回车就可以打开注册表编辑器,这时你看到的就是注册表的内容了。】HKEY_LOCAL_MACHINE/SY

2015-04-16 17:09:57 6430 1

原创 机器学习--概述

何谓机器学习,简单地说,就是把无序的数据转换成有用的信息。         分类是机器学习的主要任务之一,目标是将实例数据划分到合适的分类中。首先需要做的是算法训练,即学习如何分类。通常我们为算法输入大量已分类数据作为算法的训练集。训练集是用于训练机器学习算法的数据样本集合。目标变量是机器学习算法的预测结果,在分类算法中目标变量的类型通常是标称型的,而在回归算法中通常是连续型的。训练样本集必须

2015-04-14 22:00:22 1113

原创 python包的导入——__init__.py

Python中常见的文件导入模式:事先写好一个.py文件,如果在另一个.py文件中需要导入事先写好的.py文件时,就将事先写好的.py文件拷贝到当前目录,或者是sys.path增加事先写好的.py文件所在的目录,然后import。这种做法对于少数文件是可行的,但如果程序数目多,层级复杂,就不适用。鉴于此,我们希望找到一种办法,像Java的Package一样,能将多个.py文件组织起来,以实现在外部

2015-03-11 11:36:51 7162 1

原创 numpy数组拼接方法介绍

数组拼接方法一思路:首先将数组转成列表,然后利用列表的拼接函数append()、extend()等进行拼接处理,最后将列表转成数组。示例1:>>> import numpy as np>>> a=np.array([1,2,5])>>> b=np.array([10,12,15])>>> a_list=list(a)>>> b_list=list(b)>>> a_l

2015-01-26 21:21:25 297672 7

转载 python中set类型的用法

python的set和其他语言类似, 是一个无序不重复元素集。基本功能:关系测试、消除重复元素。集合对象还支持union(并), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算。set类型支持 x in set, len(set),和 for x in set。作为一个无序的集合,set不记录元素位置或者插入点

2015-01-25 18:58:27 1661

原创 python排序函数sort()与sorted()区别

sort是容器的函数:sort(cmp=None, key=None, reverse=False)sorted是python的内建函数:sorted(iterable, cmp=None, key=None, reverse=False)参数解析:cmp:比较函数,比较什么参数由key决定。例如:cmp(e1, e2) 是具有两个参数的比较函数,返回值:负数(e1 e2)。

2015-01-25 16:58:23 15497

原创 python中的map、reduce、filter用法

map函数python实际上提供了一个内置的工具,map函数。map函数的定义:map(function, sequence[, sequence, ...]) -> list通过定义可以看到,这个函数的第一个参数是一个函数,剩下的参数是一个或多个序列,返回值是一个集合。function可以理解为是一个一对一或多对一函数,map的作用是以参数序列中的每一个元素调用function函

2015-01-23 11:11:37 1018 2

转载 numpy数组扩展函数repeat和tile用法

>>>import numpy as np>>> a = np.arange(10)  >>> a  array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])  >>> a.repeat(5)  array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4,

2015-01-23 10:41:51 86025 4

原创 python中append和extend的区别

1、列表可包含任何数据类型的元素,单个列表中的元素无须全为同一类型。2、append() 方法是向列表的尾部添加一个新的元素对象,是一个整体添加上去。3、extend()方法只接受一个列表作为参数,并将该参数的内容都添加到原有的列表中。代码示例:>>> list=['a','b','c']>>> list['a', 'b', 'c']>>> list.extend(['

2015-01-23 10:34:33 731

原创 python中xrange和range的比较

range函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。代码示例:>>> range(5)[0, 1, 2, 3, 4]>>> range(1,5)[1, 2, 3, 4]>>> range(0,6,2)[0, 2, 4] xrange函

2015-01-23 10:10:43 565

原创 python实现伪随机序列

伪随机序列又称为伪噪声序列。其中二进制伪随机序列在信号同步、扩频通信和多址通信等领域得到了广泛的应用。例如,在扩频通信中,使用伪噪声序列作为扩频信号,可使得扩频后的信号具有很宽的频谱,因此具有频率谱密度很小的特性。下面重点介绍m序列的实现。        m序列是最长线性移位寄存器序列的简称。其最大长度决定于移位寄存器的级数,码的结构决定于反馈抽头的位置和数量。不同的抽头的组合可以产生不同长度

2015-01-21 11:41:48 6513

原创 基带调制与星座图

1、基带调制的数学分析       基带调制的原理是将需要传输的基带信号通过波形转换、ADC转换、电压均衡、滤波等过程,变换成同相和正交两路正交信号,然后同相信号与载波信号相乘,正交信号与正交于载波的信号(通过对载波信号90度移相实现)相乘,再将混频后的两路信号合并,组成一个输出信号。       在大多数数字通信系统中,载波频率是固定的,因此只需考虑幅度和相位。未经调制的载波作为相位和频

2015-01-21 10:33:08 6690

转载 python实现进制转换

import os,sys # global definition# base = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E', 'F']base = [str(x) for x in range(10)] + [ chr(x) for x in range(ord('A'),

2015-01-20 20:48:55 1310

原创 python生成随机数

Python中的random模块用于生成随机数。 下面介绍一下random模块中最常用的几个函数。import random1、random.randomrandom.random()用于生成一个0到1的随机符点数: 0  2、random.uniformrandom.uniform()的函数原型为:random.uniform(a, b),用于生成一个指定范围

2015-01-13 15:45:55 2392

转载 java中equals()方法与“==”的比较

equals 方法是 java.lang.Object类的方法。有两种用法说明:(1)对于字符串变量来说,使用“==”和“equals()”方法比较字符串时,其比较方法不同。“==”比较两个变量本身的值,即两个对象在内存中的首地址。“equals()”比较字符串中所包含的内容是否相同。比如:String s1,s2,s3 = "abc", s4 ="abc" ;s1

2014-10-30 08:57:50 602

原创 我对调制的理解

1 引言现代信息社会以

2014-10-23 15:24:39 2264

原创 GNU Radio 模块扩展说明

1引言GNU Radio 是一个通过最小程度地结合硬件,用软件来定义无线电波发射和接收的方式,搭建无线电通信系统的开源软件系统。其应用程序用Python语言来编写,真实的信息处理过程是由C++浮点扩展库来实现。因此开发者可以获得实时高效的可复用的应用开发环境。GNU Radio不仅可以用于仿真,也可以在不用真实硬件,而使用预先记录或生成的数据来开发信号处理算法。GNU Radio提供了

2014-10-08 20:40:55 6008 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除