- 博客(8)
- 资源 (16)
- 收藏
- 关注
原创 马尔科夫原理及应用场景
一、马尔科夫模型 马尔可夫模型,是指数学中具有马尔可夫性质的离散事件随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的。 《百度百科》 马尔可夫模型是随机变量X1,…Xn-1,Xn的序列,这些变量的范围所有可能取值集合,被称为状态空间,而Xn的值x则是在时间n的状态。用数学表达式的近似形式就是:P(Xn=x|Xn
2016-09-27 22:48:53 6077
原创 Spring常用注解、配置整理
1、context:property-placeholder加载配置信息的键值对,可以在专用的配置文件写好,然后通过该申明引入。2、import resource加载某个目录下的资源文件3、context:component-scan扫描Javabean,体现spring的IOC特点4、aop:aspectj-autoproxy加载代码中有@Aspect标签的切片,proxy-target-class属性值决定是接口的还是类的代理被创建。如果proxy-target-class 属性值被设置为
2016-09-24 21:23:22 589
原创 Spring常用工具类(ApplicationContextAware、DisposableBean、InitializingBean)
org.springframework.context.ApplicationContextAware实现该接口的类,可以在spring容器初始化的时候调用setApplicationContext方法,从而获得ApplicationContext中的所有bean。DisposableBean、InitializingBean import org.springframework.beans.factory.DisposableBean;import org.springframework.beans.fa
2016-09-24 21:17:47 2693
原创 aspectj-autoproxy Controller未生效解决方案
本周做业务需求,需要对api的响应时间做监控。第一想法是在需要监控的api里面答应日志,记录care的信息,这样的最大问题就是不容易扩展,需要在每个api里面添加几乎相同的代码。当时,Java的通用做法是切片,利用Java语言提供的反射能力,结合spring 的三大特性之一的aop(面向切面编程)思想,可以完全解耦的添加切片就行,这样在低耦合、高内聚的编程原则下是显得比较优雅,但是难免要牺牲一下效.Controller是定义在xxx-servlet.xml配置文件中,所以定义在applicationCont
2016-09-22 21:28:23 3133
转载 文本局部敏感哈希-MinHash算法原理
一、MinHash举例下面原文转自大牛博客:聚类之MinHash MinHash是基于Jaccard相似度的算法,一种降维的方法X,Y两个集合:X= {s1, s3, s6, s8, s9} ,Y= {s3, s4, s7, s8, s10}MinHash的基本原理:在X∪Y这个大的随机域里,选中的元素落在A∩B这个区域的概率,这个概率就等于Jaccard的相似
2016-09-18 23:03:06 6073
转载 文本局部敏感哈希-SimHash算法原理
最近在思考大量文本判重的问题,由于文本数据量大,加之文本判重算法,如BF、KMP、最长公共子串、后缀数组、字典树、DFA等计算时空复杂度并不适合数据量较大的工业应用场景。查找了相关资料,发现LSH(local sencetive ),即局部敏感哈希算法,可以应用本场景。LSH是指面对海量高维数据时,一般的算法无法快速降维查询相似度高的数据子集,利用特定的hash算法,将高维数据映射到低维空间,以较高概率快速寻找相似度高的数据子集。由于这方面积累极少,自己写出的文章比较肤浅,所以直接整理粘贴大牛文章,在此表示
2016-09-18 22:10:03 4274 1
原创 中文文本分类-朴素贝叶斯
贝叶斯分类器是基于先验概率与条件概率进行概率计算的分类器。X是特征属性,Y是分类属性,P(Y|{x0,x1....xn})是X在取值{x0,x1,...xn}的条件下Y发生的概率,成为P(Y)的后验概率,P(Y)的先验概率。实际在计算P(Y|{x0,x1....xn})的时候由于维度太高,至少需要考虑特征属性与分类属性的所有搭配情况,计算量大而且无法对待分类数据集进行全面覆盖。
2016-09-16 11:07:03 7897 8
原创 异常检测原理与实验
最近需要对欺诈报价进行识别处理,简单的模型就是给定很多不同数据集,需要找出每个spu下可能存在的欺诈数据,比如{20,22,30},其中的欺诈数据可能就是30。其实加以抽象,属于异常检测范围。异常检测是发现与大部分对象不同的对象,其中这些不同的对象称为离群点。一般异常检测的方法主要有数理统计法、数据挖掘方法。一般在预处理阶段发生的异常检测,更多的是依托数理统计的思想完成的。首先判断出数据的分布模型,比如某种分布(高斯分布、泊松分布等等)。然后根据原始数据(包括正常点与离群点),算出分布的参数,从而可以代入分
2016-09-14 22:04:43 6629
C#遗传算法程序(可视化版)
2014-05-25
Android初识之Activity组件
2014-05-13
微机接口小车控制系统
2014-01-14
数据结构课程设计报告及源代码
2014-01-10
数据库课程设计报告
2013-12-27
编译原理 LL文法
2013-11-30
正则文法识别单词
2013-11-30
三维变换与深度缓冲器算法
2013-11-23
多边形的扫描转换与区域填充
2013-11-22
二维变换与剪裁
2013-11-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人