- 博客(16)
- 资源 (12)
- 问答 (1)
- 收藏
- 关注
原创 动态规划(3)最短编辑距离
编辑距离,又称Levenshtein距离(俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。刚开始接触到这个概念是研一的时候看研三师兄写的论文,基于这个编辑距离的改进版本算法的,投的英文版的期刊,也是用动态规划做的,大家可以google学术搜下改进版本算法,这里分享下曹神的算法教程来介绍下原始算法。ok,言归正传
2016-08-08 16:42:50 977
原创 动态规划(2)-最长增序列
最长增序列(Longest Increasing Subsequence,LIS )给定一个数列,从中删掉任意若干项剩余的序列叫做它的一个子序列,求它的最长的子序列,满足子序列中的元素是单调递增的。 例如给定序列{1,6,3,5,4},答案是3,因为{1,3,4}和{1,3,5}就是长度最长的两个单增子序列。暴力枚举C(n,0)+C(n,1)+…+C(n,n)=2n2^n,还不算对单个C(n,i)
2016-08-07 22:15:30 1380 6
原创 动态规划(1)最长公共子序列
以前把大部分动态规划算法用java实现了遍,后来发现与python比代码行数太多,而python类似于伪代码,更容易一眼看出算法的核心,特此重新用python写一遍,方便快速了解算法。最长公共子序列问题就是求序列A= a1,a2,……ana_1,a_2,……a_n, 和B = b1,b2,……bmb_1,b_2,……b_m,的一个最长公共子序列。暴力枚举如果采用暴力枚举,只对A和B长度相同的子序列进
2016-08-07 22:12:26 726 6
原创 计算社会初探
“计算社会科学”的学科概念已提出四年多,但国内信息科学界的很多学者认为计算社会科学基本等同于社会计算 ,或者干脆将计算社会科学看作社会计算的一部分,我认为为计算社会科学与社会计算之间确有交叉 ,但两者同时也有不同的侧重面向。社会计算关注的重点有两个: 其一是关注信息技术在社会活动中的应用 ,关注在信息技术中如何嵌入人文知识使之更好地服务于社会活动; 其二是为社会科学领域研究提供研究工具,重点
2016-08-05 12:26:48 6388 2
原创 主流JVM的组成分析
JVM概念JVM分类JVM组成ClassLoaderNative InterfaceExecution EngineRuntime Data AreaJVM概念VM是虚拟机,也是一种规范,他遵循着冯·诺依曼体系结构的设计原理。冯·诺依曼体系结构中,指出计算机处理的数据和指令都是二进制数,采用存储程序方式不加区分的存储在同一个存储器里,并且顺序执行,指令由操作码和地址码组成,操作码决定了操
2016-08-01 20:01:44 1586
原创 maven构建CDH开发环境
使用cloudera hadoop开发hadoop程序,官方文档上有两种方法。第一种即把相应jar包拷贝到工程目录中去,另一种即使用maven管理依赖jar包。直接拷贝如果直接在构建节点上开发程序的话直接指向jar包目录即可。 默认目录 hadoop:/opt/cloudera/parcels/CDH/lib CDH文件是指向${CDH.Version}的一个链接 lib下可用的包包含如下:
2016-05-12 12:51:04 7180
原创 集群批量安装jdk
几十台机器对jdk嗷嗷待装,不想一个个装,写个脚本批量安装。 前提:root下满足各节点ssh免密码通信,或者自定义用户脚本里面加个sudo,并且在sudoer里面允许免密码。 1. 在node1节点上下载最新官方rpm包,地址 2. wget 这个地址无效,只会下到当前网页,因为网页有个接受协议的cookie认证,所以加块饼干吧。wget --no-check-certificate -
2016-05-10 15:40:25 1732
原创 利用mahout的Bayes算法的文本情感分析
本文主要对酒店评论信息进行情感分析,根据提供的ChnSentiCorp_htl_unba_10000语料集,通过划分训练集建模,最后通过测试机测试模型处理精度。朴素贝叶斯分类算法概述朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别
2016-03-23 11:07:36 2841
原创 js中对象属性值排序(字典倒排序)
[TOC] 教女朋友前端js的过程中发现好多书里面都没有讲倒排序,网上搜了也没有,故此新开一文讲一下。sort函数先说一下sort函数:var a=[3,2,5,7,3,6,8,9,1,2];document.writeln(a.sort());结果即是对a顺序排序; 逆序排序两种方法,第一种:document.writeln(a.sort().reverse());第二种,查看sort方法介
2016-03-20 17:26:58 45554 3
转载 皇冠上的珍珠 统治世界的十大算法
软件正在统治世界。而软件的核心则是算法。算法千千万万,又有哪些算法属于“皇冠上的珍珠”呢?Marcos Otero 给出了他的看法。什么是算法?通俗而言,算法是一个定义明确的计算过程,可以一些值或一组值作为输入并产生一些值或一组值作为输出。因此算法就是将输入转为输出的一系列计算步骤。—Thomas H. Cormen,Chales E. Leiserson,算法入门
2014-07-09 15:15:58 1081
转载 字符串模式匹配KMP算法
字符串模式匹配KMP算法字符串模式匹配指的是,找出特定的模式串在一个较长的字符串中出现的位置。朴素的模式匹配算法很直观的可以写出下面的代码,来找出模式串在一个长字符串中出现的位置。 1: /* 2: 朴素的模式匹配算法 3: 功能:字符串的模式匹配 4: 参数: 5:
2013-11-29 19:41:28 666
转载 SessionFactory的一些细节
What does sessionFactory.getCurrentSession() do? First, you can call itas many times and anywhere youlike, once you get hold of your SessionFactory (easy thanks toHibernateUtil). The getCurrentS
2013-11-28 12:39:01 721
翻译 精度数学,mysql
精度数学目录24.1. 数值的类型24.2. DECIMAL数据类型更改24.3. 表达式处理24.4. 四舍五入24.5. 精度数学示例MySQL 5.1提供了对精度数学的支持,也就是说,数值处理功能,它能给出极其精确的结果,并能对无效值进行高度控制。精度数学基于下述两种特性:· SQL模式,控制服务器接受或拒绝无效值的严格程度(请参见5.
2013-11-28 12:32:19 926
原创 文件上传——从servlet到struts
处理文件上传 如果表单类型为multipart/form-data的话,在servlet中注意就不能采用传统方式获取数据,为方便用户处理文件上传数据,Apache 开源组织提供了一个用来处理表单文件上传的一个开源组件( Commons-fileupload ),该组件性能优异,并且其API使用极其简单,可以让开发人员轻松实现web文件上传功能,因此在web开发中实现文件上传功能,通常使用
2013-07-25 16:08:54 833
原创 Hibernate4.2 枚举映射问题
把以前的项目用Hibernate4.2 更新后出现了一系列问题。笔者是hibernate-release-4.2.2.Final版本折腾时间最久的便是关于枚举映射问题。在做了个Gender的枚举类之后,采用xml方式配置hbm文件: <!-- 12为java.sql.Types.VARCHAR常量值,即保存枚举的字面值到数据
2013-07-15 17:46:55 1001
转载 mime type 与 dataflavor
多用途互联网邮件扩展(MIME,Multipurpose Internet Mail Extensions)是一个互联网标准,它扩展了电子邮件标准,使其能够支持非ASCII字符、二进制格式附件等多种格式的邮件消息。内容类型(Content-Type),这个头部领域用于指定消息的类型。一般以下面的形式出现。Content-Type: [type]/[subtype]; param
2013-01-23 12:59:39 1062
lead bbs基于asp
2013-01-23
aptana studio 3.4.1 对XmlHttpRequest对象引用是弱类型?
2013-07-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人