转载地址: http://www.3q2008.com/soft/search.asp?keyword=1830
注:加速的 原理 是 比对字符串中 有重复的 字符串 算法会计算出跳转规律 来实现加速 kmp算法通过一个O(m)的预处理来构建一个字串f的前缀数组(即计算字符串f每一个位置的字符串的前缀和后缀公共部分的最大长度,不包括字符串本身,否则最大长度始终是字符串本身),接下来的匹配过程会不断地使用到该前缀数组(而且对于主串T只需遍历一次),使匹配的复杂度降为O(n+m)。 KMP算法的 原理 就是 先根据 查询 串规律 生成 next数组, 这个 数组存储 查询串的 相同字符串的 规律 然后 在比对样本的 时候进行跳跃 相对暴力算法达到加速的 作用. 但数据量 小的话 肯定是 KMP 算法 执行 慢 他要生成 规律位置的数组 这个要耗费资源和时间 比对的样本数据量非常大的, 生成NEXT数组的耗时会忽略不计, KMP的效率就大于 暴力算法了,
|
表数量11
例文 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
论文名称 | nvarchar(500) | '' | ||
论文作者 | nvarchar(50) | '' | ||
论文内容 | nvarchar(2147483647) | '' | ||
总字数 | integer | 0 | ||
上传日期 | datetime | '0000-00-00 00:00:00.000000' |
表:1
句子分割字符 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
句子分割字符 | nvarchar(50) | '' |
表:2
性别 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
性别 | nvarchar(50) | '' |
表:3
报告 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
检测ID | nvarchar(50) | 是 | ||
KMP耗时不包含生成next数组 | float | 是 | ||
KMP耗时 | float | 是 | ||
暴力耗时 | float | 是 | ||
indexOf耗时 | float | 是 | ||
例文ID | integer | 是 | ||
句子 | nvarchar(2147483647) | 是 | ||
例文中位置 | integer | 是 | ||
字数 | integer | 是 |
表:4
检测 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
检测内容 | nvarchar(2147483647) | 是 | ||
字数 | integer | 是 | ||
检测最小句子字数 | integer | 是 | ||
句子数 | integer | 是 | ||
未重复句子数量 | integer | 是 | ||
重复句子数量 | integer | 是 | ||
重复率 | float | 是 | ||
检测日期 | datetime | 是 | ||
用户ID | nvarchar(50) | 是 |
表:5
用户 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
账号 | nvarchar(50) | '' | ||
密码 | nvarchar(50) | '' | ||
姓名 | nvarchar(50) | '' | ||
性别 | nvarchar(50) | '' | ||
手机号 | nvarchar(50) | '' |
表:6
管理员 | ||||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 是 | 0 |
账号 | nvarchar(50) | '' | ||
密码 | nvarchar(50) | '' |
表:7
v报告 | VIEW | |||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 0 | |
检测内容 | nvarchar(2147483647) | 是 | '0' | |
字数 | integer | 是 | 0 | |
检测最小句子字数 | integer | 是 | 0 | |
句子数 | integer | 是 | 0 | |
检测日期 | datetime | 是 | '0' | |
用户ID | nvarchar(50) | 是 | '0' | |
未重复字数 | Numeric | 0 | ||
重复字数 | Numeric | 0 | ||
重复率 | nvarchar(272) | 是 | '0' |
表:8
v未重复字数 | VIEW | |||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
未重复字数 | Numeric | 是 | 0 | |
检测ID | nvarchar(50) | 是 | '0' |
表:9
v重复字数 | VIEW | |||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
重复字数 | Numeric | 是 | 0 | |
检测ID | nvarchar(50) | 是 | '0' |
表:10
z检测 | VIEW | |||
字段名称 | 数据类型 | 自增主键 | 允许为空 | 默认值 |
id | integer | 是 | 0 | |
检测内容 | nvarchar(2147483647) | 是 | '0' | |
字数 | integer | 是 | 0 | |
检测最小句子字数 | integer | 是 | 0 | |
句子数 | integer | 是 | 0 | |
检测日期 | datetime | 是 | '0' | |
用户ID | nvarchar(50) | 是 | '0' | |
未重复字数 | Numeric | 0 | ||
重复字数 | Numeric | 0 | ||
重复率 | nvarchar(272) | 是 | '0' |
表:11
转载地址: http://www.3q2008.com/soft/search.asp?keyword=1830