分拆统计字符串

原创 2004年07月30日 16:32:00

在数据库表tbl1中有一个字段Keywords,它是nvarchar类型,长度为1000,该字段的内容是所要分析的论文的关键字
id??????????????????????? keywords
-----------------------------------------------------------
1????????????????????????? kw1;kw2;kw3
2????????????????????????? kw2;kw3
3????????????????????????? kw3;kw1;kw4

问题1。
对于在keywords字段中出现的所有关键字集合(上例中关键字集合为{kw1,kw2,kw3,kw4})中的任意一个关键字,要统计它出现的次数(也就是包含该关键字的纪录的条数),然后写到另一张表中。最后的效果就是
keywords?????? count
-------------------------
kw1????????????? 2
kw2????????????? 2
kw3????????????? 3
kw4????????????? 1


问题2。
在此基础上,要进行组合查询。也就是说在整个关键字集合中任意抽出两个关键字,统计它们在数据库表纪录中同时出现的次数。对于上题,最后效果要是:
keywords???????????? count
----------------------------------
kw1;kw2??????????????? 1
kw1;kw3??????????????? 2
kw1;kw4??????????????? 1
kw2;kw3??????????????? 2
kw2;kw4??????????????? 0
kw3;kw4??????????????? 1

--------------------------------------------------------------------------------------

--统计示例

--为统计处理专门做的序数表
select top 1000 id=identity(int,1,1) into 序数表 from syscolumns a,syscolumns b
alter table 序数表 add constraint pk_id_序数表 primary key(id)
go

--示例数据
create table tbl1(id int,keywords nvarchar(1000))
insert tbl1 select 1,'kw1;kw2;kw3'
union? all? select 2,'kw2;kw3'
union? all? select 3,'kw3;kw1;kw4'
go

--第一种统计(计数)
select keyword=substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id)
?,[count]=count(distinct a.id)
from tbl1 a,序数表 b
where b.id<=len(a.keywords)
?and substring(';'+a.keywords,b.id,1)=';'
group by substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id)
go

--第二种统计(组合统计)
select keyword=substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id)
?,[count]=count(distinct a.id),a.id
into #t
from tbl1 a,序数表 b
where b.id<=len(a.keywords)
?and substring(';'+a.keywords,b.id,1)=';'
group by substring(a.keywords,b.id,charindex(';',a.keywords+';',b.id)-b.id),a.id

select keyword=a.keyword+';'+b.keyword,[count]=sum(case a.id when b.id then 1 else 0 end)
from #t a,#t b
where a.keywordgroup by a.keyword,b.keyword
order by keyword

drop table #t
go

--删除测试环境
drop table tbl1,序数表

/*--测试结果

--统计1
keyword??? count??
---------- --------
kw1??????? 2
kw2??????? 2
kw3??????? 3
kw4??????? 1

(所影响的行数为 4 行)


--统计2
keyword???????????????? count?????
----------------------- -----------
kw1;kw2???????????????? 1
kw1;kw3???????????????? 2
kw1;kw4???????????????? 1
kw2;kw3???????????????? 2
kw2;kw4???????????????? 0
kw3;kw4???????????????? 1

(所影响的行数为 6 行)
--*/

php字符串的长度计算、截取、分割

1.php计算字符串长度函数 php 字符串长度函数,在php测试字符串长度的函数有二个, 一个是strlen,另一个是mb_strlen前一个默认是支持,后一个需要开启一个插件,下面我们来介绍一下二...
  • u013939746
  • u013939746
  • 2015年09月08日 10:24
  • 4389

oracle11g 拆分字符串的详细技巧

功能需求                有一个比较长的SQL语句,查询出来中间会有类似“abc1,cbd2,db3,db5”这样的行记录,然后想要达到的效果就是将这样的记录按照逗号间隔符拆分出来一条变...
  • mchdba
  • mchdba
  • 2016年07月18日 23:26
  • 17959

用SQL将字符串按分隔符拆为子串

项目中同一个型号包含多个尺码信息,这些信息采用分隔符拼接在一起存放在一个字段中,现在需要提交每个型号的各个尺码信息,也就是说原来一条记录存储的,现在需要变成多条记录。...
  • dotnetstudio
  • dotnetstudio
  • 2014年02月25日 14:32
  • 6075

SQL各种字符串分拆处理函数

字符串分解 --各种字符串分拆处理函数.sql  -- --各种字符串分函数 if exists (select * from dbo.sysobjects...
  • qq798833488
  • qq798833488
  • 2014年05月12日 09:28
  • 1195

1、字符串分拆+行转列问题

最近看到一些比较好的SQL帖子,特地转载过来,以后遇到这些问题也好参考参考...
  • vip545058
  • vip545058
  • 2014年04月18日 16:53
  • 382

【一个按标志分拆字符串的好方法】strtok函数简介及应用。

刚刚接触strtok函数,感觉十分神奇。 定义: strtok 语法: #include char *strtok( char *str1, const ...
  • mig_davidli
  • mig_davidli
  • 2013年01月29日 10:46
  • 1108

在论坛中出现的比较难的sql问题:1(字符串分拆+行转列问题 SQL遍历截取字符串)

最近,在论坛中,出现了不少比较难的sql问题,虽然自己都能解决,但发现过几天后,就记不起来了,也忘记解决的方法了,所以,我觉得有必要记录下来,这样以后再次碰到这类问题,也能从中获取解答的思路。 1...
  • yupeigu
  • yupeigu
  • 2013年10月20日 16:55
  • 1607

带有标尺功能的分拆窗口界面

  • 2011年07月05日 20:58
  • 120KB
  • 下载

驱动程序中Irp包的更换与分拆示例

  • 2015年12月05日 00:17
  • 1.37MB
  • 下载

正整数无序分拆算法设计及论证

  • 2012年09月15日 14:51
  • 73KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:分拆统计字符串
举报原因:
原因补充:

(最多只允许输入30个字)