分类与标签系统设计初体验-起

最新推荐文章于 2024-04-26 18:01:24 发布

counsellor

最新推荐文章于 2024-04-26 18:01:24 发布

阅读量7.4k

点赞数 1

分类专栏：数据库设计文章标签：标签数据库设计分类

本文链接：https://blog.csdn.net/counsellor/article/details/53409713

版权

3 篇文章 0 订阅

订阅专栏

假设我这里有一堆freebuf或者看雪上的cve漏洞分析的文章，文章数目已经超过1w条，这时候打算按照攻击方法或者受害者对象来分门别类，建立一棵有条理的知识树。

数据库：存储1对1或者1对多的标签关系存储，（可以用关系型数据库或者nosql来实现）；
操作：能够方便的增删改查；
操作响应速度：不要太慢，（需要使用索引或者cache加速复杂查询的速度）；

关系型数据库实现方式

1. 标签列表直接保存文章条目中。
思路代码：

post_id	title	content	tag_list
1001	分身	欲练此功，必先..	火影,鸣人,禁术

优点：实现简单，容易管理
缺点：删除一个标签随文章属增长而变慢

2. 使用3张表（文章表，文章与标签关系表，标签表）实现一对多的对应关系。
思路代码：
文章表

post_id	title	content
1001	分身	欲练此功，必先..

关系表

标签表

优点：实现简单，容易管理，tag内容不会出现冗余
缺点：多种类别的标签处于同一维度，分类混乱
改进：标签表可以插入一列，记作tag type，就能实现标签的分类了。但是类别本身的从属关系还是无法表示。比如（[日本:[书名:[火影],人物:[鸣人]]], 日本系列的该如何表示）

3. 使用nosql数据库，标签随便加，看着跟第一中思路一样会有冗余，但是增删改会很方便。

先提一个主流的思路，建立一级到两级索引表，然后利用redis的高性能key-value查询做cache。

关注