tagging file system + CMS构思

[需求]
1. 对凌乱的文档进行管理
2. 能够支持tagging
3. 能够方便的查找 a)根据tag b)根据内容
4. 随手方便的写一些文档

[调研]
1. CMS -- Content Management System
大多数都是web based
some script language + database, such as mysql
其更突出的理念是中心化
不是很符合我的个人易用原则
2. 传统的file system分目录组织
结构清晰
但是查找不便(这点倒是可以借助desktop searching tool来解决)
另外,不能进行多重组织
例如,对于音乐而言,拿”水手“来说吧,我想的一种放置方法是/data/music/by_author/郑智化/水手.mp3,另外的放法是/data/music/by_category/流行歌曲/水手.mp3
可是基于传统的文件系统,想达到上述目标就不是很方便。
使用symbol link? just kidding.

[构想]
基于tag的思路,进行改进,对tag增加一个分层次的概念,我称为cascade tag system。
首先,定义被标记的基本单元叫做”文档“。
一个文档可以有多个tag,而与以往的tag概念不同,这些tag不是处于同一个平面的,而是分层次的,也就是cts。
例如,上例中,水手.mp3是一个文档,我给出一下若干中tag的标识方法:
a) music/by_author/郑智化
b) music/by_category/流行歌曲
c) music/by_area/台湾
等等。
(St Monad原创,转载请保留出处 http://blog.csdn.net/st_monad/)
我们称music为by_author、by_category、by_area的父标签,而相应后三者称为music的子标签。
我们还定义上面的music是level 1 tag,by_*是level 2 tag,……
当然,music也可以在其他情况下是level 2 tag。
可以给出至少两个图:
a) tag cloud
b) tag relation map

tag cloud就是按照展平的方式去显示所有的tag的热门程度;
而tag relation map则给出了tag的层次关系和导航顺序,沿着level 1开始去寻找,和浏览传统的文件目录一样;
当然还可以直接键入一个tag进行全面的search(各level的都分别显示出来)。

等等吧。
全文检索嘛,再说了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
IOB标记是一种用于命名实体识别(NER)任务的标记方案。在IOB标记中,每个单词被标记为三种类型之一:B(开始),I(内部)或O(外部)。B标记表示一个实体的开始,I标记表示一个实体的内部,O标记表示一个单词不属于任何实体。这种标记方案的目的是准确地标记出文本中的实体边界。例如,在一个句子中,如果一个实体由三个单词组成,那么第一个单词将被标记为B,后续的单词将被标记为I,而其他单词将被标记为O。\[1\] 引用\[2\]解释了IOB标记方案的原理。它引入了三种标记类型:B(开始),I(内部)和O(外部)。B标记用于标记实体的开始,I标记用于标记实体的内部,O标记用于标记不属于任何实体的单词。这种标记方案的目的是提供准确的实体边界信息。 在IOB标记中,还可以使用Bigram模板来生成特征。Bigram模板考虑了前一个标记的影响,以生成CRF模型中的边函数。这意味着前一个输出标记和当前标记将组合成Bigram特征。这种方法可以提供更多的上下文信息,有助于提高命名实体识别的准确性。\[3\] 总结来说,IOB标记是一种用于命名实体识别任务的标记方案,它通过B、I和O标记来准确标记实体的边界。使用Bigram模板可以提供更多的上下文信息,提高命名实体识别的准确性。 #### 引用[.reference_title] - *1* [Bidirectional LSTM-CRF Models for Sequence Tagging](https://blog.csdn.net/weixin_42486623/article/details/117757217)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [自然语言处理学习日记3](https://blog.csdn.net/shengshengwang/article/details/77018330)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值