ICTCLAS 学习
文章平均质量分 77
Cindyzhj
这个作者很懒,什么都没留下…
展开
-
嗯。加油!
看著大牛們的學習筆記,大致把 ICTCLAS 代碼看過一遍,對其算法結構也有了大致的瞭解。 接下來,要開始自己一點點學習了。 希望能寫點自己的東西出來吧。 加油,剛剛把一個很弱智的自己給鄙視了,且也有了點小小的動力,不錯! 不怕有問題,就怕發現不了問題,大腦袋轉起來吧,親愛的自己!原创 2012-05-30 15:09:28 · 380 阅读 · 0 评论 -
CSegGraph class 之自我解析(一)
此类的类函数如下, bool GenerateWordNet(char *sSentence,CDictionary &dictCore,bool bOriginalFreq=false); 参数为,传入的句子,核心字典,以及是否使用原始频率。 在其执行过程中,首先调用了函数 bool AtomSegment(char *sSentence); 即对原始句子进行原子切割。 成员变原创 2012-05-31 12:16:16 · 346 阅读 · 0 评论 -
CSegGraph class 之自我解析(二)
再看 GenerateWordNet 函数,这部分解析摘抄别人的笔记吧,因为有些处理自己还不是太明白。 GenerateWordNet 函数根据核心词典将原始的句子生成词图并存储在m_segGraph 中。首先会将句子进行原子切分,然后利用词典中的词及词性词频信息来置相应的权重值。第三个参数bOriginalFreq 的默认取值为flase ,当这个值为false 时为非原始的频率值,一般采用默原创 2012-06-01 10:10:21 · 386 阅读 · 0 评论