集算器不仅有大数据计算,还有诗和远方。最近看到不少写诗机器人的新闻,于是尝试用集算器简单地实现一个。这个实现真的很简单,简单到只有10几行代码,请看实现步骤:
1.下载字典和诗词
从网上找一个用于分词的字典文件,里面记录着每个中文词汇的词性。我从GitHub上找了一个,稍微处理之后保存到集文件dict.btx。
下载宋词三百首的txt文件,去掉空格和换行,以及其它文字以外的字符,得到一个长字符串。
2.训练
对上一步得到的长字符串进行分词,结果保存到集文件作为模板,实现代码如下:
A |
B |
C |
|
1 |
=file("dict.btx").import@bi().keys(WORD).index() |
||
2 |
=create(WORD,LEN,T) |
||
3 |
宋词三百首宴山亭赵佶北行见杏花裁剪冰绡,轻叠数…… |
||
4 |
=len(A3) |
>i=1 |
|
5 |
for (i<=A4) |
>word3 |