大数据
文章平均质量分 82
dataspy
这个作者很懒,什么都没留下…
展开
-
优化 JOIN 性能 - 集算器
JOIN是关系数据库中常用运算,用于把多个表进行关联,关联条件一般是判断某个关联字段的值是否相等。随着关联表的增多或者关联条件越来越复杂,无论理解查询含义、实现查询语句,还是在查询的性能方面,可以说JOIN都是最具挑战的SQL运算,没有之一。特别是JOIN的性能,一直是个老大难问题。下面我们将基于数据计算中间件(DCM)——集算器,来提供一些提升运算性能的方法。当然,我们不是介绍如何在写SQL语句...原创 2018-09-02 14:27:07 · 609 阅读 · 0 评论 -
10行代码,实现写诗机器人
集算器不仅有大数据计算,还有诗和远方。最近看到不少写诗机器人的新闻,于是尝试用集算器简单地实现一个。这个实现真的很简单,简单到只有10 几行代码,请看实现步骤: 1 下载字典和诗词 从网上找一个用于分词的字典文件,里面记录着每个中文词汇的词性。我从GitHub 上找了一个,稍微处理之后保存到集文件dict.btx 。 下载宋词三百首的TXT 文件,去掉空格和换行,以及其它文字以外的字符,得到...原创 2018-09-12 21:26:40 · 4009 阅读 · 2 评论