- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 Join操作的总结以及在Presto中的使用
介绍在对多表进行查询时,不可避免的会涉及到JOIN操作,但是由于存在多种类型的JOIN,有时会令人困惑。本文首先会对常见的JOIN进行描述,由于分布式系统使用Presto对外提供查询接口,接着会介绍Presto中关于JOIN的一些独有的特性。最后列出了几个通用的JOIN的优化策略常见的JOIN操作为了方便演示,通过下面两张表进行演示TableA id name 1 Pirate 2
2016-10-21 13:45:33 20015 3
原创 程序员的机器学习入门笔记(五):文本分类的入门介绍
背景说明可以说在分析机器学习的数据源中最常见的知识发现主题是把数据对象或事件转换为预定的类别,再根据类别进行专门的处理,这是分类系统的基本任务。文本分类也如此:其实就是为用户给出的每个文档找到所属的正确类别(主题或概念)。想要实现这个任务,首先需要给出一组类别,然后根据这些类别收集相应的文本集合,构成训练数据集,训练集既包括分好类的文本文件也包括类别信息。 今天,在互联网的背景下自动化的文本分类被广
2016-10-13 12:01:23 5695 5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人