关系数据库风格的练习

到目前为止,我们仅靠代码就解决了词频问题。 本周,我们将在基础架构的帮助下解决该问题。 面对我们的特定问题,还有什么比关系数据库更适合?

这是《编程风格练习》焦点系列的 14 帖子。其他帖子包括:

  1. 以编程风格介绍练习
  2. 以编程风格进行练习,将内容堆叠起来
  3. 编程风格的练习,Kwisatz Haderach风格
  4. 编程风格的练习,递归
  5. 具有高阶功能的编程风格的练习
  6. 以编程风格进行练习
  7. 以编程风格进行练习,回到面向对象的编程
  8. 编程风格的练习:地图也是对象
  9. 编程风格的练习:事件驱动的编程
  10. 编程风格的练习和事件总线
  11. 反思编程风格的练习
  12. 面向方面的编程风格的练习
  13. 编程风格的练习:FP&I / O
  14. 关系数据库风格的练习 (本文)
  15. 编程风格的练习:电子表格
  16. 并发编程风格的练习
  17. 编程风格的练习:在线程之间共享数据
  18. 使用Hazelcast以编程风格进行练习
  19. MapReduce样式的练习
  20. 编程风格的练习总结

我们可以通过以下方式解决该问题:加载从数据库中的文件读取的数据,并使用相关查询检索前25个单词。 在SQL中,此查询将简单地转换为以下内容:

SELECTvalue,COUNT(*)ascount
  FROMwords
  GROUPBYvalue
  ORDERBYcountDESC
  LIMIT25;

Python或Kotlin都原生提供低级数据库访问API。 但是,它们都不是很有趣,因为它只是连接到数据库,然后发送SQL字符串进行查询。 取而代之的是,让我们趁此机会使用Kotlin SQL Framework Exposed

公开的是通过JDBC驱动程序为Kotlin语言编写的轻量级SQL库的原型。 它确实具有两层数据库访问:包装DSL的类型安全SQL和轻量级数据访问对象。

查询方式

这是Exposed查询功能的简化图:

公开的查询API

这是可以使用的方式:

objectWords:Table(){
  valid=long("id").primaryKey().autoIncrement()
  valdocId=long("docId")
  valvalue=varchar("value",50)
}

Words.slice(Words.value,Words.value.count()).selectAll()
  .groupBy(Words.value)
  .orderBy(Words.id.count(),SortOrder.DESC)
  .limit(25)
  .map{
    it[Words.value]toit[Words.value.count()]
  }.toMap()

DDL,连接和交易

当然,Exposed不仅提供查询功能,还提供许多其他功能,例如连接到数据库。 这是代码中使用的图:

公开的常规API

这是提供的功能的样本,以及代码样本:

表格创建
objectWords:Table(){ (1)
  valid=long("id").primaryKey().autoIncrement()
  valdocId=long("docId")
  valvalue=varchar("value",50)
}

SchemaUtils.create(Words) (2)
  1. 通过创建扩展提供的Table类的单例来定义Table
  2. 在数据库中创建表
数据库连接
Database.connect(
  "jdbc:h2:mem:test", (1)
  "org.h2.Driver" (2)
)
  1. JDBC URL
  2. JDBC驱动器类名称。 包含驱动程序的JAR必须可访问
交易处理
transaction{
  createDbSchema()
  loadFileIntoDatabase(filename)
  query()
}

transaction块中定义的每个代码段都将在transaction内部执行。 默认情况下,该事务是从线程local存储和检索的。

结论

至少可以说,在数据库中加载文本文件以执行查询并不是最佳选择。 实际上,这是一个非常糟糕的用例。

但是,在大多数情况下,让数据库完成所有工作是必经之路:请确保探索数据存储的所有功能,而不要通过语言提供的API在内存方面进行工作。

这篇文章的完整源代码可以在Github上找到。

翻译自: https://blog.frankel.ch/exercises-programming-style/14/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SQL是高级的非过程化编程语言,是沟通数据库服务器和客户端的重要工具,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以,具有完全不同底层结构的不同数据库系统,可以使用相同的SQL语言作为数据输入与管理的SQL接口。 它以记录集合作为操作对象,所有SQL语句接受集合作为输入,返回集合作为输出,这种集合特性允许一条SQL语句的输出作为另一条SQL语句的输入,所以SQL语句可以嵌套,这使它具有极大的灵活性和强大的功能,在多数情况下,在其他语言中需要一大段程序实现的功能只需要一个SQL语句就可以达到目的,这也意味着用SQL语言可以写出非常复杂的语句。    结构化查询语言(Structured Query Language)最早是IBM的圣约瑟研究实验室为其关系数据库管理系统SYSTEM R开发的一种查询语言,它的前身是SQUARE语言。SQL语言结构简洁,功能强大,简单易学,所以自从IBM公司1981年推出以来,SQL语言得到了广泛的应用。如今无论是像Oracle、Sybase、DB2、Informix、SQL Server这些大型的数据库管理系统,还是像Visual Foxpro、PowerBuilder这些PC上常用的数据库开发系统,都支持SQL语言作为查询语言。    美国国家标准局(ANSI)与国际标准化组织(ISO)已经制定了SQL标准。ANSI是一个美国工业和商业集团组织,负责开发美国的商务和通讯标准。ANSI同时也是ISO和International Electrotechnical Commission(IEC)的成员之一。ANSI 发布与国际标准组织相应的美国标准。1992年,ISO和IEC发布了SQL国际标准,称为SQL-92。ANSI随之发布的相应标准是ANSI SQL-92。ANSI SQL-92有时被称为ANSI SQL。尽管不同的关系数据库使用的SQL版本有一些差异,但大多数都遵循 ANSI SQL 标准。SQL Server使用ANSI SQL-92的扩展集,称为T-SQL,其遵循ANSI制定的 SQL-92标准。    SQL语言包含4个部分:    数据定义语言(DDL),例如:CREATE、DROP、ALTER等语句。    数据操作语言(DML),例如:INSERT(插入)、UPDATE(修改)、DELETE(删除)语句。    数据查询语言(DQL),例如:SELECT语句。    数据控制语言(DCL),例如:GRANT、REVOKE、COMMIT、ROLLBACK等语句。    SQL语言包括三种主要程序设计语言类别的语句:数据定义语言(DDL),数据操作语言(DML)及数据控制语言(DCL)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值