论文笔记
文章平均质量分 72
kite1988
这个作者很懒,什么都没留下…
展开
-
Sql在Mysql的执行
昨天解析了dblp.xml,存入数据库,生成了若干张临时表。今天上午,对这些临时表进行处理,然后存入实验设计的表中。数据库的数据量比较大,50多M,80多万条记录。因而执行sql时,就遇到了很多问题。 1、去除重复tuple 原始dblp.xml中,同一论文的存在几个完全相同的,所以要对数据库中的数据进行处理。网上搜到一段代码: 1) 查询某些属性相同tupl原创 2010-01-14 11:50:00 · 878 阅读 · 3 评论 -
实践出真知
Mysql中,可以使用: RENAME {DATABASE | SCHEMA} db_name TO new_db_name; 来修改database的名字。(database和schema的含义一样)。 比较疑惑的是,网上的某些方法是修改data目录下的文件名(文件名和数据库名相同),说这种方法只适合引擎为MyISAM的。对于INNODB,有一些方法: 1、原创 2010-01-18 18:40:00 · 458 阅读 · 0 评论 -
Effective keyword-based Selection of Relational Databases(未完成)
第一篇论文小结,估计只能以翻译为主了。 作者:Bei Yu、Guoliang Li、Karen Sollins、Anthony K.H. Tung发表会议:sigmod 08 一、简介 基于关键词的关系数据库信息检索成为一个热点技术,结合了数据库技术和信息检索(IR)。用户不需了解数据库的结构和SQL等数据库操纵语言,像使用搜索引擎一样,只需要输入关键字的信息,就原创 2010-01-09 18:44:00 · 991 阅读 · 0 评论 -
Mysql使用总结
毕业设计的程序主体编好了,运行少量数据没有任何问题,一旦数据量增加到22w,运行时间就长得令人发指。导师建议,程序中尽可能地减少与数据库交互的次数,尽可能地把工作丢给数据库完成。在这一思想的指导下,我三天大幅修改程序,部分代码几乎是翻新了一遍。总的来说,运行时间确实得到了很大的改善,把这三天的经验总结一下。 1、update操作 使用prepar原创 2010-04-12 21:01:00 · 756 阅读 · 0 评论 -
论文笔记——How to ConQueR Why-Not Questions
How to ConQueR Why-Not QuestionsQuoc Trung Tran and Chee-Yong ChanBackground数据库查询时,常常出现一些非用户预期的结果。如果系统提供:1)why操作(为什么某一些结果会出现?)2)why not操作(为什么某些结果没有出现)这两种操作,为用户解释查询结果,就能消除用户的疑惑,也能更好地帮助用户改进查询语句。Related Work1. Why操作一般的数据源工具就能解释。 2.Why not操作原创 2010-08-08 15:28:00 · 849 阅读 · 0 评论 -
论文笔记——CrowdFlow: Integrating Machine Learning with Mechanical Turk for Speed-Cost-Quality Flexibility
CrowdFlow: Integrating Machine Learning with Mechanical Turk for Speed-Cost-Quality Flexibility Alexander J. Quinn1, Benjamin B. Bederson1,2,3, Tom Yeh3, Jimmy Lin1,2IntroductionNLP等领域的问题,可由人或者机器来完成,各自特点为:1) 人:准确率高,但耗时、耗钱,代价高2) 机器:速度快,但准确率低,机器学习需要大量的trai原创 2010-08-17 15:59:00 · 1356 阅读 · 0 评论 -
论文笔记——Creating Speech and Language DataWith Amazon’s Mechanical Turk
Creating Speech and Language DataWith Amazon’s Mechanical TurkChris Callison-Burch and Mark DredzeIntroduction本文主要介绍 NAACL-2010 workshopAmazon’s Mechanical Turk是一个crowdsouring site,能够为researcher提供大量的data。疑问:1) 获取training data的cost降低后,能够做一些什么研究2) 获取新的trai原创 2010-08-17 17:11:00 · 750 阅读 · 0 评论 -
论文笔记——Making Database Systems Usable
Making Database Systems UsableH. V. Jagadish Adriane Chapman Aaron ElkissMagesh Jayapandian Yunyao Li Arnab Nandi Cong YuIntroduction数据库得到了很大的发展,但还远远不够:比如很多数据存在数据库外,维护数据库的成本高,普通用户无法直接使用数据库。原因:数据库的usability不够(schema过于复杂,SQL语句编写query不容易等等)。本文讨论的是基于用户角色的usabi原创 2010-08-27 16:02:00 · 754 阅读 · 0 评论 -
DBLP数据解析
因为参考论文使用的实验数据是dblp,所以我的论文也打算使用dblp的数据。在网上没有找到解析dblp.xml,然后存入数据库的例子。所以只能自己动手,丰衣足食。dblp官方网站提供了一个简单的使用sax解析的例子(http://dblp.uni-trier.de/db/about/simpleparser/),在例子的启发下,我写出了自己的xml解析版本。 一、dbl原创 2010-01-13 19:07:00 · 16643 阅读 · 155 评论