Daily Scrum 2012/12/03

TeamSHIT

今天的Scrum布置了接下来三天的任务,具体如下:

  隋宇豪:完成语料库的数据库设计与实现,继续完成CRAWLER-PIPELINE数据库;

  李斌、彭笑东:语料库翻译

  胡仁君:基于web文本本身,脱离语料库的标签抽取。

 

组员今天任务明天任务
胡仁君

任务367

确认信息抽取主要算法

 

任务428

正文分词

任务429

词频统计

 

彭笑东           

 任务368

确认信息抽取主要算法

任务374

翻译语料库

 

 

任务374

翻译语料库

李斌

 任务369

确认信息抽取主要算法

任务373

翻译语料库

 

任务373

翻译语料库

隋宇豪

任务375

创建预料字典数据库

任务287

相关数据库定义与实现

 

其中信息抽取的算法为:  

  1、标签(关键字)信息 基于词频统计,考虑预先有的预料字典和自动生成的关键字两部分。

  2、其他信息 如果有的话,提取。精度要求不高,借用正则式。

 

燃尽图和燃速图

 

            

转载于:https://www.cnblogs.com/teamshit/archive/2012/12/03/2800513.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值