XiaoHu日志 9/5~9/6

9/5 导入线上实体后,原先包含多种学科信息的filter变得只包含一个学科信息,因为讯飞只会识别出第一个匹配上的实体,这样还不如之前拿到一个不准确的结果,然后用自己的方法从词库中识别出学科信息。我一个半小时都在解决这个问题,拿出一个方法,然后用新的方法来解决方法带来的问题,然后又拿新新的方法来解决新方法带来的新问题。

9/6 取消了线上实体,把filter重置为不定长字符串。我发现我可以从语料的角度解决问题,添加线上实体的目的是为了让我免除标注实体的烦恼。那么我可以使每一条语料的学科实体都是“语文”然后在录入时把“语文”替换为“filter”,这样也能达成原来的效果,还能保证我识别的准确度。在下午我调试时,我发现一个问题,我数学课的名字叫“函数上”,在查询过评时,如果我问“数学成绩”,是无法取得结果的。因为过评信息里不包含学科信息,它只来自一门叫“函数上”的课,但是不知道这门课的学科是什么。这就导致我无法查“数学成绩”,只能查“函数上”的成绩。这个情况在我搞学科查询的时候也发生过,但是其区别在于课程数据结构里是包含一个“subject”学科信息的,我只需要多考虑一个信息就可以。但是过评数据结构里没有“subject”,只有这门课的名称和其“id”。两种结构里的id是互通的,所以我可以对于一门课的过评找到与之对应的课程数据,然后在课程数据里找到subject信息。我在获取过评列表后,对于每个过评获取其课程的id,由于发出过评的课程一定在我的所有课程里,我可以在我的所有课程里找到与这个id对应的课程信息,我把学科信息附在过评的课程名称后,这样过评所对应的学科也能出现在对于课程名称分词的结果中,就实现了“数学成绩”的查询。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值