- 博客(11)
- 收藏
- 关注
原创 资深自然语言处理NLP工程师【问答摘要及推理项目】【试题知识点标注】【机器阅读理解】
项目一、问答摘要及推理项目项目二、试题知识点标注项目三、机器阅读理解专业选修:tensorflow与pytorch项目一目录:项目二目录:项目三目录:
2021-09-19 08:44:23 200 1
原创 天猫复购用户预测之DIN模型
1.项目背景电商经常会做大促,比如打折或者发放优惠券,尤其是在特殊的节日,比如黑色星期五,双十一等,目的是为了吸引大量的新用户。然而,许多吸引过来的购买者只是一次性交易,这些促销对于转换为长期的顾客来说可能收效甚微。提供了双十一促销期间的商家和新用户数据,目标是对于给定的商家,预测新用户是否能成为忠诚用户,即未来6个月内会购买这个商家的商品。2.数据预处理user_log user_id 用户ID item_id 商品ID
2020-07-25 20:32:19 3230 13
原创 FAQ问答机器人-ELMo模型和BERT模型
场景一假定我们现在进入了某家问答论坛类公司工作(例如某乎,或者某知道)。由于公司的产品是问答类的论坛,有人会在论坛上提问,然后有人在下方回复。每个问题可能有多个回答。现在我们考虑两个可以做的任务:对多个回答进行排序,最相关的、最好的回答应该排在前面,不好的回答排在后面。从这些回答中学出最佳回答,用一个星星(或者其他的特殊符号)标出来。场景二 现在我们有了很多的问题和问题的最佳答案。现在如果给我们一个新问题,我们如何作答呢?一种可行的思路是,我们可以从已有的问题库当中,寻找与新问题意思最
2020-07-11 21:06:36 1019 1
原创 文本摘要解决方案—不同版本的baseline模型和Bert预训练模型
1.项目背景从网络爬虫获取50000条新闻训练数据,每条数据的格式是第一句是一条新闻的摘要summarization,接下来是新闻详情text。任务是通过搭建baseline模型和Bert模型训练数据,分别输入几段新闻,输出新闻的摘要。数据准备:创建vocab.json文件,存放字典表,填充字符padding、unk、start和end标记在字典表前4位if os.path.exists('vocab.json'): chars, id2char, char2id = json.l
2020-07-10 18:36:59 1263 1
原创 基于Seq2Seq的问答摘要与推理问题方案
要求使用汽车大师提供的11万条技师与用户的多轮对话与诊断建议报告数据建立模型,基于对话文本、用户问题、车型与车系,输出包含摘要与推断的报告文本,考验模型的归纳总结与推断能力
2020-07-10 14:24:40 1192 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人