文本生成项目(第三步短评语生成)

项目场景:

最后一步就是短评语句生成,短评语句生成,和标题的区别,就是长度比标题长,可能据关键词,部分内容进行总结,这里也是我学习和跑通的一下技术点,没有应用到自己的垂直领域中,因此,这里也只是记录改代码点,和数据集的整理。


文本生成任务之营销文本生成

这里是根据作者ond_dependent博客学习而来传送门,具体代码描写可以参考这个博主,目前代码缺少对应数据集,经过查找找到了一个,能够适应该任务的数据集,但根据训练的感受,数据集必须要有一个依据已经写好的评论当测试集,如果没有,最后生成的话有些奇怪,另一个感受,数据增强那部分即英翻中,中翻英部分可以对最后整体的影响并不是很大,如果放到特点垂直领域,包含特有关键词那这部分影响可能就更小了,因此这一部分,我并没有运行,其余代码中缺少代码和缺少的数据都已经补全。数据集百度云地址:链接:https://pan.baidu.com/s/1Tz0y_tkrP8ubrNAoz0IXtw
包含所需的词向量,和训练集测试集。
github:https://github.com/zhichen-roger/comment_generation_learn.git


生成结果

我将预测.py里面随机句子换成固定的句子样子如下:
在这里插入图片描述

if __name__ == "__main__":
    pred = Predict()
    print('vocab_size: ', len(pred.vocab))
    # Randomly pick a sample in test set to predict.
    with open(config.test_data_path, 'r', encoding='utf-8') as test:
        # picked = random.choice(list(test))
        picked = '户外 服装 情侣 拼接 男女 皮肤 风衣 快速 防护 晒衣服 女款 天蓝 玫红 模特 展示 , 细节 展示 , 产品 展示 , 拥抱 夏季 , 轻 时尚 , 拼 出色 , 防 泼水 面料 , 我们 ' \
                 '的 优点 , 夏季 与 你 更 亲密 , 抗撕裂 , 还有 更 多 , 舒适 透气 , 保护 你 我们 更 用心 ! , 我们 都 有 ! , 轻盈 舒适 , 拼色 皮肤 衣带 你 , 附赠 收纳 ' \
                 '包 , 科技 快干 , 户外 防护 , 拼色 时尚 轻薄 皮肤 风衣 , 女款 , 防 泼水 , 透气 测试 展示 , 男款 , 第三步 , I 女款 , 第四步 , 第二步 , 让 你 与 夏天 ' \
                 '更 亲近 , 接缝 细节 出众 , 时尚 拼色 , 防 泼水 / 户外 防护 1 , 应有 的 , 游泳池 , 户外 , 一件 好 的 皮肤 衣 , 即可 快速 晒干 , 畅享 户外 乐趣 , , ' \
                 '30 ℃ 以上 通风 环境 , 阳光 照射 , 大 特点 , 对 阳光 有 较 好 的 折射 、 反射 、 散射 , 立体 剪裁 , 基本 信 , 性能 , 从而 达到 防护 作用 , 把 收纳袋 ' \
                 '口 拉紧 , , 产品 特点 , 男款 / 女款 , 准备 好 皮肤 衣 和 , 夏季 自 在 穿行 , 海滩 , 皮肤 风衣 收纳 步骤 , 颜色 : 男款 , 透气 , 袋中 , 立即 抢 , ' \
                 '收纳袋 , 透气性 : , 把 整理 好 的 皮肤 , 拿出 收纳袋 , 把 皮肤 , 收纳 步骤 完成 , 主 面料 : 锦 訾 面料 , 运动 更 随心 , 名称 : , 衣 竖向 放入 收纳 ' \
                 ', 户外 穿行 , 经过 防护 处理 的 多 微孔 纤维 组成 , , 防晒尺码 S 适用人群 女士 材质 锦涤 功能 防风 款式 标准型 <sep>舒爽 透气 , 快速 散热 , 让 身体 畅快 ' \
                 '吸收 , 轻盈 面料 , 丝柔 触感 , 亲肌 柔顺 , 轻松 出行 , 抗撕裂 面料 , 让 你 运动 更 舒心 。 '
        source, ref = picked.strip().split('<sep>')
    print('source: ', source.replace(" ", ""), '\n')
    greedy_prediction = pred.predict(source.split(),  beam_search=False)
    print('greedy: ', greedy_prediction.replace(" ", ""), '\n')
    beam_prediction = pred.predict(source.split(),  beam_search=True)
    print('beam: ', beam_prediction.replace(" ", ""), '\n')
    print('ref: ', ref.replace(" ", ""), '\n')

预测结果:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

经常喝假酒的胡小臣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值