python古诗词生成_唐诗生成器

本文介绍了一个使用Python实现的唐诗生成器,通过唐诗语料库进行预处理、分词、生成搭配和主题,利用Flask框架构建交互式网站。用户可输入诗句或获取随机生成的唐诗。
摘要由CSDN通过智能技术生成

使用唐诗语料库,经过去噪预处理、分词、生成搭配、生成主题等过程,生成唐诗。

csdn下载地址:http://download.csdn.net/detail/lijiancheng0614/9840952

github上repository地址:https://github.com/lijiancheng0614/poem_generator

环境

Python 2.7

Flask

jieba

运行方法

如果是第一次运行,则需要安装相关的库及生成初始数据:

pip install flask

pip install jieba

python preprocess.py

python get_collocations.py

python get_topic.py

python get_start_words.py

以后只需要输入以下代码即可运行网站:

python index.py

实现

预处理

观察到给定的唐诗语料库存在以下噪声:

诗句中出现类似QLXQ.bmp的HTML标签。

出现空格、“.”等字符。

诗句中出现注释,用“(”、“)”标出来。

诗句不完整,出现方框字符。

对于前三种情况的噪声,直接去掉即可。对于最后一种噪声,直接把这行诗句忽略考虑。(此外,对于第三种噪声,“(”、“)”不在同一行时未处理。)

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值