原标题:用Python作诗,生活仍有诗和远方
报 名
来源:TheodoreXu链接:
https://segmentfault.com/a/1190000013154329
常听说,现在的代码,就和唐朝的诗一样重要。
可对我们来说,写几行代码没什么,但是,要让我们真正地去写一首唐诗,那可就头大了。。既然如此,为何不干脆用代码写一首唐诗?
准备:
python3.6环境
推荐使用anaconda管理python包,可以对于每个项目,创建环境,并在该环境下下载项目需要的包。
推荐使用pycharm作为编译器。
GitHub代码:
https://github.com/theodore3131/TangshiGenerator
具体步骤:
使用爬虫爬取全唐诗,总共抓取了71000首。
#使用urllib3的内置函数构建爬虫的安全验证,来应对网站的反爬虫机制
http = urllib3.PoolManager(
cert_reqs= 'CERT_REQUIRED',
ca_certs=certifi.where())
#爬虫的目标网站
r = http.request( 'GET', url)
#爬虫获取的html数据
soup = BeautifulSoup(r.data, 'html.parser')
content = soup.find