文本分析苏轼的词以及苏轼的人生轨迹地图


最近热播剧《清平乐》可以说是颇有争议,无论好坏,背诵并默写天团着实给我们带来了一波回忆杀。于是我打起了分析宋词的主意。开始拿苏东坡下手。

一、宋词语料来源

本来想学学爬取中华诗词网的数据,但是发现只能看10页,后面的内容必须要在APP上观看,我觉得有些麻烦就放弃了。
于是我找到了一个 开源的诗词库
开源诗词库
里面以json格式存储了2万多首宋词,基本上全宋词这本著作也是这么多了吧。

二、分析东坡词

因为诗词这东西都是古汉语,现代的分词工具使用起来非常让人无语,比如把应该成词的拆开,把不是词的判断为一起。而且诗词的用语极其精炼讲究,单字成意,只分析字比分析词效果会更好。我并不是偷懒不分析词了,只是尝试过分析词之后发现真的不如分析字。当然也可能是因为仅仅分析了苏轼的词,语料库不够丰富的缘故。
于是我得到了以下几个结论:

2.1 苏轼最喜欢的季节

在这里插入图片描述
通过对春夏秋冬字频的统计,发现春字使用的频率最高,其次便是秋。意外的是夏冬两字极少。春秋可以承载历史,春秋也可以寄托情思,可能是这样的文化氛围使得夏冬着墨较少。

2.2 苏轼最喜欢的颜色

在这里插入图片描述
从古至今,红色一直都是最吉祥的颜色,也是最能代表中国的颜色。而白色就代表这纯洁清廉等等,是为官者最崇尚的颜色。黄色是最尊贵的颜色,青翠碧绿这些绿色系代表着生机勃勃。都是比较能量满满的颜色。

2.3 苏轼最喜欢的植物

在这里插入图片描述
刚才还说夏冬着墨较少,原来古人含蓄,都寄托在了景物上,夏天的杨柳依依,代表了离别时的不舍。冬天的傲骨寒梅,代表了文人的气节。

3.4 苏轼最喜欢的动物

在这里插入图片描述
马在古代是最重要的交通工具,也是驰骋疆场的行军利器,古来男子都爱马就像今之男子爱车一样。龙与凤更是尊贵的化身,是上进有为的青年孜孜以求的。

3.5 琴棋书画还是柴米油盐

在这里插入图片描述
苏轼一生格调极高,虽然获得了美食博主之名,对于花还是偏爱的。其次才是饮酒作画,然后是诗书,柴米油盐的往后靠靠吧,谁让咱这么有才华。

4.6 苏轼的人生轨迹

苏轼一生仕途坎坷,这也许是宋朝官吏的常态,升迁贬谪没经历过怎么可以进入背诵并默写天团。伴随着他的官场沉浮,走过了大江南北。于是我根据苏轼去过的地方,绘制了他的人生轨迹地图。
在这里插入图片描述
这原本是个动态图,如果想看动图可以看我下面的视频,在视频的后半部分。
【数说历史】谁是清平乐背诵并默写天团C位

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要爬取苏轼,需要先找到存储苏轼的网站,并确定需要爬取的信息的位置和格式。以下是一个示例程序,用于从“古诗文网”上爬取苏轼: ```python import requests from bs4 import BeautifulSoup url = "https://www.gushiwen.org/authors/authorvsw_852.aspx" # 苏轼所在页面 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"} # 发送请求并获取响应内容 response = requests.get(url, headers=headers) response.encoding = "utf-8" # 解析HTML页面 soup = BeautifulSoup(response.text, "html.parser") # 获取的列表 ci_list = soup.find_all("div", class_="sons")[1].find_all("a") # 遍历的列表并输出的内容 for ci in ci_list: ci_url = ci["href"] ci_title = ci.text ci_response = requests.get(ci_url, headers=headers) ci_response.encoding = "utf-8" ci_soup = BeautifulSoup(ci_response.text, "html.parser") ci_content = ci_soup.find("div", class_="contson").text.strip() print(f"{ci_title}\n{ci_content}\n") ``` 该程序使用requests模块向网站发送HTTP请求,并使用BeautifulSoup模块解析HTML页面。程序首先获取苏轼所在的页面,然后通过解析页面获取的列表。接着,程序遍历的列表,并获取每个的链接。使用的链接,程序再次发送HTTP请求获取的内容,并使用BeautifulSoup解析页面获取的正文。最后,程序输出每个的标题和内容。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值