python 红楼梦 人物关系_用Python来理一理红楼梦里的这些关系

本文介绍了如何使用Python处理红楼梦TXT文件,通过jieba分词和自定义词典,分析人物关系并创建关系图表,展示了如何从数据处理到可视化整个过程。
摘要由CSDN通过智能技术生成

最近把红楼梦又抽空看了一遍,古典中的经典,我真无法用言辞赞美她。今天,想跟大家一起用 Python 来理一理红楼梦中的的那些关系

不要问我为啥是红楼梦,而不是水浒三国或西游,都是经典,但我个人还是更喜欢偏古典的书,红楼梦也是我多次反复品读的为数不多的小说,对它的感情也是最深的。

好了好了这些都不重要,重要的是我们今天要用Python来理红楼梦的关系!

数据准备红楼梦 TXT 文件一份

金陵十二钗 + 贾宝玉 人物名称列表

人物列表内容如下:

宝玉 nr

黛玉 nr

宝钗 nr

湘云 nr

凤姐 nr

李纨 nr

元春 nr

迎春 nr

探春 nr

惜春 nr

妙玉 nr

巧姐 nr

秦氏 nr

这份列表,同时也是为了做分词时使用,后面的 nr 就是人名的意思。

数据处理

读取数据并加载词典with open("红楼梦.txt", encoding='gb18030') as f:

honglou = f.readlines()

jieba.load_userdict("renwu_forcut")

renwu_data = pd.read_csv("renwu_forcut", header=-1)

mylist = [k[0].split(" ")[0] for k in renwu_data.values.tolist()]

这样

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值