python红楼梦_用Python读红楼

最新推荐文章于 2024-01-09 12:21:23 发布

weixin_39978863

最新推荐文章于 2024-01-09 12:21:23 发布

阅读量1.9k

点赞数

文章标签： python红楼梦

使用Python的jieba分词和gensim库，分析红楼梦文本，找到与宝钗相似的人物，通过K-Means和层次聚类揭示人物间的关系，探讨算法在古典文学分析中的应用。

摘要由CSDN通过智能技术生成

用Python读红楼

最近受到这篇文章用Python读金庸武侠的启发。作为古典文(zhuang)学(bi)青年，一定要用Python来试试我读了20年的《红楼梦》。

首先从网上找到了红楼梦.txt(不清楚版本，可能是程甲版)和对应的人物表。

把人名加入词库，然后用结巴分词切分整个文章(我没有区分前八十回和后四十回)，加入gensim的训练中

def tranning():

with open('hlm.txt') as f:

data = [line.strip()

for line in f.readlines()

if line.strip()]

sentences = []

for line in data:

words = list(jieba.cut(line))

sentences.append(words)

model = gensim.models.Word2Vec(sentences,

size=100,

window=5,

min_count=5,

workers=4)

return model

训练生成一个以词向量表示词的模型，下面就用代码来找找和宝钗相似的人物吧。

for k, s in model.most_similar(positive=["宝钗"]):

print('{}:{}'.format(k, s))

探春:0.9595787525177002

紫鹃:0.9429049491882324

黛玉:0.9325058460235596

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39978863

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

基于Python的红楼梦文本分析.zip

05-20

Dream_of_the_Red_Kmeans.py ：基于python实现红楼梦聚类分析的主程序 Dream_of_the_Red_Mansion.txt : 红楼梦txt KMeansCluster_Class.py ：自己编写的KMeans程序 Red_Mansion_Dictionary.txt : 红楼梦人物名，...

python实验数据预处理案例_Python数据分析小案例——红楼梦文本分析（一）文本预处理...

weixin_39553904的博客

12-01

3335

本文开始介绍一个简单的数据分析案例,分析红楼梦文本,本文主要内容是将红楼梦文本按照章节获取每一回的标题,字数,段落数并保存到csv中方便后续数据分析红楼梦小说文本可以在这里下载链接：https://pan.baidu.com/s/1WEmunBN_Wo75EZd1cK6_lA提取码：3xco接下来直接上代码import pandas as pdimport numpy as npwith open...

参与评论您还未登录，请先登录后发表或查看评论

【python二级】红楼梦

weixin_64399725的博客

05-25

4237

【计算机二级python】综合题目

guanguan12319的博客

03-01

1144

【计算机二级python】综合题目

【3】python二级——操作题

m0_74045507的博客

03-21

3193

1.在考生文件夹下有个文件PY101.py,在横线处填写代码，完成如下功能。接收用户输入的一个大于10小于10的十进制正整数，输出这个正整数各字符的和，以25为宽度，居中显示，采用等号=填充。例如：输入：1357输出：# 在____________上补充代码s = input("请输入一个正整数: ")

关于红楼梦Python文本分析

m0_66424509的博客

03-21

3208

1. 获取小说文本读取文件。4. 对人名进行分析。

基于python对红楼梦的人物分析项目代码.zip

04-22

基于python对红楼梦的人物分析项目代码.zip基于python对红楼梦的人物分析项目代码.zip基于python对红楼梦的人物分析项目代码.zip基于python对红楼梦的人物分析项目代码.zip基于python对红楼梦的人物分析项目代码.zip...

python爬取下载红楼梦微改版.py

08-07

自己写的代码，没有任何问题

使用Python探索四大名著【红楼梦】人物之间的关系，简直帅呆了

人生苦短，还不用Python？

08-11

2959

《红楼梦》作为我国四大名著之一，古典小说的巅峰之作，粉丝量极其庞大，而红学也经久不衰。所以我们今天通过 Python 来捋一下红楼梦里那错综复杂的人物关系，话不多说，开始整活！

【Python】统计《红楼梦》中出场次数前十的人物

慢热型网友的博客

11-15

3332

【Python】统计《红楼梦》中出场次数前十的人物。

Python文本输入与输出--------导入TXT文件

qq_43861133的博客

02-27

2818

首先从网上下载得到TXT格式的文本文件，然后在Python中打开。 **f = open("D://文件集//2020.2//红楼梦.txt", "r", encoding='utf-8')** 1、“D://文件集//2020.2//红楼梦.txt” 是我所要打开的文本文件的绝对路径。 2、 "r"代表读取文件。 3、encoding='utf-8’代表文件编码格式是utf-8。 ***这里需要...

初探——数说《红楼》

数据森麟

04-15

645

作者：Seanboy 来源：Seanboy数据是信息的表现形式和载体，文字是记录思想和承载语言的符号，两者同为信号传递的工具，一个摩登，一个经典，他们既互相联系又互相补...

python红楼梦词频统计

tdl320721的博客

10-24

1万+

python红楼梦词频统计《红楼梦》人物的出场统计涉及对词汇的统计，中文文章的需要分词才能进行词频统计，需要用到jieba库。分析过程：代码： import jieba txt=open("G:\\红楼梦.txt","r",encoding="utf-8") txt.read() words=jieba.lcut(txt)#精准模式 a={} for word in words: if len(word)==1:#排除单个字符的统计结果 continue else:

用Python读红楼梦之——一、词云绘制