- 博客(2)
- 收藏
- 关注
原创 Python爬虫,爬取快看漫画每日更新模块
根据基本的爬虫知识,爬取快看漫画每日更新模块的漫画名,该漫画的描述和相对应的封面图片。一、爬虫是什么?爬虫是通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。
2023-04-23 22:38:38 1815 4
原创 自然语言处理《活着》
自然语言处理小说文本,各个功能以函数形式实现,并在主程序中调用。比如分词功能,词频词性统计保存txt功能,统计人名_词频并保存txt功能,读取txt文件生成柱状图可视化功能,分词词频词性可视化功能,关系图可视化功能,pyecharts词云可视化功能,建立人工手动自定义词典功能(程序中有写,但最后没有使用,去掉注释后是可以使用的),jieba绘制词云_人名可视化并保存png图片功能。# 停词文档,排除停用词# 生成词频词性文件# 分词生成人物词频# 绘制分词的词频词性可视化图。
2023-03-21 22:51:51 813 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人