walden文本字符统计3.0

最新推荐文章于 2024-09-25 09:59:34 发布

無移升：）

最新推荐文章于 2024-09-25 09:59:34 发布

阅读量162

点赞数

本文链接：https://blog.csdn.net/Xkarsa/article/details/109807451

版权

python

%%writefile walden.py
#打开并读取文件
file = open(r'C:\Users\Administrator\Desktop\Walden.txt','r')
lines = file.readlines() 
# 要把每行拆成单词
words = []

for line in lines:
    tmp_list = line.split(" ")
    for word in tmp_list:
        words.append(word.replace(',','').replace('.','').replace(':','').replace(';','').lower())
#对word中每一个元素计算他出现的个数
#把统计结果保存到字典中，字典的key是单词，value是单词出现的次数
word_count = {}
word_set = set(words)
for word in words:
    count_num = words.count(word)
    word_count[word] = count_num

word_count
#对word_count字典进行排序，按照出现的次数（value）降序排序
sorted(word_count.items(),key=lambda item: item[1],reverse=True)

#word_count.items

Writing walden.py

#整合代码

file.read()

''

file.read()  #读出来是文本（字符串）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

無移升：）

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

HandyJSON库简介

xiangzhihong8的专栏

10-12

7760

背景 JSON是移动开发中常用的应用层数据交换协议。最常见的场景便是，客户端向服务端发起网络请求，服务端返回JSON文本，然后客户端解析这个JSON文本到具体的Model，再把对应数据展现到页面上。但在编程的时候，处理JSON是一件麻烦事。在iOS开发中，在不引入任何轮子的情况下，通常需要先把JSON转为Dictionary，然后还要记住每个数据对应的Key，用这个Key在Dictionary中...

【作业】python——小说Walden的词频统计，并从高到低排序

iHUQAQ的博客

11-17

3075

本文章环境为Pychram-python3.8 一·确定文件位置确定Walden.txt文件位置例如：将Walden.txt与py代码文件放至同一文件夹二·逐步前进 1. 打开文件 f=open('Walden.txt','r',encoding='utf-8') 因为直接放在同一文件夹，文件路径为Walden.txt。若非同一文件夹，可以右键Walden.txt选择属性：如上图，放在桌面上的Walden.txt文件的属性显示位置为C:\Users\iHU\Desktop 'r’为读文本，从

参与评论您还未登录，请先登录后发表或查看评论

利用Python对瓦尔登湖进行词频统计

崔昕阳的博客

04-20

3201

一、目的深入理解列表的使用，利用python对瓦尔登湖文本（英文）进行词频统计。二、必要知识 1.python数据结构 2.数据结构的推导式（List Comprehension）如我们需要将5个元素装进列表中，写法： b = [i for i in range(1,6)] #显示列表 print(b) 运行结果： 3.split分词实例： senten...

18.05 统计一个一篇英文小说的单词数，从文件读取小说，统计其英文单词个数，并将个数保存到文件file.txt中

乌合

11-08

639

非原创，参考大部分CSDN大佬代码。 #include <iostream> #include <fstream> using namespace std; bool isLetter(char letter) { //判断字符是不是字母 if ((letter >= 'a' && letter <= 'z') || (letter >= 'A' && letter <= 'Z')) { return true;

1.5 python文件操作

lue_lue_lue_的博客

07-04

793

1.5 python文件操作1.5.1 文件的具体操作打开文件写数据(write)读数据(read)part 1part 2总结打开文件文件操作方法1.5.2 操作实例 1.5.1 文件的具体操作打开文件 f = open('test.txt', 'w') 在python，使用open函数，可以打开一个已经存在的文件，或者创建一个新文件： open(文件名，访问模式) 写数据(write) f = open('test.txt', 'w') f.write('hello world,\n') f.wr

Python入门

weixin_33749242的博客

05-09

281

一、为什么选择Python？　　1、Python 追求的是找到最好的解决方案，相比之下，其他语言追求的是多种解决方案。　　2、Python 的最大优点，是使你能够专注于解决问题而不是去搞明白语言本身。二、准备工作　　1、软件安装　　　　使用 Anaconda 和 PyCharm。　　　　使用 Anaconda 能帮你安装好许多麻烦的东西，包括： Python 环境、pip ...

Python学习零基础

weixin_60994019的博客

03-21

1434

Python基本用法易上手

python初级学习

无

11-25

1168

即可。这个也许跟传入参数的方式有点像,但是千万别记混了!这可是在定义的时候做的事情!

iOS、mac开源项目及库汇总

Walden_tinghou的专栏

10-10

3988

UI 下拉刷新 EGOTableViewPullRefresh - 最早的下拉刷新控件。 SVPullToRefresh - 下拉刷新控件。 MJRefresh - 仅需一行代码就可以为UITableView或者CollectionView加上下拉刷新或者上拉刷新功能。可以自定义上下拉刷新的文字说明。具体使用看“使用方法”。（国人写） XHRefreshControl - X

瓦尔登湖词频统计

Vivant

03-06

370

瓦尔登湖词频统计已经有一个瓦尔登湖的文本，“Walden.txt” 统计这篇文章的词频(每个词出现的次数) 不统计标点符号 The和the被统计成同一个词(不区分大小写)输出格式: { ‘the’: 10, ‘is’: 45… def word(): global lst global word_list lst = [] word_list = [] with open("Walden.txt", "r+", encoding="utf-8") as fp:

用Python统计瓦尔登湖的词频

凯哥大数据——刘凯的博客

06-01

2424

在文本处理中，我们经常需要对文本中的单词出现频率做一个统计，本文以英文小说《瓦尔登湖》为例，统计一下作者最喜欢用什么单词，他们各自的出现频率如何。首先需要《瓦尔登湖》的文本：点击下载《瓦尔登湖》（https://pan.baidu.com/s/1o75GKZ4）思路分析：首先，要打开文件，把里面的内容写到字符串里面。接着，要对字符串进行分词，分割成独立的单词。最后，根据每个单...

fastadmin使用ECharts制作统计图

向宇

03-30

3373

fastadmin使用ECharts制作统计图 demo html代码 <div class="row" style="margin-bottom:5px;">  <section class="col-lg-7 connectedSortable"> &lt.

简单题101. 对称二叉树（python）20240922

Sep21m_wyy的博客

09-22

291

【代码】简单题101. 对称二叉树（python）20240922。

【工具】Windows｜两款开源桌面窗口管理小工具Deskpins和WindowTop

qq_46106285的博客

09-21

851

写这篇的初衷是怕自己忘了这两个工具的名字。

ubuntu安装libtorch