C语言 字数统计

编写一个程序,从文本文件 string.txt 中逐个读入字符,组成字符串。统计该字符串中字母(包括大写和小写字母)、数字和空格的个数,并将统计结果输出在屏幕上。假设文本文件 string.txt 存放在 D 盘根目录下,字符总数不超过 100,且可能含多行。
例如 string.txt 中的内容为:
Hello 50+ SJTUers,
Welcome to the Class CS0900.
则统计结果输出为:
字母数:31
数字数:6
空格数:6

#include<stdio.h>
int main()
{
FILE *fp;
char str[100], ch;
int k = 0, i;
 int number=0, letter=0, space=0;
 fp = fopen("D:\\string.txt", "r"); 
 if(fp==NULL) { 
 printf("error!"); return 1;
}
 while((ch = fgetc(fp)) != EOF) { 
 str[k++]=ch;
 }
str[k]='\0';
 for(i=0;i<strlen(str);i++) 
 {
 if((str[i]>='A'&&str[i]<='Z')||(str[i]>='a'&&str[i]<='z')) 
 letter++;
 else if (str[i]>='0'&&str[i]<='9') 
 number++;
 else if (str[i]==' ')
 space++;
 }
 printf("字母个数: %d\n数字个数: %d\n空格个数: %d\n", letter, number, space); 
 fclose(fp); 
return 0; 
}
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
摘要:随着互联网技术的发展和普及,网络小说已成为人们日常生活中不可或缺的一部分,而小说数据的分析和挖掘也成为了一个热门的研究方向。本文基于大数据技术,使用Python语言编写爬虫程序,爬取了多个网站上的小说数据,并进行了数据清洗和整理。在此基础上,使用可视化工具对小说数据进行分析和展示,探讨了小说的作者、题材、流派等方面的规律,为读者和作者提供了有价值的参考和指导。 关键词:大数据;小说数据;爬虫;数据清洗;可视化分析 Abstract: With the development and popularization of Internet technology, online novels have become an indispensable part of people's daily life, and the analysis and mining of novel data have also become a hot research direction. Based on big data technology, this paper uses Python language to write crawler program, crawls novel data from multiple websites, and carries out data cleaning and sorting. On this basis, visualization tools are used to analyze and display novel data, explore the rules of novel authors, themes, genres and other aspects, and provide valuable reference and guidance for readers and authors. Keywords: big data; novel data; crawler; data cleaning; visualization analysis 1.引言 随着互联网技术的发展和普及,网络小说已成为人们日常生活中不可或缺的一部分。越来越多的人通过网络平台阅读和发布小说,因此小说数据的分析和挖掘也成为了一个热门的研究方向。通过对小说数据的分析和挖掘,可以了解小说市场的现状和趋势,也可以为读者和作者提供有价值的参考和指导。 本文基于大数据技术,使用Python语言编写爬虫程序,爬取了多个网站上的小说数据,并进行了数据清洗和整理。在此基础上,使用可视化工具对小说数据进行分析和展示,探讨了小说的作者、题材、流派等方面的规律,为读者和作者提供了有价值的参考和指导。 2.相关工作 目前,国内外已有很多关于小说数据分析和挖掘的研究。国内的研究主要集中在小说内容分析和情感分析方面,例如利用自然语言处理技术对小说内容进行分析和挖掘[1],以及利用机器学习技术对小说情感进行分类和预测[2]。国外的研究主要集中在小说市场分析和读者行为分析方面,例如通过对小说销售数据和读者评论数据的分析,探讨小说市场的现状和趋势[3][4],以及通过对读者行为数据的分析,了解读者的阅读习惯和偏好[5][6]。 3.数据爬取与清洗 本文使用Python语言编写爬虫程序,爬取了多个网站上的小说数据。具体来说,我们选择了起点中文网、红袖添香、17K小说网等多个网站,爬取了其中的小说信息、作者信息、章节信息等数据。爬虫程序的主要流程如下: (1)首先,使用Python的requests库发送HTTP请求,获取网页的HTML源码。 (2)然后,使用BeautifulSoup库解析HTML源码,提取所需的数据信息。 (3)最后,将提取的数据信息保存到本地或者数据库中。 在爬取数据的过程中,我们需要注意一些问题。例如,需要处理网页的反爬虫机制,避免被封IP;需要处理网页的编码问题,确保数据的准确性和完整性;需要处理数据的重复问题,避免数据冗余和错误。 4.可视化分析 在数据爬取和清洗完成后,我们将爬取的小说数据导入到Pandas库中进行数据处理和分析。然后,使用Matplotlib和Seaborn等可视化工具,对小说数据进行分析和展示。具体来说,我们主要从以下几个方面进行分析: (1)作者分析:通过统计小说作者的作品数量、作品评分、作品字数等指标,了解作者的创作情况和水平。 (2)题材分析:通过统计小说的题材分类、评分等指标,了解不同题材的受欢迎程度和市场需求。 (3)流派分析:通过统计小说的流派分类、评分等指标,了解不同流派的特点和市场需求。 (4)阅读量分析:通过统计小说的阅读量、收藏量等指标,了解小说的受关注程度和市场需求。 通过可视化分析,我们可以更直观地了解小说市场的现状和趋势,也可以为读者和作者提供有价值的参考和指导。 5.结论 本文基于大数据技术,使用Python语言编写爬虫程序,爬取了多个网站上的小说数据,并进行了数据清洗和整理。在此基础上,使用可视化工具对小说数据进行分析和展示,探讨了小说的作者、题材、流派等方面的规律,为读者和作者提供了有价值的参考和指导。未来,我们将进一步完善数据分析和挖掘的方法,探索更多有价值的数据规律和趋势。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BTWBB

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值