大学生毕业论文题目写作风格赏析

引言

每到大学生毕业论文开题的时间,为了选择不落俗套的题目而抓耳挠腮。本文以2022届计算机学院的毕业论文为研究对象,以可视化的方式归纳分析不同专业的论文题目写作风格及研究方向。

运行环境

数据格式为CSV,共671条,字段信息有:论文题目、关键词、专业名称。专业包括有信息工程,教育技术学,数字媒体技术,物联网工程,计算机科学与技术,软件工程和通信工程。

  • Jupyter Notebook
  • Plotly Express
  • Pkuseg 中文分词工具包
  • Pandas

写作风格分析

各专业论文题目统计

图例中各统计指标表示含义:
median:标题长度的中位数
mean:平均标题长度
min:标题最短字符数
max:标题最长字符数
其中字符数的统计含中文,英文(每个字母计量一个单位)和标点符号(如《》)。
在这里插入图片描述

  1. 先敲重点,列表 (见后)中的题目有哪些亮点?

列表题目中均含有英文专有名词,但是首字母小写是错误写法。除了x86这样约定俗成的专有名词之外,其他英文单词均需要首字母大写!首字母大写!首字母大写!有些甚至是全部大写,如MVC,STM32,PRA。

import pandas as pd
pd.options.mode.chained_assignment = None  # default='warn'
file_path=r'2022--计信毕业论文.csv'
df=pd. read_csv (file_path,encoding='utf-8-sig',low_memory=False)

df = df.dropna(subset=['论文题目'])#去除论文题目为空的数据行

mask = (df['题目分词'].apply(lambda x:any( c[0].islower() for c in x.split()))) #查找首字母小写的英文单词
df=df[mask][['证书专业名称','论文题目']]

df
index证书专业名称论文题目
1通信工程基于python-opencv的人脸识别算法设计与实现
206通信工程基于javaweb的在线考试系统
209通信工程基于springboot的新冠数据查询
  1. 标题的最短长度统计,除了数字媒体技术专业(10个字符),其他专业的标题最短长度接近(7个字符)。

  2. 标题的最长长度统计,计算机科学与技术专业以42个字符的标题长度独占鳌头,其他专业的标题最长长度都在30个字符左右。

  3. 各专业论文标题的平均长度和中位数值接近,说明标题长度分布合理,无较大落差。

  4. 教育技术学专业的论文平均长度明显大于其他专业,主要是该专业针对具体的课程进行研究,因此书名号《》和课程名在论文标题中占比较高。

  5. 最长长度的论文题目

index证书专业名称论文题目
494计算机科学与技术基于SpringBoot和mybatis-plus框架的校园食堂订餐系统的设计与实现
  1. 较短长度的论文题目
index证书专业名称论文题目
190通信工程5G技术研究
467计算机科学与技术农产品销售商城
502物联网工程低代码开发平台
573信息工程净水器控制系统

各专业论文数量分布

在这里插入图片描述

各专业论文题目的Top15关键词分布

先整体了解Top15关键词在所有专业的分布情况

在这里插入图片描述

  1. 上图看出,除了教育技术学专业外,关键字“基于”,“系统”,“设计”,“实现”在各其他专业均占很大的比例,一方面说明工科学生的动手能力都是杠杠的,另一方面也反映出大家喜欢拿Web或桌面系统的开发实现作为自己的毕业选题,如果想让自己的毕设不落俗套,就尽量选择其他的研究重点。
  2. 除了研究内容上有变化外,毕业题目的用词也避免缺乏新意。推荐清华大学人工智能研究院的产品万词王,可以根据意思反向查找词语,可以避免表达形式的单一性。
  3. 教育技术学专业的毕业生多用的关键词是:教学、信息、应用等,这些反映学生侧重信息技术在教育教学中的应用。

关注公众号“乐享Python”,获取更多教育数据分析资料。再看看各个专业中的Top15关键词的分布:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

from collections import Counter
import pandas as pd
file_path=r'毕业论文-2.csv'
df=pd. read_csv (file_path,encoding='utf-8-sig',low_memory=False)

df = df.dropna(subset=['论文题目'])#去除论文题目为空的数据行
grouped = df.groupby('证书专业名称')

lst_df=[]

for name, group in grouped:
    lst=[]
    for x in group['题目分词'].values.tolist():
        lst.extend(x.split())
    # #第一种方法
    # d={i:lst.count(i) for i in set(lst)}
    # df_group=pd.DataFrame(d.items(), columns=['word', 'count'])

    #第二种方法
    d=dict(Counter(lst))
    df_group=pd.DataFrame(d.items(), columns=['word', 'count']) 
    df_group['name']=name
    lst_df.append(df_group)
df = pd.concat(lst_df)
df


#pivot_cht_html(df,'data.html')

论文题目列表

index证书专业名称论文题目
1通信工程基于python-opencv的人脸识别算法设计与实现
206通信工程基于javaweb的在线考试系统
209通信工程基于springboot的新冠数据查询
338通信工程基于python的车牌识别系统设计与实现
435通信工程基于springboot+netty的网络通信系统
438通信工程基于springBoot+netty的网络通讯软件设计与实现
461通信工程基于python的信号与系统实验教学平台设计与实现
30软件工程基于java的房屋租赁系统的设计与实现
181软件工程基于android的网上购物APP微信小程序的开发与实现
256软件工程基于uni-app的电影计划小程序的设计与实现
422软件工程基于x86架构的宏内核操作系统的实现
11计算机科学与技术基于ssm框架的选课系统的设计与开发
41计算机科学与技术基于springboot的后台管理系统
44计算机科学与技术基于springboot的办公自动化系统设计与实现
90计算机科学与技术基于web的美妆商城的设计与实现
99计算机科学与技术基于springboot和微信小程序的点餐系统设计与实现
108计算机科学与技术基于web的社区宠物诊疗系统
132计算机科学与技术基于springboot的学校教材订购系统的设计与实现
135计算机科学与技术基于springboot的流浪动物管理系统的设计与实现
136计算机科学与技术基于java的学生选课系统的设计与实现
167计算机科学与技术基于ssm的医院在线预约系统的开发
175计算机科学与技术基于python的新冠疫情实时数据统计及可视化
216计算机科学与技术基于web的在线竞价系统的设计与实现
240计算机科学与技术基于排序算法的回合制游戏《thunderclap》的设计与开发
287计算机科学与技术基于web的小型酒店管理系统的设计与实现
316计算机科学与技术基于Bloom filter的视频过滤系统的设计和实现
342计算机科学与技术基于java的在线商城的设计与实现
349计算机科学与技术基于ssm的基层党员之家建设平台
358计算机科学与技术基于MVC模式的web图书管理系统设计与实现
360计算机科学与技术fec算法在实时数据传输中的应用设计与实现
363计算机科学与技术基于java微服务在线视频教育系统设计与开发
365计算机科学与技术基于unity3D的移动增强现实与人机交互技术设计与实现
366计算机科学与技术基于linux操作系统的聊天软件的设计与开发
374计算机科学与技术基于python的高校网络舆情分析系统设计与实现
395计算机科学与技术基于python的贪吃蛇游戏设计
415计算机科学与技术基于springboot技术的足球场管理系统的设计与实现
417计算机科学与技术基于python的疫情数据分析和可视化的设计与实现
430计算机科学与技术基于python的食品推荐系统设计
443计算机科学与技术基于unity3D引擎的射击游戏开发与实现
494计算机科学与技术基于SpringBoot和mybatis-plus框架的校园食堂订餐系统的设计与实现
523计算机科学与技术一种分布式定时调度中间件My-trigger的设计与实现
525计算机科学与技术基于maven+SSM架构一站式城镇商品一体化web服务
526计算机科学与技术统计云与rpa应用研究
527计算机科学与技术基于统计人才队伍培养模式的创新与rpa应用研究
531计算机科学与技术中国国民经济核算体系与rpa应用研究
532计算机科学与技术统计监督职能研究与rpa应用研究
560计算机科学与技术基于web的作业系统设计与实现
572计算机科学与技术基于web的学生宿舍管理系统
600计算机科学与技术基于ssm的校园点餐系统设计
602计算机科学与技术基于uni-app单词学习系统的研究与设计
606计算机科学与技术基于ssm猫咖管理系统设计与实现
608计算机科学与技术基于ssm的电影票订购系统的实现
610计算机科学与技术基于springboot的房屋租赁管理系统设计与实现
648计算机科学与技术基于app的奶茶点单系统的设计与实现
649计算机科学与技术基于vue和node.js外卖平台设计与开发
652计算机科学与技术基于springboot的电影订票购票系统的设计与实现
202物联网工程基于vue超市商品管理系统
238物联网工程基于java的图书管理系统的设计与实现
385物联网工程基于opencv的人脸识别系统的设计与实现
396物联网工程基于thinkphp的个人博客的设计
397物联网工程基于jsp的排课系统的设计与实现
398物联网工程基于python的外卖平台的数据可视化
626物联网工程基于python的商品销售管理系统的设计与实现
627物联网工程基于ssm的校园流浪猫管理系统的设计与实现
628物联网工程基于java web的校园每日疫情通报系统设计与实现
629物联网工程基于vue.js的购物网站设计与实现
630物联网工程基于ssm的水果商城系统的设计与实现
639物联网工程基于web的题库管理系统设计与实现
250数字媒体技术转描技术在二维动画《king》中的应用研究
484教育技术学基于steam理念的初中信息技术课程教学设计与研究
485教育技术学基于steam的高中人工智能教学设计研究–以黄石X中为例
488教育技术学基于mpython的高中创客教学设计与实践研究
293信息工程基于stm32的智能路灯管理系统
541信息工程基于python爬虫的新闻管理系统开发
575信息工程基于python进行的web自动化测试
667信息工程python可视化国内疫情大数据分析
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值