基于规则嵌入的论文比对系统——创新实训记录6

6-17 不同年份上论文集合数据的可视化
  展示论文集合上的一些统计信息,比如,展示数据集中不同年份上论文集的个数,以及平均引用量、被引用量。

不同年份上论文集的个数(柱状图)

数据预处理

读取years.txt,将年份对应的总论文数放入一个字典。

# 读取years.txt,将年份对应的论文数放入一个字典

file_years = 'D:/大学资料/大三下/项目实训/code+data/ACM数据集/years.txt'
fyears = open(file_years,'r')
years_dic = { }
for line in fyears:
    year = line.strip()
    if year in years_dic.keys() and year is not '':
        years_dic[year]+=1
    elif year is not '':
        temp = {}
        temp[year] = 1
        years_dic.update(temp)
    else:
        continue
del years_dic['994']
print(years_dic)
print(len(years_dic))

fyears.close()

数据可视化

# 数据可视化:不同年份的论文数量
from pyecharts.charts import Bar
from pyecharts import options as opts

# 构造x,y轴的数据
x_data = []
y_data = []
for k in sorted(years_dic):
    x_data.append(k)
    y_data.append(years_dic[k])

year_bar = Bar(init_opts=opts.InitOpts(width='1200px'))\
             .add_xaxis(xaxis_data = x_data)\
            .add_yaxis(series_name="论文数量",y_axis = y_data)
year_bar.set_global_opts(title_opts=opts.TitleOpts(title='数据集中不同年份的论文数量'),
                         visualmap_opts=opts.VisualMapOpts(
                            is_show = True,
                            type_ ='color',
                            is_piecewise = True,
                            pieces=[
                                 {"min": 3000,"color":'#F01C06'},
                                 {"min":2000, "max":2999,"color":'#F93F2B'},
                                 {"min":1000,"max":1999,"color":'#FB8275'},
                                 {"min":1000,"max":1999,"color":'#FAA62A'},
                                 {"min":500,"max":999,"color":'#F4E362'},
                                 {"min":100,"max":499,"color":'#45F172'},
                                 {"min":50,"max":99,"color":'#7FC3F1'},
                                 {"max":49,"color":'#C4E3F8'}
                             ],
                 orient = 'vertical'
                        ))
#year_bar.render_notebook()#显示图表

可视化效果如下,从下图我们可以看出,ACM数据集中的论文大部分是2000年~2008年的。
在这里插入图片描述

不同年份上论文集的平均引用量、被引用量(柱状图)

数据预处理

首先,获取每篇论文的引用量。

# 数据预处理:获取每篇论文的引用量
olinkspath = 'D:/大学资料/大三下/项目实训/code+data/ACM数据集/outlinks.txt'
ofile = open(olinkspath,'r')
outnum = []

for line in ofile:
    lines = line.strip('\n').split()
    num = len(lines)
    outnum.append(num)

print(outnum[:6])
ofile.close()

然后,获取不同年份论文的总引用量。

# 数据预处理:获取不同年份论文的总引用量

file_years = 'D:/大学资料/大三下/项目实训/code+data/ACM数据集/years.txt'
fyears = open(file_years,'r')
num_dic = { }
# 论文索引
index = 0 

for line in fyears:
    year = line.strip()
    if year in num_dic.keys() and year is not '':
        num_dic[year]+=outnum[index]
    elif year is not '':
        temp = {}
        temp[year] = outnum[index]
        num_dic.update(temp)
    else:
        index+=1
        continue
    index +=1

del num_dic['994']
print(num_dic)
print(len(num_dic))

fyears.close()

最后,获取不同年份论文的平均引用量。并进行可视化看看效果。

# 数据可视化:不同年份论文的平均引用量
from pyecharts.charts import Bar
from pyecharts import options as opts

# 构造x,y轴的数据
x_data1 = []
y_data1 = []
for k in sorted(avg_dic):
    x_data1.append(k)
    y_data1.append(avg_dic[k])
avg_bar = Bar(init_opts=opts.InitOpts(width='1200px'))\
             .add_xaxis(xaxis_data = x_data1)\
            .add_yaxis(series_name="论文数量",y_axis = y_data1)
avg_bar.set_global_opts(title_opts=opts.TitleOpts(title='不同年份论文的平均引用量'),
                         visualmap_opts=opts.VisualMapOpts(
                            is_show = True,
                            type_ ='color',
                              is_piecewise = True,
                            pieces=[
                                 {"min": 5,"color":'#FE6E6E'},
                                 {"min":4, "max":5,"color":'#F29CE6'},
                                 {"min":3, "max":4,"color":'#FCEB88'},
                                 {"min":2,"max":3,"color":'#A4FB81'},
                                 {"max":2,"color":'#C4E3F8'}
                             ],
                            orient = 'vertical'
                        ))

数据可视化

从下图我们可以看出,不同年份的论文集合他们的平均引用量集中在2~4。
  在这里插入图片描述
  被引用量的处理方法相同。
  将平均引用量、被引用量结合在一起进行可视化:

# 数据可视化:不同年份论文的平均引用量
from pyecharts.charts import Bar
from pyecharts import options as opts

# 构造x,y轴的数据
x_data2 = []
y_data2 = []
for k in sorted(inavg_dic):
    x_data2.append(k)
    y_data2.append(inavg_dic[k])
inavg_bar = Bar(init_opts=opts.InitOpts(width='1200px'))\
             .add_xaxis(xaxis_data = x_data2)\
            .add_yaxis(series_name="平均被引用量",y_axis = y_data2)\
            .add_yaxis(series_name="平均引用量",y_axis = y_data1)
inavg_bar.set_global_opts(title_opts=opts.TitleOpts(title='不同年份论文的平均被引用量与引用量'),
                          datazoom_opts=opts.DataZoomOpts(is_show= True, 
                                                          orient="horizontal"))
inavg_bar.render()#显示图表

用户可以拖动下方的条块选择不同的年份范围,以查看详细信息。从下图我们可以看出,ACM数据集中论文的平均引用量普遍高于被引用量。
  在这里插入图片描述
  在这里插入图片描述

不同年份上论文的引用量、被引用量(盒须图)

数据预处理

# 数据预处理:获取每篇论文的引用量
olinkspath = 'D:/大学资料/大三下/项目实训/code+data/ACM数据集/outlinks.txt'
ofile = open(olinkspath,'r')
outnum = []

for line in ofile:
    lines = line.strip('\n').split()
    num = len(lines)
    outnum.append(num)

print(outnum[:6])
ofile.close()

# 数据预处理:获取不同年份的论文集合

file_years = 'D:/大学资料/大三下/项目实训/code+data/ACM数据集/years.txt'
fyears = open(file_years,'r')
paper_dic = { }
# 论文索引
index = 0 

for line in fyears:
    year = line.strip()
    if year in paper_dic.keys() and year is not '':
        paper_dic[year].append(outnum[index])
    elif year is not '':
        temp = { }
        new_list = []
        new_list.append(outnum[index])
        temp[year] = new_list
        paper_dic.update(temp)
    else:
        index+=1
        continue
    index +=1

del paper_dic['994']
print(paper_dic['1999'][:50])

fyears.close()

# 构造x,y轴的数据
x_data = []
y_data = []
for k in sorted(paper_dic):
    x_data.append(k)
    y_data.append(paper_dic[k])
    

数据可视化

可视化效果如下图。
  用户可以拖动下方的条块选择不同的年份范围,以查看详细信息。从图中我们可以看出不同年份论文最大引用量一般都很高,所以上面统计的平均数据可能受极端数据影响比较大。
在这里插入图片描述
  被引用量同理。
  在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 嵌入式系统设计与应用是指在特定应用领域中,使用嵌入式处理器和相关硬件资源,结合嵌入式操作系统和软件开发工具,设计和开发满足特定需求的嵌入式系统。 ARM Cortex-A8是一款高性能的嵌入式处理器,广泛应用于手机、平板电脑、智能电视等嵌入式设备中。它具有强大的计算能力和低功耗特性,能够提供快速、高效的数据处理和多任务处理能力。 Linux是一种开源的嵌入式操作系统,提供了丰富的软件资源和开发工具,可以满足各种嵌入式应用的需求。在使用ARM Cortex-A8和Linux进行嵌入式系统设计和应用时,可以借助Linux的强大功能和丰富的软件生态系统,快速开发出满足特定需求的嵌入式应用。 设计和开发嵌入式系统时,首先需要选择合适的硬件平台和操作系统。选择ARM Cortex-A8作为处理器可以得到高性能和低功耗的优势,而选择Linux作为操作系统可以借助其丰富的软件资源和开发工具。 然后,根据具体的嵌入式应用需求,对系统进行架构设计和软件模块划分。在嵌入式系统设计中,需要考虑系统的实时性、功耗控制、硬件接口与外设的驱动、应用程序的开发等方面。 在应用开发阶段,可以使用C/C++等编程语言,结合相应的开发工具,编写应用程序和驱动程序。同时,可以借助Linux的丰富资源,如网络协议栈、文件系统、数据库等,快速实现系统的功能。 最后,在系统调试和测试阶段,可以使用调试工具和仿真平台进行系统性能测试和调试,以确保系统的稳定性和可靠性。 综上所述,嵌入式系统设计与应用基于ARM Cortex-A8和Linux可以提供高性能、低功耗和丰富软件资源的优势,能够快速开发出满足特定需求的嵌入式应用。 ### 回答2: 嵌入式系统设计与应用是指将计算机系统嵌入到特定的电子设备中,以完成特定的功能。基于ARM Cortex-A8和Linux的嵌入式系统设计与应用是指利用ARM Cortex-A8处理器和Linux操作系统来设计和开发嵌入式系统。 ARM Cortex-A8是一种高性能、低功耗的32位RISC处理器。它采用精简指令集架构,具有较高的运算能力和较低的能耗。Cortex-A8处理器广泛应用于嵌入式领域,可用于智能手机、平板电脑、汽车导航系统等各种嵌入式设备。 Linux是一种开源的操作系统内核,具有广泛的硬件支持和强大的软件生态系统。在嵌入式系统设计中,Linux提供了丰富的功能和驱动支持,能够提供稳定可靠的操作环境。同时,Linux还可以方便地进行定制和扩展,以满足各种应用需求。 在基于ARM Cortex-A8和Linux的嵌入式系统设计中,我们可以利用Linux提供的运行时库、工具链以及开发环境来进行系统开发。可以利用C/C++编程语言来进行应用程序的开发,使用Linux提供的设备驱动程序来进行硬件的控制和交互。同时,我们还可以利用Linux的网络支持和文件系统功能来实现网络连接和数据存储。 综上所述,基于ARM Cortex-A8和Linux的嵌入式系统设计与应用具有高性能、低功耗、可定制和可扩展等优势,可以适用于各种嵌入式设备的开发和应用。它在智能手机、平板电脑、汽车导航系统等领域具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值