用python做文献计量学全代码

各位朋友大家好,今天给大家带来文献计量学的知识和全代码,文献计量学是属于一门边缘学科,交叉科学。我在网上浏览了一下,用R和专属工具做的已经有老师进行了展示,python的还没有所以在这里给大家一个全面的展示

下面把全代码给大家:

import metaknowledge as mk
import pandas
import matplotlib.pyplot as plt
import seaborn as sns
#%matplotlib inline
get_ipython().magic("config InlineBackend.figure_format = 'retina'")

sns.set_style(style="white") # change the default background plot colour
sns.set(font_scale=.75)
plt.rc("savefig", dpi=400) # improve default resolution of graphics

#交互作图库
import chart_studio.plotly as py
import plotly.graph_objs as go
#导入文献检索
import os
os.chdir('E:/pythoncode2021/metaknowledge')
RC = mk.RecordCollection('raw_data/imetrics/', cached = True)
len(RC)
RC.writeCSV('generated_datasets/reco.csv')
##
RC1314 = RC.yearSplit(2013, 2014)
gender_breakdown = RC1314.genderStats()
gender_breakdown
##
print(RC.glimpse())
##
df = pandas.DataFrame(RC.makeDict())
selectedVars = df[['AF', 'AB', 'PY', 'TI', 'SO', 'num-Authors', 'TC']]
selectedVars[:10] # show the first 10 rows.
df.columns.values.tolist()
top_40 = selectedVars.sort_values(['TC'], ascending = False)[:40]
top_40.head()

trace = go.Bar(
            x=top_40['TI'],
            y=top_40['TC']
    )

data = [trace]

layout = go.Layout(
    yaxis=dict(
        title='Times Cited',
    )
)

fig = go.Figure(data=data, layout=layout)
#py.iplot(fig, filename='times-cited')
#import plotly.io as pio
#pio.renderers.default='notebook'
#fig.show()
from plotly.offline import plot
plot(fig)
#把每篇文章进行题目的缩小
top_40['short_title'] = top_40['TI'].str[:20]
top_40[['TI', 'short_title', 'TC']].head()
#画图
with sns.axes_style("white"):
    horizontal_bar = sns.barplot(data = top_40, x = 'TC', y = 'short_title', color = 'gray')
    horizontal_bar.set(xlabel='Number of Citations', ylabel='')
    sns.despine(left = True, right = True, bottom = True, top = True)
    plt.tight_layout()
plt.savefig('figures/horizontal_barplot.png')
plt.savefig('figures/horizontal_barplot.pdf')
#[2:] removes incomplete data from 2016
growth = pandas.DataFrame(RC.timeSeries('year', outputFile = 'generated_datasets/growth.csv'))[2:]
growth[:10]
with sns.axes_style("white"):
    plt.plot(growth['year'], growth['count'], color

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Python是一种非常有用的编程语言,特别是在进行文献计量方面。使用Python可以方便地进行数据处理、数据可视化以及统计分析等操作,这些工作非常适用于研究和评估文献的数量、品质、影响力等。 以下是在Python中使用文献计量的一些步骤: 1. 收集文献数据:首先,需要从各种来源获取文献数据,如学术数据库、Web搜索引擎、期刊出版商等。建议使用Python库例如beautifulsoup或者selenium用于数据的自动抓取。 2. 清洗和准备数据:获取到的数据往往需要进行清洗和预处理,例如剔除重复数据、标准化作者名字、统一格式等。这里可以使用一些强大的Python库,例如Pandas,实现数据的高效清洗和整合。 3. 分析文献数量:根据不同的需求,可以在Python中使用不同的方法来分析文献数量。例如,使用计数函数,如value_counts(),groupby(),可以快速计算文献出现的频率、年份趋势、系列书籍相关的数量、主题关键词等方面的信息。 4. 分析作者影响力:可以通过分析作者被引用次数的方法来计算其影响力。Python中可以使用Scopus的API,在Pubmed等数据库上抓取文献信息以计算作者被引用次数,甚至是使用申请到的API在谷歌学术上获取相应数据。 5. 可视化结果:最后,将文献计量结果可视化是非常重要的,这有助于更好地理解和传达数据。Python中有许多实用的可视化工具,例如Matplotlib、Seaborn和Plotly等等,可以用于制作柱状图、折线图和气泡图,更好地展示文献数量和作者影响力趋势或事件。 总体而言,使用Python进行文献计量可以方便我们更好地理解文献数量、文献影响力和文献质量等方面的信息。Python库和工具提供了很多方便的功能,其中包括数据抓取、处理、分析和可视化,值得研究者深入探究。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

飞时过

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值