本文作者:王碧琪
文字编辑:方 言
技术总编:张馨月
爬虫俱乐部云端课程来袭!
爬虫俱乐部将于 2020年8月25日至28日 在线上举行Stata数据分析法律与制度专题训练营,主要是为了让学员掌握 Stata软件进阶操作 ,涉及内容包括基本字符串函数及其应用、正则表达式、法律与制度数据网络爬虫技巧、判案文书的文本分析等技术。 详情请参考 《 8月Stata数据分析法律与制度专场来啦! 》 另外, 爬虫俱乐部于2020年7月在线上举办的 Stata与Python 编程技术训练营已圆满结束。应广大学员需求,我们的课程现已在腾讯课堂双双上线,且 继续提供答疑服务 。现在关注公众号并在朋友圈转发推文《 来腾讯课堂学Stata和Python啦!》,即可获得 600元课程优惠券 ,集赞50个再领 200元 课程优惠劵 !(截图发至本公众号后台领取)原价2400元的课程,现在只要 1600元 !使用Excel进行数据分析时常常用到vlookup函数。在《Stata实现Excel中vlookup函数功能》中介绍了vlookup函数的基本用法,今天,我们使用Python中的pandas库来实现该函数的相应功能。
一、简介
(一)数据简介
本文使用的原始数据文件来源于《明星闪闪亮:各校高被引论文》中公布的全国高校经管类核心期刊发文排行榜(前200),文件名为“第一单位排名汇总.xlsx”。
(二)结果文件样式
现在有一部分大学名单,想要提取该大学对应的“发文量”和“发文排名”数据。其中,大学名单为乱序,且可能存在原始文件中找不到的情况(北京第二外国语学院无对应数据)。