The Top 10 research papers in computer science by Mendeley readership

Since we recently announced our $10001 Binary Battle to promote applications built on the Mendeley API (now including PLoS as well), I decided to take a look at the data to see what people have to work with. My analysis focused on our second largest discipline, Computer Science. Biological Sciences (my discipline) is the largest, but I started with this one so that I could look at the data with fresh eyes, and also because it’s got some really cool papers to talk about. Here’s what I found:

What I found was a fascinating list of topics, with many of the expected fundamental papers like Shannon’s Theory of Information and the Google paper, a strong showing from Mapreduce and machine learning, but also some interesting hints that augmented reality may be becoming more of an actual reality soon.

The top graph summarizes the overall results of the analysis. This graph shows the Top 10 papers among those who have listed computer science as their discipline and chosen a subdiscipline. The bars are colored according to subdiscipline and the number of readers is shown on the x-axis. The bar graphs for each paper show the distribution of readership levels among subdisciplines. 17 of the 21 CS subdisciplines are represented and the axis scales and color schemes remain constant throughout. Click on any graph to explore it in more detail or to grab the raw data.(NB: A minority of Computer Scientists have listed a subdiscipline. I would encourage everyone to do so.)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.
1. Latent Dirichlet Allocation (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

LDA is a means of classifying objects, such as documents, based on their underlying topics. I was surprised to see this paper as number one instead of Shannon’s information theory paper (#7) or the paper describing the concept that became Google (#3). It turns out that interest in this paper is very strong among those who list artificial intelligence as their subdiscipline. In fact, AI researchers contributed the majority of readership to 6 out of the top 10 papers. Presumably, those interested in popular topics such as machine learning list themselves under AI, which explains the strength of this subdiscipline, whereas papers like the Mapreduce one or the Google paper appeal to a broad range of subdisciplines, giving those papers a smaller numbers spread across more subdisciplines. Professor Blei is also a bit of a superstar, so that didn’t hurt. (the irony of a manually-categorized list with an LDA paper at the top has not escaped us)

2. MapReduce : Simplified Data Processing on Large Clusters (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

It’s no surprise to see this in the Top 10 either, given the huge appeal of this parallelization technique for breaking down huge computations into easily executable and recombinable chunks. The importance of the monolithic “Big Iron” supercomputer has been on the wane for decades. The interesting thing about this paper is that had some of the lowest readership scores of the top papers within a subdiscipline, but folks from across the entire spectrum of computer science are reading it. This is perhaps expected for such a general purpose technique, but given the above it’s strange that there are no AI readers of this paper at all.

3. The Anatomy of a large-scale hypertextual search engine (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

In this paper, Google founders Sergey Brin and Larry Page discuss how Google was created and how it initially worked. This is another paper that has high readership across a broad swath of disciplines, including AI, but wasn’t dominated by any one discipline. I would expect that the largest share of readers have it in their library mostly out of curiosity rather than direct relevance to their research. It’s a fascinating piece of history related to something that has now become part of our every day lives.

4. Distinctive Image Features from Scale-Invariant Keypoints

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

This paper was new to me, although I’m sure it’s not new to many of you. This paper describes how to identify objects in a video stream without regard to how near or far away they are or how they’re oriented with respect to the camera. AI again drove the popularity of this paper in large part and to understand why, think “Augmented Reality“. AR is the futuristic idea most familiar to the average sci-fi enthusiast as Terminator-vision. Given the strong interest in the topic, AR could be closer than we think, but we’ll probably use it to layer Groupon deals over shops we pass by instead of building unstoppable fighting machines.

5. Reinforcement Learning: An Introduction (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

This is another machine learning paper and its presence in the top 10 is primarily due to AI, with a small contribution from folks listing neural networks as their discipline, most likely due to the paper being published in IEEE Transactions on Neural Networks. Reinforcement learning is essentially a technique that borrows from biology, where the behavior of an intelligent agent is is controlled by the amount of positive stimuli, or reinforcement, it receives in an environment where there are many different interacting positive and negative stimuli. This is how we’ll teach the robots behaviors in a human fashion, before they rise up and destroy us.

6. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

Popular among AI and information retrieval researchers, this paper discusses recommendation algorithms and classifies them into collaborative, content-based, or hybrid. While I wouldn’t call this paper a groundbreaking event of the caliber of the Shannon paper above, I can certainly understand why it makes such a strong showing here. If you’re using Mendeley, you’re using both collaborative and content-based discovery methods!

7. A Mathematical Theory of Communication (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

Now we’re back to more fundamental papers. I would really have expected this to be at least number 3 or 4, but the strong showing by the AI discipline for the machine learning papers in spots 1, 4, and 5 pushed it down. This paper discusses the theory of sending communications down a noisy channel and demonstrates a few key engineering parameters, such as entropy, which is the range of states of a given communication. It’s one of the more fundamental papers of computer science, founding the field of information theory and enabling the development of the very tubes through which you received this web page you’re reading now. It’s also the first place the word “bit”, short for binary digit, is found in the published literature.

8. The Semantic Web (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

In The Semantic Web, Tim Berners-Lee, Sir Tim, the inventor of the World Wide Web, describes his vision for the web of the future. Now, 10 years later, it’s fascinating to look back though it and see on which points the web has delivered on its promise and how far away we still remain in so many others. This is different from the other papers above in that it’s a descriptive piece, not primary research as above, but still deserves it’s place in the list and readership will only grow as we get ever closer to his vision.

9. Convex Optimization (available full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

This is a very popular book on a widely used optimization technique in signal processing. Convex optimization tries to find the provably optimal solution to an optimization problem, as opposed to a nearby maximum or minimum. While this seems like a highly specialized niche area, it’s of importance to machine learning and AI researchers, so it was able to pull in a nice readership on Mendeley. Professor Boyd has a very popular set of video classes at Stanford on the subject, which probably gave this a little boost, as well. The point here is that print publications aren’t the only way of communicating your ideas. Videos of techniques at SciVee or JoVE or recorded lectures (previously) can really help spread awareness of your research.

10. Object recognition from local scale-invariant features (available in full-text)

highlighting research  The Top 10 research papers in computer science by Mendeley readership.

This is another paper on the same topic as paper #4, and it’s by the same author. Looking across subdisciplines as we did here, it’s not surprising to see two related papers, of interest to the main driving discipline, appear twice. Adding the readers from this paper to the #4 paper would be enough to put it in the #2 spot, just below the LDA paper.

Conclusions

So what’s the moral of the story? Well, there are a few things to note. First of all, it shows that Mendeley readership data is good enough to reveal both papers of long-standing importance as well as interesting upcoming trends. Fun stuff can be done with this! How about a Mendeley leaderboard? You could grab the number of readers for each paper published by members of your group, and have some friendly competition to see who can get the most readers, month-over-month. Comparing yourself against others in terms of readers per paper could put a big smile on your face, or it could be a gentle nudge to get out to more conferences or maybe record a video of your technique forJoVE or Khan Academy or just Youtube.

Another thing to note is that these results don’t necessarily mean that AI researchers are the most influential researchers or the most numerous, just the best at being accounted for. To make sure you’re counted properly, be sure you list your subdiscipline on your profile, or if you can’t find your exact one, pick the closest one, like the machine learning folks did with the AI subdiscipline. We recognize that almost everyone does interdisciplinary work these days. We’re working on a more flexible discipline assignment system, but for now, just pick your favorite one.

These stats were derived from the entire readership history, so they do reflect a founder effect to some degree. Limiting the analysis to the past 3 months would probably reveal different trends and comparing month-to-month changes could reveal rising stars.

Technical details:
To do this analysis I queried the Mendeley database, analyzed the data using R, and prepared the figures with Tableau Public. A similar analysis can be done dynamically using the Mendeley API. The API returns JSON, which can be imported into R using the fineRJSONIO package from Duncan Temple Lang and Carl Boettiger is implementing the Mendeley API in R. You could also interface with the Google Visualization API to make motion charts showing a dynamic representation of this multi-dimensional data. There’s all kinds of stuff you could do, so go have some fun with it. I know I did.

    

Tags: APIartificial intelligenceconvex optimizationdataGooglehackinglatent dirichlet allocationmachine learningmapreduceRrecommender systems,reinforcement learningscale invariancesemantic webstatisticstheory of communication

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要查找研究论文的代码,您可以尝试以下几种方法: 1. 在论文中查找作者提供的代码链接或代码存储库。 2. 在代码托管平台(如GitHub、GitLab等)上搜索论文的标题或作者,以查找相关代码。 3. 在学术搜索引擎(如Google Scholar、Semantic Scholar等)上搜索论文的标题或作者,以查找相关代码。 4. 在相关领域的社区(如Stack Overflow、Quora等)上提问,以寻求其他研究人员的帮助。 希望这些方法能帮助您找到所需的代码。 ### 回答2: 对于研究论文中的代码,有一些不同的途径可以寻找到。以下是几个寻找代码的方法: 1. 搜索GitHub 许多研究人员会将他们的代码存储在开源代码托管平台GitHub上,因此在GitHub上进行搜索是寻找代码的重要途径之一。您可以在GitHub上搜索与您正在研究的特定主题或算法相关的关键词,或者直接搜索论文作者的用户名,以查看他们是否在Github上发布他们的代码。 2. 查找作者的网站或社交媒体 一些研究人员通常会在他们的个人网站或社交媒体页面上公开他们的代码。因此,在查看作者的研究论文之前,您可以先花点时间搜索他们的姓名,看看他们是否有公开代码的地方。 3. 请求作者提供代码 如果您无法在GitHub上或作者的网站上找到代码,您可以尝试通过电子邮件或社交媒体联系作者,请求他们提供代码。尤其是在您计划重现研究结果时,代码的可获取性非常重要。 4. 查找开源库 对于一些常见的算法和技术,可能已经有一些开源库可供使用。您可以使用Google或GitHub等搜索平台查找这些开源库,并查看它们是否可以帮助您在研究中使用代码。 总之,寻找编写在研究论文中的代码需要一些搜索和尝试的技巧,可能需要通过多个渠道进行搜索,以找到最适合您的代码。同时,如果您对于找不到代码或者无法理解代码的部分,可以联系论文作者或者相关的领域专家来获得帮助。 ### 回答3: 作为一个AI机器人,我很清楚,寻找研究论文的代码可以被视为一项非常重要的工作。这些代码可能包含在研究论文中以支撑它们的结果。在本文中,我将向您介绍寻找论文代码的一些方法。首先,您可以通过Google Scholar等学术搜索引擎来寻找研究论文及其附属代码。大多数学术论文都会附有代码,您可以在相关的出版物中找到这些论文和代码。其次,您可以使用代码托管网站,如GitHub或bitbucket等,这些站点是为开发人员和研究人员提供了一个托管代码,以及协作开发的平台。代码贡献者将在代码上进行共同的开发和维护,使得其他人可以自由使用和访问这些代码。此外,一些研究机构和大学会将其代码散布在开放式的论文存档中供访问和使用。对于一些特定的科学领域,也可以寻找已建立的代码库,以及科学家和研究人员共享代码的社区和网络。除了以上介绍的方法外,还有许多其他寻找研究论文代码的方法,它们包括向相关领域的专业人士进行提问和咨询、参加学术会议和研讨会、以及联合其他研究团队和研究机构等。总之,许多研究论文都需要使用代码来支撑其实验和数据分析,寻找这些代码是一个非常重要的任务,它能帮助研究人员在确保其研究质量的同时更好地推进相关领域的发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值