![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 72
蓝棠
这个作者很懒,什么都没留下…
展开
-
数据分析任务3:论文代码统计
数据分析任务3:论文代码统计Github数据集涉及知识点:正则表达式数据框中各列处理apply函数和lambda的联合使用data[‘categories’] = data[‘categories’].apply(lambda x: x.split(’ ')[0])1.数据处理步骤在原始arxiv数据集中作者经常会在论文的comments或abstract字段中给出具体的代码链接,所以我们需要从这些字段里面找出代码的链接。确定数据出现的位置;使用正则表达式完成匹配;完成相关的统计;原创 2021-01-20 01:48:09 · 249 阅读 · 2 评论 -
使用pandas读取数据并统计论文数据(2)2021-01-17
datawhale数据分析task1(2)使用pandas读取数据并统计论文数据github1、python datetime处理时间CSDN博客详细介绍1.1获取指定的时间和日期。datetime(%Y,%m,%d,%H,%M,%S)datetime共有6个参数,分别代表的是年月日时分秒。其中年月日是必须要传入的参数,时分秒可以不传入,默认全为零。datatime(2017,9,24)Out:datatime.datatime(2017,9,24,0,0)1.2将Str和Unicod原创 2021-01-17 01:01:03 · 320 阅读 · 1 评论 -
论文作者统计(pandas字符串操作)
论文作者统计(pandas字符串操作)github涉及知识点如下:1、data[‘categories’].apply(lambda x: ‘cs.CV’ in x)结果理解2、sum函数的嵌套列表元素合并3、dataframe和series中value_counts函数的使用代码如下:# 导入所需的packageimport json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as原创 2021-01-17 02:11:12 · 573 阅读 · 2 评论 -
datawhale数据分析task1(1)使用pandas读取数据并统计论文数据
使用pandas读取数据并统计论文数据统计知识点记录(datawhale数据分析task1(1))1 json数据类型及其读取1.1 json数据类型含义1.2 json文件的python读写模块1.3 witn...as语句及open函数进行数据读取2 split函数及列表生成器嵌套循环2.1 split函数2.2 列表生成器嵌套循环统计知识点记录(datawhale数据分析task1(1))GitHub目标:统计2019年全年计算机各方向论文涉及内容;pandas基础操作数据集来源:论文数据原创 2021-01-14 01:24:20 · 200 阅读 · 0 评论