数据分析
文章平均质量分 64
小赵要加油
这个作者很懒,什么都没留下…
展开
-
【数据分析】lw
#!/usr/bin/env python# -*- coding:utf-8 -*-""" :Description: 记得些注释呀:Owner: xiaofeng_zhao:Create time: 2022/1/18"""import numpy as npimport pandas as pdfrom sklearn.preprocessing import LabelEncoderdf = pd.read_csv('./titanic/data.txt',原创 2022-01-30 15:51:23 · 1299 阅读 · 0 评论 -
【数据分析】Text2
第二章:数据清洗及特征处理#!/usr/bin/env python# -*- coding:utf-8 -*-""" :Description: 记得些注释呀:Owner: xiaofeng_zhao:Create time: 2022/1/29"""import pandas as pdimport numpy as nppd.set_option('display.max_columns',None)df = pd.read_csv(r'D:\python\pythonPro\原创 2022-01-30 15:11:14 · 1447 阅读 · 0 评论 -
【数据分析】Text1
# 1.1载入数据# 1.1.1 任务一:导入numpy和pandasimport numpy as npimport pandas as pdimport os# 1.1.2 任务二:载入数据#(1)使用相对路径# data = pd.read_csv('./titanic/test.csv')# (2)使用绝对路径# print os.getcwd() D:\python\pythonPro\DataWhale 获取当前的绝对路径data = pd.read_csv(r'D:原创 2022-01-11 10:03:07 · 277 阅读 · 0 评论 -
数据分析---作者信息关联
目录1.1任务说明1.2数据处理步骤1.3社交网络分析1.3.1图类型1.3.2图统计指标1.4具体代码以及讲解1.1任务说明学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系;学习内容:构建作者关系图,挖掘作者关系学习成果:论文作者知识图谱、图关系挖掘1.2数据处理步骤将作者列表进行处理,并完成统计。具体步骤如下:将论文第一作者与其他作者(论文非第一作者)构建图;使用图算法统计图中作者与其他作者的联系;1.3社交网络分析图是复杂网络研究中的一个重原创 2021-01-19 23:27:54 · 161 阅读 · 0 评论 -
数据分析---论文数据统计
数据分析—论文数据统计目录1.1任务说明1.2数据集介绍1.3arxiv论文类别介绍1.4具体代码实现1.4.1导入package并读取原始数据1.4.2数据预处理1.4.3数据分析及可视化1.1任务说明任务主题:论文数量统计,即统计2019年全年计算机各方向论文数量赛题的理解、使⽤ Pandas 读取数据并进⾏统计;学习 Pandas 的基础操作;1.2数据集介绍数据集来源:: https://www.kaggle.com/Cornell-University/arxi原创 2021-01-10 20:56:32 · 1709 阅读 · 1 评论 -
数据分析---论文作者统计
目录1.1任务说明1.2数据集介绍1.3数据集中选取所需要的数据字段1.4数据处理步骤1.5字符串处理1.6代码实现过程及说明1.6.1读取数据1.6.2数据统计总结1.1任务说明任务主题:论文作者统计,统计所有论文作者出现频率Top10的姓名;任务内容:论文作者的统计、使用 Pandas 读取数据并使用字符串操作;任务成果:学习 Pandas 的字符串操作;1.2数据集介绍数据集来源: https://www.kaggle.com/Cornell-University/原创 2021-01-11 23:59:49 · 709 阅读 · 0 评论 -
数据分析---论文代码统计
目录1.1任务说明1.2数据集介绍1.3数据集中选择所需要的字段1.4数据处理步骤1.5正则表达式1.5.1普通字符:大写和小写字母、所有数字、所有标点符号和⼀些其他符号1.5.2特殊字符:有特殊含义的字符1.5.3限定字符1.6具体代码实现以及讲解总结1.1任务说明任务主题:论文代码统计,统计所有论文出现代码的相关统计;任务内容:使用正则表达式统计代码连接、页数和图表数据;任务成果:学习正则表达式统计;1.2数据集介绍数据集来源: https://www.kaggle.原创 2021-01-14 20:46:11 · 370 阅读 · 0 评论 -
数据分析---论文种类分类
目录1.1、任务说明1.2、数据处理步骤1.3、文本分类思路1.4、具体代码实现以及讲解1.4.1、思路11.4.2、思路二1.1、任务说明学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;学习内容:使用论文标题完成类别分类;学习成果:学会文本分类的基本方法、TF-IDF等;1.2、数据处理步骤在原始arxiv论文中论文都有对应的类别,而论文类别是作者填写的。在本次任务中我们可以借助论文的标题和摘要完成:对论文标题和摘要进行处理;对论文类别进行处理;构建文本原创 2021-01-17 15:51:51 · 952 阅读 · 0 评论