- 博客(7)
- 收藏
- 关注
原创 基于pandas和numpy的数据预处理之填补、删除缺失数据
1 原始数据表1 姓名 年龄 学龄 1 楚潇然 18 / 2 李子洲 21 5 3 肖良 2 4 凤于飞 3 5 花如雪 14 / 6 程羽 7 7 徐化仙 27 5 8 潘蝶儿 1 9 24 2 10 韩璐 18 8 2 处理目标图13
2021-08-12 15:35:12 329
原创 “互联网+”大学生创新创业大赛产业命题赛道命题方向分析
图1 大赛产业命题赛道部分命题如图1所示,产业命题赛道就好比命题作文,选题都是一些真实企业(如华为)提前定好的,参赛选手必须在命题要求的范围内按照要求进行准备。 这些命题直观上令人感觉到十分前沿,大部分都要求应用新技术,如区块链等,颇具难度。 作者对命题方向的分布十分感兴趣,于是爬取了所有命题题目,并对其进行分词,然后计算词频,并进行可视化呈现,直观准确地获得了命题方向的大概分布情况。1 整体思路图2 整体思路流程图2 ...
2021-08-07 18:33:56 21660
原创 Python-Numpy-排序操作
import numpy as nplist = [[1,9,8,5],[2,0,2,1]]arr = np.array(list) 首先调库并创建一个array对象1 返回排序后的值 - sortarr = np.sort(arr, axis = 0) #按列升序arr = np.sort(-arr, axis = 0) * (-1) #按列降序arr = np.sort(arr, axis = 1) #按行升序arr = np.sort(-arr, axis =...
2021-08-06 10:29:58 595
原创 基于pandas和numpy的数据预处理之缺失数据删除及数据类型转换(转换为sklearn可以使用的数值型数据)
1 导入数据import pandas as pddata = pd.read_excel('fifa21.xlsx', engine='openpyxl') #打开xlsx格式的excel表需要openpyxl引擎data.head() #查看数据前五行data.info() #查看数据信息图1 数据前五行展示(数据说明:熟悉足球和fifa系列游戏的朋友可以看出,我们的数据集是fifa游戏中的球员的数据。特征值有姓名、国籍、总评分、位置、花式技巧、速度、射门、传球、带球、防守、身.
2021-07-31 18:32:27 472 1
原创 Python-Pandas-利用append方法进行DataFrame数据添加
有的时候,我们希望在每一次循环结束时将这一次循环得到的数据添加到同一个DataFrame对象当中,这时候就会用到append方法。 首先,创建一个空的DataFrame对象import pandas as pddata = pd.DataFrame(None,columns=['A','B','C']) 这个DataFrame对象当中没有任何数据,行索引分别是A、B、C,这就相当于我们新建了一个Excel表,在第一行分别输入A、B、C作为标签。...
2021-07-13 20:02:47 32475
原创 Python-Pandas-DataFrame对象转置(交换行列)
DataFrame对象本质上是带有行列索引的二维矩阵,所以欲对DataFrame对象进行转置操作,需要交换行列索引,同时使二维矩阵转置。 首先创建一个DataFrame对象import pandas as pdlist_test = [[1,2,3],[4,5,6],[7,8,9]]index_colums =['A','B','C']index_row = ['a','b','c']df = pd.DataFrame(list_test, columns=...
2021-07-10 19:16:24 25883
原创 Python-Pandas-loc方法与iloc方法
1 Pandas的DataFrame对象本质是一个二维矩阵1.1 DataFrame对象简介 DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型。DataFrame既有行索引也有列索引。索引 列索引1 列索引2 列索引3 行索引1 0 1 2 行索引2 3 4 5 行索引3 6 7 8 图1 DataFrame对象形象化展示1.2 DataFrame对象生成...
2021-07-09 18:40:15 443
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人