![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
kuui
这个作者很懒,什么都没留下…
展开
-
python数据分析 Lending Club贷款数据
一.sample() 随机抽样函数loan.sample(n=3,axis=1,random_state=1,replace=True)#n=3 随即查看3列(默认为行)#axis=1可实现列采样#random_state有时,我们希望重复调用某次采样的结果,我们可以设定random_state参数为同一个数来实现。#replace=True又放回抽样(默认为不放回)loan.sample(frac=0.01)#抽取样本中的0.01%二.选取指定数据test_user = user.lo原创 2021-03-29 09:45:30 · 622 阅读 · 0 评论 -
python--numpy.random
numpy.random生成(0,1)均匀分布随机数np.random.rand(2,3)#array([[0.23159584, 0.1895618 , 0.87409391],# [0.40875295, 0.63464579, 0.83562079]])给定范围取随机数np.random.randint(0,10,size=5)产生二项分布随机数np.random.binomial(10,0.5,size=5)正态分布随机数np.random.normal(0,0原创 2021-03-14 17:33:28 · 86 阅读 · 0 评论 -
python--ufunc函数--numpy计算
NumPy"通用函数"(Universal Function ,ufunc)·元素级函数∶对数组中的每个元素进行运算·数组级函数∶统计函数,像聚合类的函数,求和,求平均等计算绝对值 absimport numpy as nparr = np.array([5,2,0,-1,-3,-1,-4])np.abs(arr)#array([5, 2, 0, 1, 3, 1, 4])计算各元素平方np.square(arr)#array([25, 4, 0, 1, 9, 1, 16],原创 2021-03-14 17:03:43 · 204 阅读 · 0 评论 -
Python--数组(ndarray)
创建import numpy as npv=np.arange(10)print(v)print(v.dtype) #类型int32print(v.shape) #(10,)v2=np.arange(0,10,0.5) #以0.5为间隔v2#array([0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5, 5. , 5.5, 6. , 6.5, 7. , 7.5, 8. , 8.5, 9. , 9.5])v2*10#运算array([ 0原创 2021-03-13 16:31:12 · 134 阅读 · 0 评论 -
对该数据集的字段请对该数据集的字段absence进行二值化处理
请对该数据集的字段absence进行二值化处理,超过8次的记为1,不超过8次的记为0,将处理后的结果存为该数据集的新列new_absence提示:可以使用sklearn.preprocessing中的Binarizer函数实现上述功能import pandas as pddata = pd.read_csv('newdata.csv')print(data[['absences']].head())# 二值化转换from sklearn import preprocessingbinariz原创 2020-05-16 21:12:03 · 176 阅读 · 0 评论 -
绘制多个参数箱线图
使用matplotlib绘制该数据集特征G1、G2、G3的箱线图(按照顺序G1,G2,G3)在一个子图中绘制需求图像import pandas as pdimport matplotlib.pyplot as pltfig = plt.figure(figsize = (10, 10))data = pd.read_csv('newdata.csv')# 绘制scores = ['G1', 'G2', 'G3']grades_df = data[scores]grades_df.boxp原创 2020-05-16 21:11:32 · 2621 阅读 · 0 评论 -
pandas统计行数,获取字段信息 例题
统计该数据集的行数,将结果存为row_num获取该数据集的各个字段名称,将结果存为col_array从该数据集中,读取字段school, sex, age,address 的信息,将结果存为dataimport pandas as pdall_data = pd.read_csv('studentmath.csv')# 统计行数row_num = len(all_data)# 获取各字段名称col_array = all_data.columns# 读取指定字段信息data =.原创 2020-05-12 13:20:09 · 3377 阅读 · 0 评论 -
pandas判断标称型和数值型特征数据
现已使用Pandas读取数据集studentmath.csv加粗样式 请获取该数据集各个特征的数据类型,将标称型特征存为nominal_array,数值型特征存为numerical_array要求:nominal_array和nominal_array为列表结构提示:可以使用Pandas中的select_dtypes()函数区别字段的类型,比如标称型字段的dtype为object,数值型字段的dtype为int和float正误判定变量:nominal_array,numerical_arrayimp原创 2020-05-12 13:11:53 · 1814 阅读 · 0 评论