python基操（英文环境下输入代码）

医个学僧

已于 2023-09-19 23:33:05 修改

阅读量354

点赞数

文章标签： python

于 2020-09-03 23:38:41 首次发布

本文链接：https://blog.csdn.net/noob0/article/details/108393376

版权

#导入库
import pandas as pd
import numpy as np
from sklearn.utils import shuffle

#读取数据（注意是文件路径，即需要加文件后缀）
xlsx1_filePath = 'D:/study/radiomics/data/breast_cancer1.xlsx'
xlsx2_filePath = 'D:/study/radiomics/data/breast_cancer2.xlsx'
data_1 = pd.read_excel(xlsx1_filePath)
data_2 = pd.read_excel(xlsx2_filePath)

#看行列数
rows,cols = data_1.shape
print(rows,cols)

#看前几行
data_1.head()

#看列标题
data_1.columns

#新增一列（从0行开始，每行定义为1）
data_1.insert(0,'lable1',[1]*rows)
#新增后查看
data_1.head()

#定义数据（合并前）
rows_2,cols_2=data_2.shape

#合并数据
data=pd.concat([data_1,data_2])

#混序
data=shuffle(data)

#排除无效数据NaN
data['FrequencySize']=np.nan

#无效数据NaN赋值
data=data.fillna(0)

#附加

#选择多列  
data[['列名称1','列名称2']]

#选择出自变量X及因变量Y数据集
#第一种
x_train=data_train.drop(["status"],axis=1)
y_train=data_train["status"]
#第二种
y_train=data_upsampled["status"]  #y数据集
x_train=data_upsampled.iloc[:,1:]     #x数据集

#选择多行(左闭右开区间)  
data[0:2]

#定向选择  
data.iloc[1:4,3:6]
#若无限则只用：


进阶（数据类型）
#数字(整数int，浮点型float)
a=1
b=1.0
print(type(a))
print(type(b))

#字符串string
c=’1’
d=’1.0’
print(type(c))
print(type(d))

#布尔值bool
e=true
f=false
print(type(e))
print(type(f))

#赋值及运算
x=1
y=2
z=x
x=y
y=z
print(x,y)

医个学僧

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python基操（英文环境下输入代码）

#导入库import pandas as pdimport numpy as npfrom sklearn.utils import shuffle#读取数据（注意是文件路径，即需要加文件后缀）xlsx1_filePath = ‘D:/study/radiomics/data/breast_cancer1.xlsx’xlsx2_filePath = ‘D:/study/radiomics/data/breast_cancer2.xlsx’data_1 = pd.read_excel(xlsx1
复制链接

扫一扫