目标:已经有551个数据,试图构造一个bp神经网络,通过一个企业的各项指标来判断这个企业属于哪一类。
我写了两个函数,一个是主函数main,一个是读取数据和预处理的函数read_data,
其中read_data函数的代码如下:
# 该函数读取数据并分类
import pandas as pd
def judge(a):
# 该函数用来分类,分类依据为:
# 80分以上是1类
# 40~80分是2类
# 0~40分是3类
# -40~0是4类
# 小于-40分是5类
if a > 80:
b = 1
elif (a < 80) and (a > 40):
b = 2
elif (a < 40) and (a > 0):
b = 3
elif (a < 0) and (a > -40):
b = 4
else:
b = 5
return b
def import_data(path='./data/all_data.csv', rate=0.8, shuff=True):
# 需要输入3个参数,一个是数据的路径,另外一个是训练集和测试集的分布比例,默认是二八开,最后一个是是否需要打乱顺序
# 返回值是训练数据和测试数据
all_data = pd.read_csv(path, encoding="gb18030")
temp_data = all_data.drop(['new', '唯一主代码', '企业名称', '综合得分.1'], axis=1)
# 删掉这些没用的列
length = temp_data.shape[0]
# 整个列表的长度
class_list = []