机器学习与深度学习代码

最新推荐文章于 2024-08-25 21:30:09 发布

想很赚比的小星在摩拳擦掌

最新推荐文章于 2024-08-25 21:30:09 发布

阅读量523

点赞数 1

分类专栏：人工智能文章标签：数据结构 python 其他

本文链接：https://blog.csdn.net/weixin_52755699/article/details/121452004

版权

人工智能专栏收录该内容

4 篇文章 0 订阅

订阅专栏

该博客介绍了深度学习模型的构建，包括神经网络搭建、优化方法如SGD、Adagrad、RMSprop、Adam，以及L2正则化和Dropout的使用。同时，应用批标准化、早停策略进行模型改进，并通过Keras的GridSearchCV进行超参数调优。此外，还展示了AlexNet网络结构在MNIST数据集上的应用。

摘要由CSDN通过智能技术生成

搭建简单神经网络

深度学习的优化方法：
应该看更多的代码，了解这些优化方法的使用方式，
在层中的位置
设计出巧妙的结构（函数或类），可以使参数的设置更加自如

随机梯度下降：SGD，可以设置参数为动量梯度下降
Adagrad、RMSprop、Adam
tf.keras.optimizers.Adam
学习率设置？

正则化：
L2正则化，直接在层里面加
kernel_regularizer=regularizers.l2(0.01)
Dropout正则化：在每一层后面+
model.add(Dropout(0.3))

批标准化(BN层)

Earlystopping：
在model.fit,或者gridsearch.fit的时候用
callbacks_list = [EarlyStopping(monitor='val_loss', patience=5,min_delta=0.0001)]
grid_search.fit(X_sca, Y,callbacks=callbacks_list)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense,Dropout,Activation,BatchNormalization
from keras.wrappers.scikit_learn import KerasRegressor,KerasClassifier
from tensorflow.keras import utils
from tensorflow.keras import regularizers
data = pd.read_csv("11_train_classification.csv")
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold,GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
from keras.callbacks import EarlyStopping
from keras.callbacks import EarlyStopping

dataset = data.values
print(dataset)
#
X=dataset[:,0:13]
Y=dataset[:,13]

def larger_model(ndense = 2,a=20,b=10,c=0):
    model = Sequential()
    #每一层的神经元个数（对应输出空间维度utils,每一层的输出维度作为下一层的输入维度，第一层的输入维度需要指定）
    cell = [a,b,c]
    #第一层比较特殊，要和其他层区分开来
    #第一层需要指定输入维度
    #先是两个全连接层，再接一个softmax的全连接层
    for i in range(ndense):
        if i == 0:
            model.add(Dense(units=cell[i],input_dim=13,activation="relu",
            kernel_regularizer=regularizers.l2(0.01),kernel_initializer="he_normal"))
            model.add(Dropout(0.3))
        else:
            model.add(Dense(units=cell[i],activation="relu",
            kernel_regularizer=regularizers.l2(0.01),kernel_initializer="he_normal"))
            model.add(Dropout(0.3))
    model.add(Dense(units=3,activation="softmax"))
    #模型编译，多分类损失函数，优化器：用一种梯度下降算法，也可以是SGD，
    # 可以用函数tf.函数形式设置参数（eg学习率)准确率
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['acc'])
    return model
# model = larger_model()
#交叉验证
def cross_validation(model,X,Y,cv=5):
#定下rs,每次划分都一样
    kf = KFold(cv, shuffle=True, random_state=1)
    train_acc=[]
    test_acc=[]
    t=0
    for train_index, test_index in kf.split(X):
        train_X=X[train_index]
        train_y=Y[train_index]
        test_X=X[test_index]
        test_y=Y[test_index]
        #早停在fit里面设置
        model.fit(train_X,train_y)
        #,callbacks = callbacks_list
        acc=accuracy_score(model.predict(train_X),train_y)
        train_acc.append(acc)
        acc=accuracy_score(model.predict(test_X),test_y)
        test_acc.append(acc)
    return np.array(test_acc)

seed = 7
np.random.seed(seed)
#StandardScaler标准化，第一句似乎只是调用类，第二句才是调用归一化标准化函数
sca=StandardScaler()
#X_sca:标准化后的X
X_sca=sca.fit_transform(X)
#隐藏层一层，只用设置a，同理二层ab，三层abc，范围（10，31）步长2
#参数网格对应的是model的参数,因为是键值对所以用字典
#一个epoch=过了一遍训练集中所有样本
#batch_size 一次训练所选取的样本数。
param_grid = [{'ndense':[1],'a':list(range(10,31,2)),'epochs': [500], 'batch_size': [4]},
             {'ndense':[2],'a':list(range(1,31,2)),'b':list(range(1,21,2)),'epochs': [500], 'batch_size': [4]},
              {'ndense':[3],'a':list(range(1,31,2)),'b':list(range(1,31,2)),'c':list(range(5,20,2)),'epochs': [500], 'batch_size': [4]}]
model=KerasClassifier(build_fn=larger_model)
callbacks_list = [EarlyStopping(monitor='val_loss', patience=5,min_delta=0.0001)]
#早停设置在网格搜索里
#n_jobs=-1所有cpu工作
# verbose：日志冗长度，int：冗长度，0：不输出训练过程，1：偶尔输出，>1：对每个子模型都输出。
grid_search = GridSearchCV(model, param_grid, cv=5,
                          verbose=2,n_jobs=-1)

grid_search.fit(X_sca, Y,callbacks=callbacks_list)
print(grid_search.best_params_)

# model=KerasClassifier(build_fn=larger_model,a=20,b=10,ndense=2,batch_size=4,epochs=500)
# # #5折交叉验证
# results = cross_validation(model,X_sca,Y,cv=5)
# #返回准确率的数组accuracy_score
#
# print("Larger:%.4f(%.4f)MSE"%(results.mean(),results.std()))

AlexNet

import tensorflow as tf
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense,Dropout,Activation,BatchNormalization
from tensorflow.keras.layers import Conv2D
from tensorflow.keras.layers import MaxPool2D
from keras.wrappers.scikit_learn import KerasRegressor,KerasClassifier
from tensorflow.keras import utils
from tensorflow.keras import regularizers
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold,GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
from keras.callbacks import EarlyStopping
from tensorflow.keras.datasets import mnist
#网络结构
def net():
    model = Sequential()
    model.add(Conv2D(filters=96,kernel_size=11,strides=4,activation="relu",))
    model.add(MaxPool2D(pool_size=3,strides=2))
    model.add(Conv2D(filters=256,kernel_size=5,strides=1,padding="same",activation="relu"))
    model.add(MaxPool2D(pool_size=3,strides=2))
    model.add(Conv2D(filters=384,kernel_size=3,padding="same",activation="relu"))
    model.add(Conv2D(filters=384, kernel_size=3, padding="same", activation="relu"))
    model.add(Conv2D(filters=256, kernel_size=3, padding="same", activation="relu"))
    model.add(MaxPool2D(pool_size=3,strides=2))
    model.add(tf.keras.layers.Flatten())
    model.add(Dense(4096,activation="relu"))
    model.add(Dropout(0.5))
    model.add(Dense(4096,activation="relu"))
    model.add(Dropout(0.5))
    #10个分类
    model.add(Dense(10,activation="softmax"))
    model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['acc'])
    return model
#网络输入的条件？
# net=net()
#数量，高，宽，通道
# x = tf.random.uniform((1,227,227,1))
# y=net(x)
# print(net.summary())
# print(x)
(train_images,train_labels),(test_images,test_labels)=mnist.load_data()
#卷积神经网络的输入都是四维吗？
#原本是三维：数量，宽高 增加一维通道数
train_images = np.reshape(train_images,(train_images.shape[0],train_images.shape[1],train_images.shape[2],1))
test_images = np.reshape(test_images,(test_images.shape[0],test_images.shape[1],test_images.shape[2],1))
def get_train(size):
    index = np.random.randint(0,train_images.shape[0],size)
    resized_image = tf.image.resize_with_pad(train_images[index],227,227,)
    return resized_image.numpy(),train_labels[index]
def get_test(size):
    index = np.random.randint(0,np.shape(test_images)[0],size)
    resized_image = tf.image.resize_with_pad(test_images[index],227,227,)
    return resized_image.numpy(),test_labels[index]
#训练集和测试集的大小可以调整
train_images,train_labels = get_train(10000)
test_images,test_labels = get_test(10000)

# net = net()
# x = tf.random.uniform((1,227,227,1))
# y=net(x)
# print(net.summary())

net = net()
# net返回的是model
x = tf.random.uniform((1,227,227,1))
# y=model(x)
# model.fit()
y=net(x)
#训练集数量是训练准确率的关键
#大的batchsize可以防止过拟合？
#增大batchsize，增加epochs,准确度增高了
#128 3 96 500/ 500 3 95 /500 4 96.5 500 6 97.9
#optimizer和loss也可以调（暂时还没调）
# net.fit(train_images,train_labels,batch_size=4,epochs=3,verbose=1,validation_split=0.1)
net.fit(train_images,train_labels,batch_size=500,epochs=6,validation_split=0.1,verbose=1)
# plt.imshow(test_images[0].astype(np.int8).squeeze(),cmap="gray")
# plt.show()