李宏毅机器学习 Machine_Learning_2019_Task3

最新推荐文章于 2021-04-15 23:53:45 发布

风声想起

最新推荐文章于 2021-04-15 23:53:45 发布

阅读量166

点赞数

分类专栏：算法梳理

本文链接：https://blog.csdn.net/weixin_36466478/article/details/90452057

版权

算法梳理专栏收录该内容

13 篇文章 0 订阅

订阅专栏

作业1：预测PM2.5的值

在这个作业中，我们将用梯度下降方法预测PM2.5的值

hw1要求：
1、要求python3.5+
2、只能用（1）numpy（2）scipy（3）pandas
3、请用梯度下降手写线性回归
4、最好的公共简单基线
5、对于想加载模型而并不想运行整个训练过程的人：
hw_best要求：
1、要求python3.5+
2、任何库都可以用
3、在kaggle上获得你选择的更高的分

读取数据：
import numpy as np
import scipy 
import pandas as pd

lr = 0.001
# lr = 0.001

def get_train():
    # 获得PM2.5的训练数据
    with open("train.csv") as f:
        data = f.readlines()
    data = [i.strip().split(',') for i in data]
    train_data = [];train_label = [];
    for i in data[10::18]:
        for j in range(len(i[3:]) - 10):
            train_data.append(i[3:][j : j + 9])
            train_label.append(i[3:][j + 10])
    return np.array(train_data,dtype = np.float64),np.array(train_label,dtype = np.float64)

def get_test():
    # 获得PM2.5的测试数据
    with open("test(1).csv") as f:
        data = f.readlines()
    data = [i.strip().split(',') for i in data]
    test_data = [];test_label = [];
    for i in data[9::18]:
        test_data.append(i[2:])
    with open("answer.csv") as f:
        data = f.readlines()
    data = [i.strip().split(',') for i in data]
    for i in data[1:]:
        test_label.append(i[1])
    return np.array(test_data,dtype = np.float64),np.array(test_label,dtype = np.float64)

import numpy as np
import math
import pandas as pd
from sklearn.preprocessing import StandardScaler

# 损失函数
def lossfunc(x_train,y_train,theta):
    x_train = np.array(x_train,float)
    y_train = np.array(y_train, float)
    return np.sum((y_train - x_train.dot(theta)) ** 2) / len(y_train)
# '损失函数求导
def dlossfunc(x_train,y_train,theta):
    x_train = np.array(x_train,float)
    y_train = np.array(y_train, float)
    return x_train.T.dot(x_train.dot(theta) - y_train) * 2. / len(y_train)
# 归一化
def standardfunc(data):
    standard = StandardScaler()
    standard.fit(data)
    data =standard.transform(data)
    return data

待补充：

风声想起

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习 Machine_Learning_2019_Task3

作业1：预测PM2.5的值在这个作业中，我们将用梯度下降方法预测PM2.5的值hw1要求：1、要求python3.5+2、只能用（1）numpy（2）scipy（3）pandas3、请用梯度下降手写线性回归4、最好的公共简单基线5、对于想加载模型而并不想运行整个训练过程的人：hw_best要求：1、要求python3.5+2、任何库都可以用3、在kaggle上获得你选择的更...
复制链接

扫一扫