COMP3032 – Machne Learning OneC/C++

Java Python COMP3032 - Machne Learning Assignment One (20 marks)

Marking guide

Task 1 (12 Marks):

Polynomial Regression Models (5 marks)

1     Read Data and Create Models (2 Marks)

o  Properly read the pressure.csv dataset and assign the correct columns to the respective variables.

o  Create polynomial regression models.

2     Plot (2 Marks)

o  Produce across-validation error plot using the mean RMSE for degrees 1 to 14.

3     Print Coefficients (1 Mark)

o  For the best degree of your choice, print the corresponding coefficients.

Multiple Linear Regression Model (2 marks)

4.    Read Data and Create Model (2 marks)

o  Read the dataset and create a multiple linear regression model to predict systolic pressure using all relevant features.

o  Print the coefficients of the model.

Ridge Regression Model (2 marks)

5.    Ridge Regression Model (2 marks)

o  Build the ridge regression model and make predictions

o  Print its coefficients.

Cross Validation (1 mark)

6.    Cross-Validation (1 mark)

o  Perform 10-fold cross-validation for the different models and display the mean RMSEs.

Short Answer and Documentation (2 marks)

7.    Short Answer and Documentation

o  Select the best degree and briefly explain why.

o  Select the best model among the three and briefly explain why.

o  Provide other necessary documentation (e.g., instructions on how to run the code, test run outputs, comments, etc.).

Task 2 (8 Marks): MNIST Digit Classification

1.    Read Data (1 Mark)

o  Read themnist_784 dataset and correctly assign the columns to the respective variables.

o  Transform. the labels according to the requirements.

2.    PCA (2 Marks)

o  Perform Principal Component Analysis (PCA) on the feature data to reduce its dimensionality while retaining 90% of the overall explained variance ratio.

o  Display the number of principal components preserved.

3.    Logistic Model and Predictions (2 Marks)

o  Create a logistic regression model using the reduced dataset.

o  Properly split the dataset and use the model to predict the labels for both the training and testing sets.

4.    Accuracy Evaluation (2 Marks)

o  Calculate and display the accuracy, confusion matrix, and misclassified digits.

5.    Short Answer and Documentation (1 Mark)

o  Assess the model generated (e.g., good, underfit, overfit) and briefly explain why.

o  Provide additional documentation (e.g., instructions on how to run the code, test run outputs, comments, etc.)         

  • 11
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值