ML assignment #1

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; text-align: center; font: 17.0px "Trebuchet MS"; color: #000000 } p.p2 { margin: 0.0px 0.0px 0.0px 0.0px; font: 16.0px Helvetica; color: #000000 } p.p3 { margin: 0.0px 0.0px 0.0px 0.0px; font: 14.0px Helvetica; color: #000000 } p.p4 { margin: 0.0px 0.0px 0.0px 0.0px; font: 14.0px Helvetica; color: #000000; min-height: 17.0px } span.s1 { } span.s2 { font: 16.0px "Trebuchet MS" } span.Apple-tab-span { white-space: pre }

ML assignment #1

Problem:

implement classification model to train the Iris dataset and make predictions. 

Environment:

Navigator and Jupyter notebook

Language:

python 2.7

Module:

graphlab, matplotlib

Workflow:

1、decision tree using trainset and testset

首先使用graphlab.SFrame.read_csv(“Iris.csv”)導入數據集,然後將數據集,然後將其random split為trainset 和 testset,使用graphlab.decision_tree_classifier.create(train_data,target = target,features = features)

訓練model.該function會自動進行pruning 來防止overfitting.

訓練結果: 

 

 

接著使用model.evaluate()分析預測準確率,準確率結果為:0.9629629629629629

使用model.predict()對testset做出prediction,檢驗訓練模型. 並用 matplotlib畫出confusion matrix.

 

confusion matrix: 

 

 

2、decision tree using K-fold cross validation

首先使用 graphlab.cross_validation.KFold(iris,10)將iris數據集進行10-fold拆分. 然後loop進行模型訓練,計算平均誤差.

最後的平均正確率結果為: 0.926666666667, 更佳符合實際.

 

3、decision using boosting 

graphlab.boosted_trees_classifier.create(train_data,target=target,features=features)

對 train_data用boosting進行訓練,從結果中可以發現,耗時優於上面其他decision tree 算法.

 

 

 

接著使用model.evaluate()分析預測準確率,準確率結果為:0.9629629629629629

使用model.predict()對testset做出prediction,檢驗訓練模型. 並用 matplotlib畫出confusion matrix.

 

4、using random forest   graphlab.random_forest_classifier.create(train_data,target=target,features=features)

對 train_data進行random forest訓練.

結果如下:

會發現耗時較長,效率較差.

 

  

 

Conclusion: 

總共使用了四種方法來對Iris 數據集進行模型訓練,其中1,3,4準確率相等,2略低但更符合test結果.所有的模型的confusion matrix均相同.

AWS架构设计是指在云平台上,根据客户需求和业务目标,使用AWS的各种服务和技术,创建一个可扩展、高可用、安全且高效的解决方案的过程。在进行AWS架构设计时,需要考虑到几个关键因素。 首先是可扩展性。通过合理地使用AWS的弹性计算、存储和数据库等服务,可以实现根据需求自动扩展资源的能力。这样可以确保系统在面对高流量和负载时仍能提供良好的性能。 其次是高可用性。通过在多个AWS区域之间部署资源以及使用自动故障转移功能,可以确保即使在部分区域出现故障或服务不可用时,系统仍能正常运行,保证业务的连续性。 再者是安全性。AWS提供了一系列的安全服务和工具,如身份和访问管理(IAM)、虚拟私有云(VPC)、网络访问控制列表(ACL)、安全组等,可以帮助保护系统免受未授权访问和网络攻击。 另外,AWS架构设计还需要考虑成本效益。通过合理使用不同类型的计算实例、存储和数据库服务,可以优化成本并确保在不牺牲性能和可靠性的前提下实现最佳的商业效益。 在进行AWS架构设计时,需要了解业务需求,选择合适的AWS服务和技术,并通过不断的优化和调整来确保系统的持续改进。同时,还需要考虑到数据的备份和恢复、监控和报警、日志管理等方面,以提供一个完整的解决方案。 总而言之,AWS架构设计是一个综合考虑需求、可扩展性、高可用性、安全性和成本效益的过程,通过合理利用AWS提供的各种服务和技术,构建一个优秀的云架构解决方案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值