机器学习入门-分类器入门

餐厅评价分类

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

线性分类器

这里写图片描述

这里写图片描述

决策边界

这里写图片描述

训练分类器=学习权重

这里写图片描述

这里写图片描述

混淆矩阵

不同一应用中不同类型的错误的成本也会不同

这里写图片描述

模型需要学习多少数据

这里写图片描述

类别概率

这里写图片描述

总结

这里写图片描述

import graphlab
products = graphlab.SFrame('amazon_baby.gl/')
products.head()
构建词袋向量(添加一列)
products['word_count'] = graphlab.text_analytics.count_words(products['review'])
products.head()
探索流行商品
products['name'].show()
抽取特定数据
giraffe_reviews = products[products['name'] == 'Vulli Sophie the Giraffe Teether']
len(giraffe_reviews)
giraffe_reviews['rating'].show(view='Categorical')

这里写图片描述

情感分析
products['rating'].show(view='Categorical')
利用评分来判断情感(3中性评价去掉,12是负面的,45是正面的)
products = products[products['rating'] != 3]
正面为1,负面为0
products['sentiment'] = products['rating'] >= 4
训练情感分类器(交叉验证,训练)
train_data,test_data = products.random_split(.8,seed=0)
sentiment_model = graphlab.logistic_classifier.create(train_data,target='sentiment',features=['word_count'],validation_set=test_data)
评估情感模型(使用roc曲线测试集,auc是面积,面积越大,效果越好)
sentiment_model.evaluate(test_data,metric='roc_curve')
sentiment_model.show(view='Evaluation')

这里写图片描述

使用模型预测情感(输出概率倾向)
giraffe_reviews['predicted_sentiment'] = sentiment_model.predict(giraffe_reviews,output_type='probability')
基于预测情感降序排序,方便观察
giraffe_reviews = griaffe_reviews.soft('predicted_sentiment',ascending=False)
giraffe_review.head()
查看评价
giraffe_reviews[0]['review']
giraffe_reviews[-1]['review']
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值