集体智慧总结和使用范围归纳(三)

支持向量机(SVM)

先上图说明:

这是一种监督式的分类方法,适合于数据量比较大的情况。即是首先对已知数据进行区域判定,之后位置数据落在哪个区域内,就判断是属于哪个分类。

训练

这里假设对户主进行行为分析,横轴和纵轴分别是两个特征,而不同颜色则是她的3种行为习惯,那么在划分了区域后,之后只要知道她的两种特征后,就能推断出她在做什么。
但是,如果分类图如下所示:

就不好线性划分了,这时就需要用到 多项式变换或是 核技法。将这些点重新变成易于划分的形式。

优缺点

优点

适合于大量数据,分类速度快
缺点

遇到不好线性划分的数据要用核技法重新映射,然而不同的数据使用核技法的参数不同,每个都需要重新调整。
黑盒技术,虽然得到正确的结果,但不知道是如何得到的,过程难以理解。

k最邻近(KNN)

她的原理就是,对于一个需要预测的数据,找到已知数据集合中与她接近的k个数据,然后根据对他们的结果求均值得到预测的数据,常用来做价格预测。比如通过房子在什么城市,地段,卧室数量,房间面积,预测合适的房价。
这个方法不需要训练,只需计算未知数据与已知数据的关系即可。如图:

说到物联网的应用,假如未来你有个智能管家,家里的各种消耗品都不需要人再去操心买了,她都负责买好,那么问题来了,她如何确定什么东西多少钱呢,那么她会收集一系列该商品的价格,并分时间段进行分析,如果在用户对时间要求不高的情况下,她会在该商品最便宜的时候买下该消耗品。

优缺点

优点

简单好理解,对无用数据可清晰判断并剔除
可随时加入已知数据,不需重新训练

缺点

运算量大,源数据始终在不断变大
对于k的确定以及权重函数、参数的确定需要大量的测试,费时费力。


to be continue...
Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值