集体智慧编程
ah4526
这个作者很懒,什么都没留下…
展开
-
集体智慧编程_第六章文档过滤
文档和单词将单词作为特征。将任何非字母类字符为分隔符对文本进行划分,将文本拆分为一个个单词,并转化成小写形式。import reimport mathdef getwords(doc): splitter.re.compile('\\W*') words=[s.lower() for s in splitter.split(doc) if len(s)>2 and l...原创 2020-02-24 17:02:08 · 187 阅读 · 0 评论 -
集体智慧编程-第五章优化
组团旅游import timeimport randomimport mathpeople=[('seymour','BOS'), ('FRANNY','DAL'), ('ZOOEY','CAK'), ('WALT','MIA'), ('buddy','ORD'), ('LES','OMA')]destina...原创 2020-02-24 17:01:27 · 1092 阅读 · 0 评论 -
集体智慧编程_第七章决策树建模
预测注册用户针对某个web站点的用户行为及其最终购买决策。最后一栏的服务类型是我们需要预测的内容。来源网站、位置、是否阅读过FAQ、浏览网页数、选择服务类型。将数据文件加载进来:my_data=[line.split('\t') for line in file('decision_tree.txt')]引入决策树class decisionnode: def __init_...原创 2020-02-24 17:02:50 · 166 阅读 · 0 评论 -
集体智慧编程_第二章提供推荐
协作型推荐一个协作型过滤算法是对一大群人进行搜索,并从中找出与我们品味相近的小群人。算法会对这些人所偏爱的其他内容进行考察,并将他们组合起来构造出一个经过排名的推荐列表。搜集偏好我们通过采用嵌套的字典的方法来表达不同人及其偏好的方法。我们建立一个数据集,命名为recommendations.py 采用1到5的评分,来体现包括本人在内的每位影评者对某给定影片的喜爱程度。from recom...原创 2020-02-24 16:58:52 · 271 阅读 · 0 评论 -
集体智慧编程_第九章核方法与SVM
为约会网站的用户寻找配对;数据包含数值型、名词性和大量的非线性关系。class matchrow: def __init__(self,row,allnum=False): if allnum: self.data=[float(row[i]) for i in range(len(row)-1) else: s...原创 2020-02-24 17:03:30 · 224 阅读 · 1 评论 -
集体智慧编程_第十章寻找独立特征
除了第三章的聚类算法属于非监督技术之外,其余大部分章节都主要集中在监督分类器上。本章将研究如何在数据集并未明确表示结果的前提下,从中提取重要的潜在特征来。鸡尾酒宴会。搜索一组新闻选择新闻来源选择的订阅源中的新闻内容存在重叠import feedparserimport refeedlist=['http://...','http://...']下载新闻来源接受一个大型的数据矩...原创 2020-02-24 17:04:04 · 282 阅读 · 0 评论 -
集体智慧编程_第三章发现群组
本章对上一章中的思想加以扩展,并引入数据聚类的概念,这是一种用以寻找紧密相关的事、人或观点,并将其可视化的方法。监督学习和无监督学习监督学习法:利用样本的输入和期望输出来学习如何预测的技术。包括神经网络、决策树、向量支持机,以及贝叶斯过滤。无监督学习算法不是带有正确答案进行训练,目的是在一组数据中找寻某种结构,而这些数据本身不是我们所需要的答案。聚类算法的目标是采集数据,然后从中找出不同...原创 2020-02-24 17:00:38 · 183 阅读 · 0 评论