自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (3)
  • 收藏
  • 关注

原创 抓获数据集以及存储

缘由作为推荐系统的最开始,便是原始数据的问题。这个数据说起来倒也非常广泛,如果是推荐图书的,那么就是图书的信息的数据集,电影的就是电影的数据集等等。像我们音乐的,第一步就是获得歌曲、歌手等等数据集。然而这些我现在都没有,按理我一个研究推荐系统的,不应该考虑怎么去获得数据集的问题,无奈项目刚起步。我们虽然不缺音乐数据集(歌曲、专辑、歌手等等),但是我们缺用户数据集。也就说,由于我们要做的是一个新

2014-01-26 19:41:20 1224

原创 读书笔记:“集体智慧编程”之第六章:文档过滤的基础和朴素贝叶斯分类器

开篇一听名字就很觉得意思明白了很多了吧。文档过滤是机器智能应用的一个方面。主要使用在:过滤垃圾邮件过滤论坛内垃圾帖子博客和维基的垃圾内容书中提示:本章所讲算法更具有一般性,也就是说不一定只能用来做垃圾过滤,还可以用来完成对邮件分类等等。早期用于过滤的分类器早期过滤垃圾的信息非常简单,使用:基于规则的分类器,规则就是人为事先设定好的,比如英文字母大写与医药品有

2014-01-25 16:04:02 1509 2

原创 读书笔记:“集体智慧编程”之第三章:带偏好条件的聚类及聚类的展示方式

带偏好条件的聚类含义第五章讲求最优解的时候,也有一个涉及偏好的对宿舍分配人员的例子。我发现这个挺喜欢讲针对偏好的情况。然而,我个人认为这个针对偏好这一说法,还是比较复杂的,所以我认为最好不要试着去理解其词语背后深刻的含义,没有深刻的含义。举例子说明就很好办有一个网站:Zebo(www.zebo.com),允许人们列出自己有拥有的物品和希望拥有的物品。我们今天的例子就是针

2014-01-23 22:34:25 1623 2

原创 读书笔记:“集体智慧编程”之第五章:“求最优解”的算法

优化显然刚开始我并不太明白这一章要讲什么,因为根据“优化”这个词,我还以为是对函数进行优化之类的。后来,我才明白,这一章在要讲求最最优解的算法。由于我曾在老师的算法课上讲过遗传算法,遗传算法就是用来求最优解的算法,所以我忽然明白了这个优化具体是指什么。制定旅行计划的例子情况描述显然上述内容都是废话,对于这一章,关键还是要怎么学好那些优化算法。我自己是通过举例子才明白

2014-01-23 00:23:42 3771 2

原创 读书笔记:“集体智慧编程”之第三章:“发现群组”的 k均值聚类

分级聚类的缺点此前学习的分级聚类、与列聚类,有二个缺点:计算量大的惊人,数据越大运行非常缓慢。没有确切的将数据分成不同的组,只是形成了树状图。虽然我倒觉得如果写过多的代码这一点还是可以搞定的。k均值聚类可以应对上述两种缺点,我们会预先告诉算法生成的聚类数量,也就是我要产生几个类。原理如下图所示,对于5个数据项和两个聚类过程是这样的,先随机产生两个聚类点,

2014-01-22 22:22:26 1429 1

原创 读书笔记:“集体智慧编程”之第三章:“发现群组”的 列聚类

什么是列聚类?对博客数据使用了分级聚类的方式分析,我们可以又学的一种聚类方式:列聚类。刚刚的分级聚类就是对行进行了一个聚类。行是什么?行就是一个又一个的博客名,列是什么?列就是一个又一个的单词,那么进行行聚类的时候,我们是根据单词的词频将不同的博客聚了一次类。当我们对单词进行聚类的时候,我们就称之为列聚类。意义何在正面回答,我们知道了哪些单词会时常一起使用。对于这个列子

2014-01-22 21:40:56 1626

原创 读书笔记:“集体智慧编程”之第三章:“发现群组”的 分级聚类

聚类这章的主旨是数据聚类:聚集关系紧密的人或者事物。聚类有什么好处呢?从推荐的角度来看,也是一种求相似用户的方式。此外,如果我们统计消费者此前购买的物品,再做一个聚类,就能分析出什么样的消费者会想要得到什么。如此抽象的描述非常不利于学习,不过下面本章第二个例子就能很好解释上面这句抽象的话。拭目以待吧。聚类属于无监督学习(unsupervised learning),这不知道为什么这个词

2014-01-21 23:26:59 1871 2

原创 读书笔记:“集体智慧编程”之第二章:推荐算法

什么是推荐?推荐,就是根据个人偏好,对某个人进行个性化推荐。在线购物的商品推荐热门网站的推荐音乐推荐电影、电视的推荐推荐的依据主要来自每个人过去的操作:购买、评分、评论。对这些过去的数据利用算法进行处理,就能得到这个人的偏好、甚至产生值得推荐的产品。通常,我们会询问朋友有什么好看的电影,当然正常人都会询问和自己有着相同爱好的人。那么有一种算法叫做协同过滤:就是找到和目标用户有着

2014-01-21 22:48:07 4816 2

原创 初学python:《简明python教程》的学习笔记

学习python的缘由决心在一个这个寒假更加深入学习推荐系统之后,本来打算看数据挖掘导论或者是数据挖掘:概念与技术。不过在询问过一位学长之后,他推荐我看一看更加基础的书:集体智慧编程。该书所有的代码都是由python完成,在阅读了前4章之后,深刻觉得需要系统学习一下python。而且当时学长也说了,要学机器学习,python是必学的,而且python也不难。所以更加坚定了学习python的决心

2014-01-18 00:57:51 7847 1

原创 林老师最后一次大作业:Project 10 – RTSP Windows Client: RFC 2326

Section I Problem Specification翻译老师要求:也可以直接看我另一篇博客题目:Project 10 – RTSP Windows Client: RFC 2326RSTP的windows客户端:RFC 2326A. OverviewIntroduction of RTSPThe Real Time Streaming Protocol (RT

2014-01-10 20:36:01 4586

metronic.bootstrap

metronic.bootstrap.rar

2015-03-24

CLRS_exercises_2.1-1.xlsx

Using Figure 2.2 as a model, illustrate the operation of INSERTION-SORT on the array A =(31, 41, 59, 26, 41,58).

2015-02-26

WpdPack vs2010使用的winpcap的api

WpdPack vs2010使用的winpcap的api

2013-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除