- 博客(10)
- 收藏
- 关注
原创 基于梯度下降法的线性回归模型
很久没发博客,因为实在写不出有营养的东西,看到的数学公式又很难写。。。做了一个关于梯度下降的笔记,想用图片传上来,万恶的2M限制。。。 想看的同学可以去下载斯坦福大学机器学习课的课件,第一个PDF中就有推导,很详细 直接粘代码吧: #!/usr/bin/env python from numpy import * def createDataSet(): #为代码书写方便第
2015-03-18 21:43:06 763
原创 终于搭好了Hadoop,日志文件也开始记录
热闹了一周的时间一切都在向正轨移动,网站对于用户和所读文章的日志已经开始记录和分析,推荐算法也看了两个月的时间了,Mahout in action这本书还不错,不过原理讲的太少,初学感觉还是不错的,里面有用hadoop做map-reduce的例子,和同事一直在开玩笑,什么时间咱们也搞一把分布式计算。今晚终于完成了万里长征一小步,搭好了环境。官网的例子写的很好,基本没有走什么弯路,心情不错,期待几个
2015-01-26 21:45:15 534
原创 推荐功能学习笔记(二)PCA
PCA,具体我也说不上,我读书少。英文是这么写的(Principle Components Analysis)翻译一下啊,就是主成份分析。 从名字我们可以看出来,他能从多种相关成分中挑出主成份,对吧?比如一个长方体,长:200M,宽:5CM,高:10M,单从这个物体来说我们完全可以只取长和高其中2维,然后放入2维坐标系,是不是我们就做到了降维呢?OK,在对商品进行分析时,是不是面对诸多属性,很高
2015-01-11 22:22:08 651
原创 推荐功能学习笔记(一)
到了年关,在公司空闲的时间多了一些,趁这段时间学一学推荐这个功能,不定期会更新这些博客,每篇其实都是一个坑,不一定什么时候才能填上,慎入! 背景:进入大数据时代每个网站要存的东西越来越多,商品,电影,歌曲,等等。用户的选择空间也越来越大,如何能够快速帮用户定位到喜欢的商品也成为了问题,各大网站都会有自己的推荐或猜你喜欢。 推荐大概分为两种:协作式推荐和内容相关推荐,各有好坏,或者说可以用在不同
2015-01-08 20:59:21 611
原创 100颗药1颗毒药两天发作5只小白鼠如何3天检查出毒药
题目如标题,和常规的几只小白鼠能在最短的时间内检测出有少许的区别。 P1:首先,考虑最初的问题,两天时间如何用最少的小白鼠检测出毒药?给每颗药编号,用2进制表示,100颗最少用7位2进制表示,假设第33颗是毒药,则该药编号为0100001,我们拿这颗药去喂第1只和第6只小白鼠,则最终在第二天结束的时候会发现这两只小白鼠发病,其他的5只都正常,因为毒药我们只喂了1,6老鼠,对吧?根据老鼠的号我们就
2015-01-01 13:20:53 1795
原创 01背包 页面布局
遇到一个问题,一个宽度固定的div,2行,20列(宽度容纳20个字符)。如果行内已有词语的长度+当前要放入词语的长度>20则待放入的词语会在第二行放入。 词语从数据库得到,能得到一个词语的List集合。那么,问题出现了,如果将List中的词语全部放入div中,可能超过div的大小,而选择性的放入div又要如何选择才能尽可能的利用div的大小。由于div的个数很多,人工方法尽量不考虑。若按list
2014-12-28 12:47:22 439
原创 Ajax长连接
这种技术又叫反向Ajax,能够模拟服务器端想客户端的推送,只是在请求到达时服务器不马上进行响应,待有用数据处理完成后再进行response,简单测试了一下,没有进行超时设置(服务端,发送端均没设置,实际情况请自行斟酌)。至少服务器断睡1分钟是没有问题的 先上前端代码: $(function() { function connect(){ var xhr = new XML
2014-12-11 01:11:25 874
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人