- 博客(12)
- 收藏
- 关注
原创 推荐系统
最近在做推荐系统,这里分享一点过程中的感受NEG 有关NEG(negative sampling),这个概念其实来源于word2vec入门推荐好文章: Word2Vec-知其然知其所以然两种非常重要的函数sigmoid 将分类以概率来表示 g(x)=11+e−xg(x) = \frac{1}{1+e^{-x}}* softmax 解决多分类问题P(y=j|x)=ex
2018-04-04 15:57:55 239
原创 最小二乘与岭回归的概率论解释
最近在看《Pattern Regression and Machine Learning》,这里做一点笔记与感想。背景:考虑一个多项式拟合问题,如下图,绿线的方程是sin(2πx)sin(2πx)\sin(2\pi x),蓝点是由绿线并加上噪音(这些噪音是默认符合正态分布的)生成。已知条件是由NNN个点构成的训练集x=(x1,...xN)Tx=(x1,...xN)T\mathbf x...
2018-03-17 13:03:46 1954
原创 泊松分布
转载请注明出处:http://blog.csdn.net/liu_sn/article/details/79522008序你能预测去超市买方便面却发现没有调料包的概率吗? 或是你能预测你有多大的概率能骑上小黄歌会? 这些问题初看都很神奇,但都是可以被切切实实得计算出来的! 距离本科学习概率论快4年了,都差点忘了自己还曾经学习过这么牛逼的东西。基本公式设随机变量XXX表...
2018-03-11 23:58:38 1997
原创 平均分布
转载请注明出处:http://blog.csdn.net/liu_sn/article/details/79333368 今天遇到本很好玩的书,《世界是随机的:大数据时代的概率统计学》,在讲分布的时候作者说:概率分布就是概率论中的小九九。很有意思,看了之后确实觉得概率论在日常生活中也非常受用。这里会连载我在看这本书时候的感受。首先让大家对于概率论中的分布有一个整体的概念,见下图: ...
2018-03-10 23:29:52 4231 1
原创 copy()
坑:写工程代码的时候,往往会遇到这样的事情:def change(a): a['a'] = [] return Nonea = {'a': 'xxx'}change(a)结果是:{'a': []} 可见:函数会直接对a进行修改,当下面的程序再调用a 时 ,a['a'] 的类型都变了。解决:改进方法:def change(a): a ...
2018-02-12 16:59:32 662
原创 中式茶馆,那些发生在你身边的消费升级
记得两年前第一次来到杭州,站在杨公堤高高的拱桥上往对岸的北高峰望去,青山白云,中间是一湾郁郁葱葱的湖水,那一秒,就爱上这里了。对一个从城市平原来的孩子来说,西湖以及周围连绵不断的山脉就是天堂,这里有他从没见过的林间小溪,夜深了还有带着幽蓝灯光的小虫;有平静的湖面,夏末的夜晚还能看见西湖上空的银河,偶尔的流星;这儿还有藏在群山云雾中的龙井茶园,一到清明满城的香气。来到杭州,原本夏天都是买一箱冰红茶解暑
2017-08-31 14:47:20 701
原创 如何进行数据分析(以kaggle新手赛为例)-1:
首先这篇适合给那些跟我一样转行的朋友,转行不易,坚持第一!其次这篇文章也适合给那些准备面试的朋友,了解数据分析的大概流程,粗数据如何处理,这点比能多调用一个学习包更有作用~
2017-04-04 15:49:42 8556 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人