- 博客(208)
- 收藏
- 关注
转载 机器学习模型的11个要点
【原题】A Few Useful Things to Know About Machine Learning【译题】机器学习的那些事【作者】Pedro Domingos【译者】刘知远【说明】译文载于《中国计算机学会通讯》 第 8 卷 第 11 期 2012 年 11 月 ,本文译自Communications of the ACM 2012年第10期的“A Few Useful T
2015-02-25 08:40:52 1187
原创 电子科技大学--大数据论坛--相关资料
//2014年12月9日各位老师同学大家好,下面是11月30日以及12月1日在电子科技大学举办的大数据论坛的相关资料的下载链接。感谢各位老师与同学的支持!11月30日上午:– 沈华伟:Collective attention and collective allocation slides
2014-12-09 12:30:15 2098 1
原创 机器学习进阶之贝叶斯
//2014年11月16日http://blog.csdn.net/u013599826/article/details/41172131教研室seminar中做关于贝叶斯的报告的ppt
2014-11-26 21:35:27 627
转载 机器学习两大派别--南大周志华
机器学习现在是一大热门,研究的人特多,越来越多的新人涌进来。不少人其实并没有真正想过,这是不是自己喜欢搞的东西,只不过看见别人都在搞,觉着跟大伙儿走总不会吃亏吧。问题是,真有个“大伙儿”吗?就不会是“两伙儿”、“三伙儿”?如果有“几伙儿”,那到底该跟着“哪伙儿”走呢?很多人可能没有意识到,所谓的machine learning community,现在至少包含了两个有着完全
2014-11-07 15:10:38 6419
原创 学习总结:机器学习(1)学习资料汇总
//2014年2月17日寒假里学习了stanford的《机器学习》,由Andrew Ng教授(华裔)主讲,收获很大,特在这里进行学习资料汇总,以供后来人飨。汇总后发现资料未免太多,不利于后来人选择,下一篇blog我会对这些资料进行特点阐述。授课视频资料:http://v.163.com/special/opencourse/machinelearning.html官方课件:
2014-02-17 10:37:09 1543 1
原创 上课笔记--商法(下)
//2015年7月5日第四讲 专利与专利制度1.专利权主体-专利权人发明人、受让人、继承人、职务发明单位2.专利权客体发明、实用新型(中国特色)、外观设计3.专利权标准新颖性--不属于现有技术(未公开,但展览会、学术会议不算)创造性实用性4.不授予专利权科学发现、智力活动、疾病诊断、动植物、平面图案5。专利权人的权利
2015-07-05 23:17:41 966
原创 上课笔记--商法(上)
//2015年7月5日不同意其他商学课程,商法是一门让人觉得学了绝对有用的文科课。记得大一的时候看了朱苏力的《法理学》,如今再对应着现在学的具体法条,而且是效率为先的商法。略有所悟。不过毕竟不是专门学法律的,笔记中不提具体法条,对经典案例、各个场景下了解就行。我对背法律没兴趣,对法律球赛辩论更没兴趣,但对探寻它对社会运行的影响挺有兴趣,法经济学嘛,用经济学的方法去研究法律,去设计法
2015-07-05 22:34:37 1069
原创 阿里实习一周小结
//2015年6月28日来蚂蚁金服实习一周了,特地做一个小结。实习感受:1.面的是数据研发,可以因为二面大boss(竟是大部门的主管,不知道是不是常态)手下不是数据部门,都是研发测试岗,因此成为实质上java研发一名。2.关于上面再说明一下,因为支付宝一直在推全栈工程师(研发+测试),所以其实不管你是什么研发岗,都是java研发的工作。测试也要慢慢转研发,c++的更惨根本没有通知其
2015-06-28 18:19:37 1885 1
原创 Java语法小记
1.HashMap提高冲突时性能好的初始值扩容list底层用数组实现,asList会改变次序,但传给新的arraylist则不会继承、组合、接口继承:父类改了,子类都要改;耦合度太高静态工厂:类的创建模式,静态方法模式广义接口的真正意义是在类的继承中体现多态的功能;重载不是多态final:终态final类:不能被继
2015-06-28 17:09:53 601
原创 马士兵教你如何面试(记录原话)
//2015年5月2日//重要的是展现自己!一、不要只回答对与错应试教育害死人,拿到问题就在不停地想,到底是对还是错;其实对错不是很重要,重要的是为什么对,为什么错。这样回答的话就算你回答不出,也比交白卷的人好。i+=i++结果如何答:我项目写的比较多,一般不会这么写。我知道这是编译器,虚拟机方面的知识,给我点时间,我再去看一个XX书,应该能解决这个问题。二
2015-06-28 17:04:00 3974 2
原创 回顾SIGKDD被拒
//2015年5月31日1、论文本身就不够SIGKDD标准,而且导师说这篇论文的最大卖点竟然在于“概念”!2、评审的专家其实不懂这个领域,从review中看出。问了很多啼笑皆非的问题。3、导师的另一篇文章中了,但那篇文章之前被ICDM拒了最后,我觉得学术其实也挺坑的,其中数据挖掘领域更坑(干货太少),要学还是学机器学习。
2015-05-31 12:13:25 3216
原创 知乎上炒的沸沸扬扬的阿里内部矛盾
//2015年5月31日怎么说呢,看了还是心惊胆战。不过还好,在面试过程中感受到的一切并不支持这种怀疑。总之去亲身体验一下吧~如何评价阿里 HR 对离职员工谈话造假,然后内部 IT 系统开发绩效被打低分?http://www.zhihu.com/question/30328482如何评价 @左耳朵耗子 关于建设团队的一条微博?http://www
2015-05-31 11:53:44 1182
原创 蚂蚁金服-数据研发-实习
//2015年5月7日今天圆桌会议敲定了部门,暑期就要去蚂蚁金服实习了。分到蚂蚁金服的一共十个人,两个人导师不放,然后其中三个是本科生(三个都是被同一个主管招进来的,我想没有这位主管可能也就进一两个本科生吧)。之前没有想到本科研究生比例这么悬殊,其实我倒是觉得更应该招本科生,实力可以等于潜力,但要拉到同一时间点来看,优秀本科生做个三年那还不完爆刚毕业的研究生,同样那些研究生在本科阶段可
2015-05-07 18:29:19 3417
原创 《Hadoop权威指南》索引笔记
//2015年5月2日一、HDFS1.HDFS一次写入,多次读取,每次分析应涉及大部分数据-批处理才有优势2.HDFS缺点3.HDFS块大小默认64M,但实际工作中往往调大4.namenode,datanode5.文件读取剖析6.文件写入剖析7.文件缓存HDFS建一个目录或一个小文件,可能不会马上看到和操作系统一样
2015-05-04 14:22:36 512
原创 《推荐系统手册》笔记
//2015年5月3日0.推荐系统来源如何解决信息过载:搜索引擎:被动,智能程度低广播:信息找人,需要用户自己过滤信息过滤:推荐系统:相比信息过滤,并不把信息收集作为重点分类:基于内容(可离线计算,缓解冷启动,稀疏性,解决不了多媒体)协同过滤(解决了多媒体;潜在需求)混合过滤(。。)基于模型(SVD)网络(二部图:热传导、物质扩散)
2015-05-04 14:06:27 1097
原创 数学建模之机理分析、统计分析、层次分析
//2015年5月2日数学建模书籍有一些章节是让人搞不懂的,人们可以接受排队论,最优化,线性规划等等技术型的学科,但对机理分析、层次分析这些既搞不懂,也不认为有什么意义。(我个人的写照)。主要是书上都没有讲清楚这个概念:一、机理分析用经典的数学工具分析现象的因果关系。什么是经典的数学工具:人口模型(增长速率先上升后下降),相变(物理上概念,用在模型上即是某些重要指标突变),博弈
2015-05-02 12:48:58 7872
原创 上课笔记--商务调研
//2015年5月2日调研目的:1.确定客观原因是否对汽车销售下滑产生消极影响-行业因素2.通过同期对比,确定销售是否长期处于相同销售局面3.是否四月份有新车上市,产生冲击4.了解客户的需求及喜好,更好的销售5.根据产品销售范围确定一个调查范围,确定调查对象(需要先总结出消费者特征)
2015-05-02 11:49:22 433
原创 上课笔记--人力资源管理
//2015年5月2日一、人力资本是商品,但更是可以开发性投资带来财富增值的资本形式。二、一个人的社会价值:劳动力市场决定人的价值受到以下因素的影响:人性,个人目标、组织目标,管理的效果三、人性的假设:对于不同假设有不同管理方式经济人自我实现人社会人四、现代人力资源管理框架组织与岗位设计人力资源规划和成本管理招聘职业培训与发展绩效与薪
2015-05-02 11:36:49 531
原创 阿里内推实习岗面经
//2015年5月2日2月28号面的,当天投的简历,结果下午就来电话啦。。。主要问了项目经历;没专门问技术问题1、内推部门-搞清楚自己被内推到哪个部门;不要说自己想去什么部门2、电话面试-可以再约时间(本人是投简历当天就被电话面试了)3、被问技术题卡住时不要试图百度(当对方耐心等待你回答时,你辛苦找百度却发现找不到,本来你仔细想想是可以回答一点的,结果却落下一个“不能随机应变”
2015-05-02 11:32:29 1056
原创 上课笔记--学术英语
a sufficient amount of evidence to support it=》sufficient supporting evidence另外注意:common academic nonusevaluative adjectivesusing adverbials for cohesionessay verbs
2015-05-02 11:29:40 877
原创 数据库面试题(mysql,nosql)
//2015年5月1日一、索引聚集索引、非聚集索引前者B树叶子节点包含数据,后者叶子节点包含数据地址聚集索引优点:提升IO密集负载性能;缺点:插入代价高索引缺点:维护索引耗时;占用空间大建索引须知:建在where,group by,排序等列上;不建在性别等少数类别的列上建索引不一定加速:索引没有查询所需字段一年后DB变慢了:答题方向是cpu、磁盘、内存二
2015-05-01 16:11:50 3100
原创 腾讯历年笔试题(计算机基础)
//2015年5月1日1.磁盘访问:磁盘会一直寻址,I/O结束后不会因为处理数据而停止2.物理地址=块号*8K+逻辑地址(偏移量)3.哈希技术之顺序查找法4.各排序算法细节所需空间、是否稳定、与初始数据有序无序的关系5.B树需要几次磁盘IO log10(100000)=3.256.后缀表达式:最后计算的操作置顶7.typedef和#define的区别前者有类型检
2015-05-01 15:50:36 625
原创 海量数据处理--简易版
//2015年5月1日一、分治法map reduce(注意mapreduce要实现全排序的难点)分治法注意点:你分的是否有规律1.你用hash分,则不同部分间不可能有相同的数据二、int型与string型数据前者 bitmap后者 trie tree三、top N分治法则每个map中取top N,最后在reduce中合并为一个Top N或者堆
2015-05-01 15:00:21 409
原创 机器学习算法在工业界运用时所做的优化算法(关联规则、协同过滤)
//2015年5月1日一、KNNKD-Tree二、关联规则三、协同过滤问我ItemCF的工程实现,面对大数据如何实现,又追问了有没有什么工程优化算法。这个问题我没答好,一开始我说了一个MapReduce模型,他问能不能更快一点,我就卡那了。。。最后面试官告诉我,不能只从算法角度分析,要从系统设计分析,利用内存来减小MapReduce的吞吐量。四、
2015-05-01 14:22:46 825
原创 如何出彩地回答面试中基础的机器学习算法
//2015年5月1日//摘自http://blog.csdn.net/u013599826/article/details/45418707//还有一个模块是关注机器学习在工业界运用时所做的优化算法;特别是协同过滤、关联规则四、逻辑斯蒂回归和普通线性回归相比,在类别变量的使用上有了突破。实际上是一层人工神经网络,训练方式等同最大熵广义线性模型:
2015-05-01 13:47:01 886
原创 常见面试之机器学习算法思想简单梳理(进阶版)
//2015年5月1日//参考http://blog.jobbole.com/74438/找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这
2015-05-01 12:30:20 3320
原创 阿里天池大数据竞赛(杂)
//2015年4月30日//未完成预处理:刷点击用户重复记录一、模型跑不出分层,我们自己来分层模型一:预测重复购买的 18/12548模型二:对已买过的商品 43/43720模型三:对已交互的,新品 124/302800模型四:前一天加购物车的 51/1027二、正例从何而来全正例三、业务熟练发现加很多购物车的用户
2015-04-30 13:04:02 1487
原创 刘汝佳《算法竞赛入门经典》索引笔记
2015年4月30日ACM学习技巧--14浮点数陷阱--18#include--22fopen("input.txt","r",stdin)--25#ifdef--26%lld--29大数组在main外面声明--34memset(a,0,sizeof(a))--35count++滥用--40Linux换行符问题--41fgets(buf,sizeof(s
2015-04-30 12:47:07 557
原创 阿里天池大数据竞赛(一)用ODPS提取特征
//2015年4月30日提取特征之所以难,是因为我们写出的sql语句往往只能提取一个特征。而在ODPS上却不一样,一条语句可以提取很多特征。如提取最近1、2、3、4天四种行为的数量重点是decode函数,具体用法详见ODPS-sql文档int days[]={0,-1,-2,-3}; String sql="create table if not exists user_
2015-04-30 12:04:59 1647
原创 豆瓣、腾讯、阿里、微软-2015年暑期实习生笔试经历
//2015年4月4日各种笔试算是告一段落了,是时候总结一下,至于电话面试,各种被拒。。。豆瓣:投了豆瓣的算法工程师(推荐系统等),豆瓣的笔试时间是不统一的,另外其笔试题网上是搜不到的。到时间后会收到一封邮件,点进去就开始答题了。但有一个问题是邮件不准时,此时可以从通知笔试的邮件中进入答题。另外其在线笔试也很独树一帜,要用到markdown,两个空格换行。一共四道大题,一道智力
2015-04-04 19:19:23 1775
原创 (最优解)阿里笔试题请设计一个算法,在满足质因数仅为3,5,7或其组合的数中,找出第K大的数。比如K=1,2,3时,分别应返回3,5,7。要求算法时间复杂度最优。
//2015年4月1日先贴出网上流传的解答:(非最优的)我们可以用3个队列来维护这些数。第1个队列负责乘以3,第2个队列负责乘以5, 第3个队列负责乘以7。算法描述如下:1. 初始化结果res=1和队列q3,q5,q72. 分别往q3,q5,q7插入1*3,1*5,1*73. 求出三个队列的队头元素中最小的那个x,更新结果res=x4. 如果x在: q3中,那么从
2015-04-01 20:28:46 2281
原创 《数字信号处理》笔记
//2015年1月17日//大二下对着视频自学了这门课,结果后来选专业并没有选电子工程。//今天在大整理的时候偶然翻了出来当时的笔记,那就留作纪念吧。0、推荐一篇文章各种信号变换的关系(FT FS DFS DFT DTFT FFT)u[n]不方便,不是绝对可求和-不能用傅立叶-就用Z变换1、零极点与冲激响应包络特征有关极点:序列保罗变化趋势(极点模)和变
2015-03-30 18:27:51 2142
转载 工作五年的经验分享--谈程序员35岁
当然不是我的经验,今天跟我哥聚了一下,我哥在阿里工作五年的时间,算是个标标准准的程序员,码农。之前有很多关于这个职业的疑问,今天一股脑全部问了一下。下面把这些问题整理一下,可能会有断章取义之处,权当参考,当然,我哥说的也不一定对,不喜勿喷。只希望大家能够正确看待程序员这个职业,不要道听途说,盲目听信。大致有如下几个问题和解答1、程序员35岁的问题2、程序员每天的生活常态,工作加班问题3
2015-03-25 14:15:04 3096
原创 又到一年研究生复试日
//2015年3月19日今天上课的时候老师突然提起了研究生复试,才惊觉竟又到了一年研究生复试日。今年我们学院为了把本学院考研的学生拉进复试,分数线降了30分。可以想象这淘汰率会飙升到什么程度,其他211高校,二本三本的人又会面对怎样的复试。同样的,我们学校考外的同学也会难上加难。更不要说去年保研政策改了,保内保外不分,普通985为名校输送大波研究生。刚刚查了一下,不是特例,研究生复试的
2015-03-19 16:28:10 559
原创 商务智能上课笔记
//2015年2月25日 零、几篇有趣的文章The Information Age in Which You Live: Changing the Face of BusinessIlkka Tuomi: Data is More Than KnowledgeChaim Zins: Conceptual Approaches for Defining Data,informatio
2015-02-27 13:47:56 728
原创 上课笔记--电子市场及电子消费品(五)
//2015年2月26日六、competition in digital market1. digitalization everything难以破坏模仿性complexity破坏专利壁垒2.fast transmission占领剩余市场,破坏不可替代性idea copy3.compete in EC-market量变到质变策略最不缺data
2015-02-27 12:39:57 483
原创 领导力与团队管理上课笔记--下
//2015年2月21日//这类软科学的课往往面临两难。//机场大师之流,口绽莲花,但无科学性。//而学院教授则喜爱理论,而且限于水平讲不清楚,不免空洞无聊。(主要是好老师都去教MBA去了)//很幸运碰到刘文彬老师,讲的课既有学术性,又很能讲透,十分精彩。第四章、团队沟通技能:通过训练获得的能够完成一定任务的“动作系统”。技巧:通过练习 实现的对某些“动
2015-02-24 10:50:56 1065
原创 领导力与团队管理上课笔记--上
//2015年2月21日//这类软科学的课往往面临两难。//机场大师之流,口绽莲花,但无科学性。//而学院教授则喜爱理论,而且限于水平讲不清楚,不免空洞无聊。(主要是好老师都去教MBA去了)//很幸运碰到刘文彬老师,讲的课既有学术性,又很能讲透,十分精彩。第一章:问题的提出如何设计和安排工作如何提高下属的胜任能力如何激励下属努力投入如何评价下属的工作
2015-02-22 13:28:06 1599
原创 电商概论上课笔记-作业四
//2015年2月21日//因为课程冲突,只是偶尔去蹭了几节课//有关互联网、电商的一切,不同于其他学科,在社会上已经被讨论的很热烈了,因此老师上课难度变的很大。1.互联网产品和服务为什么能够免费?2.我们如何管理互联网的充裕经济?3.互联网产品或服务为什么要免费?4.什么是“一分钱效应”?5.在充裕经济中,人们为什么愿意付费?6.Free for Ma
2015-02-22 09:34:24 2053
原创 电商概论上课笔记-作业三
//2015年2月21日//因为课程冲突,只是偶尔去蹭了几节课//有关互联网、电商的一切,不同于其他学科,在社会上已经被讨论的很热烈了,因此老师上课难度变的很大。复习: ( 1) 从提供价值角度上讲,智能手机与 PC 机,平板电脑比较具有什么特别 的价值? ( 2) 移动互联网的主要特点是什么?( 3) 请举例说明移动互联网的“碎片化”特点。 ( 4)
2015-02-22 09:24:07 1861
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人