学数据挖掘要学linux吗,2013百度校园招聘-机器学习和数据挖掘工程师-笔试题

一、简答题(30分)

1、简述数据库操作的步骤(10分)

2、TCP/IP的四层结构(10分)

3、什么是MVC结构,简要介绍各层结构的作用(10分)

二、算法与程序设计(45分)

1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打印所有可能的密码组合(可用伪代码、C、C++、Java实现)(15分)

2、实现字符串反转函数(15分)

3、百度凤巢系统,广告客户购买一系列关键词,数据结构如下:(15分)

User1 手机 智能手机 iphone 台式机 …

User2 手机 iphone 笔记本电脑 三星手机 …

User3 htc 平板电脑 手机 …

(1)根据以上数据结构对关键词进行KMeans聚类,请列出关键词的向量表示、距离公式和KMeans算法的整体步骤

(2)计算给定关键词与客户关键词的文字相关性,请列出关键词与客户的表达符号和计算公式

三、系统设计题(25分)

一维数据的拟合,给定数据集{xi,yi}(i=1,…,n),xi是训练数据,yi是对应的预期值。拟使用线性、二次、高次等函数进行拟合

线性:f(x)=ax+b

二次:f(x)=ax^2+bx+c

三次:f(x)=ax^3+bx^2+cx+d

(1)请依次列出线性、二次、三次拟合的误差函数表达式(2分)

(2)按照梯度下降法进行拟合,请给出具体的推导过程。(7分)

(3)下图给出了线性、二次和七次拟合的效果图。请说明进行数据拟合时,需要考虑哪些问题。在本例中,你选择哪种拟合函数。(8分)

(4)给出实验方案(8分)

相关阅读:

0b1331709591d260c1c78e86d0c51c18.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值