百度深圳一面2016-3-22

1.介绍一下自己

2.详细介绍项目2,具体到实验数据值

3.项目里爬了几个网站,用了多少数据,为什么

   爬了两个网站,用了一个,因为两个网站很多数据都是相同的,没考虑到不同的数据交集

4.项目1的具体内容

5.自然语言处理的工具,应用场景

  斯坦福、中科院、语言云。做文档摘要,用到相似度。。。做事件抽取,用到隐马尔科夫模型,抽取句子中的主要时间地点等主要元素(下次讲文本和图像相关性研究)

6.了解多线程吗

   不了解

7.java有什么数据结构

   list、arraylist、hashmap、hashtable、hashset

8.hashmap、hashtable区别

  主要是在多线程里面的区别、后者更安全。前者更快,允许null

9.java如何跳出多重循环

  break label

10.知道其他比较先进的机器学习算法吗

  不知道

11.讲一下knn(我觉得他想问kmeans)

转载于:https://www.cnblogs.com/yujianshiguang/p/5306664.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值