【秋招】招行_数据分析岗_面试题整理

1. kmeans是啥

一种em过程的聚类方法,先固定类中心将每个点划分到最近的类中,然后更新类中心,通过这种迭代的方法进行聚类。

优点是速度较其它的聚类方法较快,缺点是需要预先设定类的数目,并且对初始化的类中心敏感,对异常值敏感。

 

2. left join inner join 区别

左连接是保留所有左表中的值,右表无对应的值会表示为。

内连接是两个表的交集。

 

3. 常用的Python库有哪些

    1)numpy:矩阵运算

    2)sklearn:常用机器学习和数据挖掘工具库

    3)scipy:基于numpy做高效的数学计算,如积分、线性代数、稀疏矩阵等

    4)pandas:将数据用表的形式进行操作

    5)matplotlib:数据可视化工具

    6)seaborn:数据可视化工具

    7)keras/tensorflow/theano:深度学习工具包

    8)NLTK:自然语言处理工具包

    9)beautifulsoap:网页文档解析工具

 

  • 12
    点赞
  • 106
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值