京东算法岗面经2019秋招

京东的面试在大酒店里,三面分了三天,一面过了会通知之后二面,
机器学习算法岗

一面面经

1 数据库查询
给定两个数据库表格,A表中有一个字段是id,值为1 2 3 4 5,B表也有一个字段是id,值为1 2 3 用sql语句求A中的4 5

使用 not in ,容易理解,效率低

select distinct A.ID from  A where A.ID not in (select ID from B)

使用 left join…on…

select A.ID from A left join B on A.ID=B.ID where B.ID is null

2 Dataframe
定义
Dataframe是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表,DataFrame的单元格可以存放数值、字符串等,同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位

Import pandas as pd

随机创建一个4*4的DataFrame

df1=pd.DataFrame(np.random.randn(4,4),index=list('ABCD'),columns=list('ABCD'))

第一个参数是存放在DataFrame里的数据,第二个参数index就是之前说的行名,第三个参数columns是之前说的列名(后两个参数可以使用list输入,但是注意,这个list的长度要和DataFrame的大小匹配,不然会报错。当然,这两个参数是可选的,你可以选择不设置;这两个list是可以一样的,但是每行每列的名字在index或columns里要是唯一的)

创建字典
字典的每个key的value代表一列,而key是这一列的列名

dic1={'name':['小明','小红','狗蛋','铁柱'],'age':[17,20,5,40],'gender':['男','女','女','男']} 
df3=pd.DataFrame(dic1)

查看列的数据类型

df3.dtypes

查看DataFrame的头尾
使用head可以查看前几行的数据,默认的是前5行,不过也可以自己设置。
使用tail可以查看后几行的数据,默认也是5行,参数可以自己设置

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值