携程2019.10.14机器学习算法岗——自然语言处理方向线上笔试

选择题

一些AI基础理论,记得几道题:
随机森林和XGBoost的区别
数据库系统的特点
过拟合解决方法(Dropout,剪枝,正则化,早停)

编程题

1.字符串编辑距离

对于两个字符串,利用字符操作,把字符串A转换成字符串B所需要的最少操作数。其中,字符操作包括:
1.删除一个字符
2.插入一个字符
3.修改一个字符
示例
输入:携程欢迎您欢迎你程里人
输出:6

def strdist(str1, str2):

    t = [[0 for x in range(len(str2)+1)] for x in range(len(str1)+1)]
    for i in range(len(str1)+1):
        for j in range(len(str2)+1):
            if i == 0:
                t[i][j] = j
            elif j == 0:
                t[i][j] = i
            elif str1[i-1] == str2[j-1]:
                t[i][j] = t[i-1][j-1]
            else:
                t[i][j] = 1 + min(t[i][j-1], t[i-1][j], t[i-1][j-1])
    return t[len(str1)][len(str2)]
# str1 = '携程欢迎您'
# str2 = '欢迎你程里人'
str_ = list(map(str, input().split('<ctrip>')))
str1 = str_[0]
str2 = str_[1]
print(strdist(str1, str2))

2.螺旋数组

第一行输入m(数组行数)和n(数组列数),空格隔开,接下来每一行输入n个数字用空格隔开;输出以顺时针顺序的螺旋数组。
示例
输入:
3 3
1 2 3
4 5 6
7 8 9
输出:
1,2,3,6,9,8,7,4,5

3.给定一个词典W(保证词典的数据不重复),输入一句文本S,使用词典进行分词。如果文本能够根据词典进行分词,则输出YES,否则输出NO

示例
输入:
我,要,爱,携程,携程旅行网,旅行网,旅行
我爱携程旅行网
输出:
YES

没想到怎么自己实现,我用了jieba,不知道可不可以。

import jieba
w = list(input().split(','))
s = input()
# print(w, s)
seq_list=list(jieba.cut(s, cut_all=False))
# print(seq_list)
count = []
for i in seq_list:
    # print(i)
    if i in w:
        count.append(1)
    else:
        count.append(0)
if 0 in count:
    print('NO')
else:
    print('YES')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Growing_Snake

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值