今天刚面完,感觉gg。。。
1.IP风控
2.分布式爬虫如何阻断
算法:
问:给定一个区间有序数列 array,计算一个数 x 落入这个数列的具体区间;
input: array = [1.1, 2.3, 3.6, 6.8]
x = 1
return -1
x = 1.2
return 0
x = 3.6
return 2
x >= 6.8
return len (array) - 1
理解:真正区间应该是-1,array,+无穷,属于区间,输出左区间下标。
个人解法:核心是二分查找,根据与当前数的大小比较结果,再跟前后一个数据进行比较。若当前大于x,则看前一个数据是否大于x,若大于x则比较前半部分数组,若小于x,表示落入区间。
【个人见解,应该还能优化,最初版代码如下:】
import sys
import randomarray=[1.1,2.3,3.6,6.8]
start=0
end=len(array)-1
x=0
def search(array,site,x):
if(site>=len(array)): # 面试当场没想到
return 'true',len(array)-1
if(array[site]==x):
return 'true',site
elif(array[site]>x):
if(site>=1 and array[site-1]<x):
return 'true',site-1
elif(site<1):
return 'true',-1
else:
return 'lte',site-1
elif(array[site]<x):
if(site<len(array)-1 and array[site+1]>x): # 面试当场越界判断没想对。
return 'true',site
elif(site==len(array)-1):
return 'true',site
else:
return 'gte',site+1
def find(array,start,end,x):
m_num=int(start+end)/2
tag,site=search(array,m_num,x)
if(tag=='true'):
print x,':',site
elif(tag=='lte'):
find(array,start,site,x)
elif(tag=='gte'):
find(array,site,end,x)
else:
print' error'
print "array:",array
for x in range(5):
xx=random.uniform(0.1,10.0)
find(array,start,end,xx)
感想:
代码确实写得少了。发散思维的问题因紧张啥都想不出来,看来还是面试面的少啊。。。
代码有好思路的大神请指导下呗!