1、数仓ETL过程中,数据探索阶段主要包括哪些内容?
2、数据仓库中为什么要做拉链表?什么样的场景比较适合用拉链表?举例说明拉链表的实现过程?
3、用Python编写一个函数,获得当前目录下的所有文件名(包含子目录中的子文件,假设当前用户有所有文件的访问权限)
N_K = map(int,input.split(’ '))
number = list(str(input()))
N,K = N_K[0],N_K[1]
_number = set(number)
expense = 1000000000
def get_min(i,number,n,store,ex):
if number.count(n) == K:
store.append([ex,number])
for j in range(i,len(number)):
expense = ex
if number[j] != n:
expense += abs(number[j]-n)
number[j] = n
get_min(i+1,number,n,store,expense)
return store
for _ in number:
store = get_min(0,number,,[],0)
if store[0][0] < expense:
_store = store
res = sorted(_store,key=lambda x:x[2])
return res[0][0] + ‘\n’ + res[0][1]