**
Datawhale 第一次打卡:
在代码运行的时候不懂的点:
1. enumerate:
Enumerate is a built-in function of Python.
my_list = ['apple', 'banana', 'grapes', 'pear']
for c, value in enumerate(my_list, 1):
print(c, value)
# Output:# 1 apple# 2 banana# 3 grapes
#类似于对表进行排列,方便读取
2. 列表推导式嵌套循环:
unique_categories = set([i for l in [x.split(' ') for x in data["categories"]]
for i in l])
#用x在categories 现进行循环,然后split
#首先是temp = [x.split(' ') for x in data["categories"]]就是对于每一个data["categories"]中的元素按照空格进行split,这对应一个paper的多个类别,是一个list[list[]],外层的list是每一个paper,内层是每一个paper的类别。
#然后 for l in temp 是将每一个paper分开
#for i in l 是对于一个分离得到一个paper的多个种类再使用set去除重复的str
(感觉看懂了 却不会运用)
list1 = []
for l in [x.split(' ') for x in data['categories']]:
for i in l:
list1.append(i)
list1
(此为复杂化描写)
3. 正则操作:
re.
phone = "2000-4923-3792 # this is number"
num = re.sub(r'('\D')," ",phone)
#可以去除符号
https://tool.oschina.net/regex/
检测正则
最后成果
**