先上图,如果不是需要的就可以不用往下看了。
首先是什么样的层级结构,如下图,有些长,不完整,完整的图太长上传不了,打开链接https://www.genome.jp/kegg/pathway.html查看。
转化后的表格
完整代码
import reimport lxmlimport requestsfrom bs4 import BeautifulSoupfrom fake_useragent import UserAgentclass kegg(object): def __init__(self): self.url = 'https://www.genome.jp/kegg/pathway.html' ua = UserAgent(verify_ssl=False) self.headers = {
'User-Agent': ua.random} def get_html(self, url): response = req