爬取网站:http://www.xuexiaodaquan.com/ 学校大全
技术路线: requests + BeautifulSoup
貌似这个网站反爬虫还挺牛的,经常就返回自动跳入的139网站,随意得换着IP试试
需要准备中国市名称拼音存在EXCEL中,显示是第一列:市民;第二列:拼音;到市级就可以。
需要挖掘哪些城市就放哪些,如果挖全国,就要放所有市名。
如:
输出是一个EXCEL&#
爬取网站:http://www.xuexiaodaquan.com/ 学校大全
技术路线: requests + BeautifulSoup
貌似这个网站反爬虫还挺牛的,经常就返回自动跳入的139网站,随意得换着IP试试
需要准备中国市名称拼音存在EXCEL中,显示是第一列:市民;第二列:拼音;到市级就可以。
需要挖掘哪些城市就放哪些,如果挖全国,就要放所有市名。
如:
输出是一个EXCEL&#