对于爬虫程序来说,因为csdn审查较为严格(死板),我们可以尝试以下方式。
1.将代码内容,一些比较**(涉及隐私的部分),用照片代替。
如:
def print_data(self):
time.sleep(2)
temp = self.driver.find_elements(by=By.XPATH, value='/html/body/div[1]/div/div[2]/div/div/div[4]/ul/li')
# 对页面信息进行整理,保存照片url
data = []
for item in temp:
data_dict = {}
data_dict['title'] = item.find_element(by=By.XPATH, value='./a[2]').text
data_dict['host_name'] = item.find_element(by=By.XPATH, value='./span/span[1]/i').text
data_dict['list'] = item.find_element(by=By.XPATH, value='./span/span[2]/a').text
data_dict['heat'] = item.find_element(by=By.XPATH, value='./span/span[3]/i[2]').text
data_dict['img_url'] = item.find_element(by=By.XPATH, value='./a[1]/img[1]').get_attribute('src')
data.append(data_dict)
return data
当然如果审核系统比较给力,那就得尝试第二种方法了。
2.分开发表,一般篇幅,分为上下,长篇可分为123等多个部分进行发表,这样一般会比较快。
注意:个人推荐两种方式都用,最保险。
以上是我自己的使用方法,希望能把到大家。