本想登陆并获取我发布的帖子内容并把他做成表格显示出来
结果发现每个字符后面都带有逗号,也就是分隔符,现在就是
去掉逗号并将内容保存在一个单元格内
session = requests.Session()
response = session.get('http://www.51hei.com/bbs/forum.php?mod=guide&view=my', headers=headers)
print(response.status_code)
# print(response.text)
doc = pq(response.text)
a = doc('.common a')
for item in a.items():
txt = pq(item).text()
# print(txt)
with open('data.csv', 'a', encoding='utf-8') as csvfile:
writer = csv.writer(csvfile)
writer.writerows(txt)
效果如下
writer.writerows(txt)
变为
writer.writerow(txt)
现在问题是如何去掉逗号,将需要的内容连贯起来
解决办法来了:
第一种
writer.writerow(txt)
变为
writer.writerow([txt])
就可以得到结果如下
第二钟:
# 这个能把每个字母占用一格变成一横排的单元格数据变成占用一个单元格,但是会在每个字符中出现空格。
writer = csv.writer(csvfile, delimiter=' ')
#所以使用 split 删除空格
writer.writerow(txt.split(' '))
结果如上