使用spyder编写爬虫_CodingPark编程公园

本文通过Anaconda的Spyder IDE详细介绍了如何编写爬虫,包括准备工作、注意事项及完整代码示例,帮助读者掌握爬虫开发的基本步骤和常见问题解决方法。
摘要由CSDN通过智能技术生成

文章介绍

本文主要讲述了利用Anaconda spyder进行爬虫编写
在这里插入图片描述

使用spyder编写爬虫

在这里插入图片描述

准备工作

这次我们使用 heartbeat -> cid

在这里插入图片描述

在这里插入图片描述

我们拿到cid之后就可以去检查一下是否可以获取弹幕了。获取的固定xml格式是:

 https://comment.bilibili.com/视频的cid.xml

例如在这里我们的页面就是:

'https://comment.bilibili.com/94198756.xml'

我们把这个链接用网页的方式打开,就能看到如下内容:
在这里插入图片描述
这样我们就确定可以爬取了

需要注意的坑

1
每行脚本按 command + 回车 —> 执行
⚠️每行都需执行一次
在这里插入图片描述

2
可以不写print语句
而选取所要print的部分进行 ** command + 回车 —> 执行** 输出
在这里插入图片描述

3
终端输出信息不完全
在这里插入图片描述

pd.set_option(‘display.max_rows’,n)将看不到的行显示完整

import numpy as np
import pandas as pd
pd.set_option('display.max_columns',10)
pd.set_option('display.max_rows',100)			#设置最大可见100行
df=pd.DataFrame(np.random.rand(100,10))
df.head(100)
	

pd.set_option(‘display.max_columns’,n)将看不到的列显示完整

import numpy as np
import pandas as pd
pd.set_option('display.max_columns',10)			 #给最大列设置为10列
df=pd.DataFrame(np.random.rand(2,10))
df.head()

完整代码(基础功能)

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Sat May  9 17:34:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TEAM-AG

编程公园:输出是最好的学习方式

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值