爬虫学习5(正式爬虫学习)

import requests # y引用requests库

headers = {
    "User_Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.76"
}  # 定义请求头,伪装成浏览器 内容在网页中右键检查——》网络——》寻找User_Agent
response = requests.get("https://weibo.com/?sudaref=limestart.cn", headers)
# print(response) # 返回服务器请求内容
# print(response.status_code) # 返回状态码。200表示访问成功,404表示失败
# 上述代码可以使用库中的ok属性

if response.ok:
    # 获取响应体内容
    print(response.text)  # 获取网址的文字属性
else:
    print("响应失败")

1.网页结构

<!DOCTYPE html>  #声明此为一个html格式
<html lang="en">   #起始标签,主要内容全在里面
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
</head>
<body>  # 文档的主体内容
    <h1> # 表示一级标题
    </h1>
    <p> # 表示文本段落   </p>
    <img src="图片路径"   #非闭合标签,插入图片
    <a href="https://blog.csdn.net/weixin_44122062/article/details/105121204" target="#指定链接打开方式"> 我的主页</a>  # 添加链接
    <div></div> #块状
    <span></span>  #内联元素,不会独占一块
    # 两个都是容器
    <ol>
        <li></li> # 每项元素都要用此标签
    </ol>  # 列表标签,有序列表
    <ul></ul> # 无序列表
    <table>
        <thead></thead> # 表示表格头部
        <tbody>
            <tr>
                <td></td> # 表示一项项数据
            </tr>  # 定义表格行
        </tbody> # 表示表格主体
    </table> # 定义表格标签
</body>
</html>  # 闭合标签
# class 属性

以下是一个网页示例

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>这是一个标题</title>
</head>
<body>
    <div style="background-color: blue;">
        <h1>这是一级标题</h1>
        <h2>这是二级标题</h2>
        <h6>这是一个六级标题</h6>
    </div>
    <p>这是文<br>本段落</p>   <!-- <br>是换行标签-->
    <p><b>社会主义核心价值观</b></p>  <!-- <b> 加粗字体 -->
    <p><i>自由平等公正法治</i></p>   <!-- <i>斜体 -->
    <p><u>爱国敬业诚信友善</u></p>  <!-- <u>加下划线 -->
    <img src="D:\Administrator\Pictures\拾光\拾光_Wallpaper Abyss_1320312.jpg" width="500px">
    <a href="https://weibo.com/?sudaref=limestart.cn" target="_blank">微博,分享美好生活</a>

    <ol>
        <li>我是第一项 </li>
        <li>我是第二项</li>
    </ol>
    <ul>
        <li>我是第一</li>
        <li>我是第二</li>
    </ul>

    <table border="1">  <!--border 设置边框-->
        <thead>
            <tr>  <!-- 行-->
                <td>count</td>  <!--列-->
                <td>cound2</td>
                <td>count3</td>
            </tr>
        </thead>
        <tbody>
            <tr>
                <td>1</td>
                <td>2</td>
                <td>3</td>
            </tr>
            <tr>
                <td>1</td>
                <td>2</td>
                <td>3</td>
            </tr>
            <tr>
                <td>4</td>
                <td>5</td>
                <td>6</td>
            </tr>
        </tbody>
    </table>
</body>   
</html>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值