初学者怎么学习Python?Python学习从什么开始?

学习Python,可以先从Python爬虫开始哈

首选,爬虫并不是网上传言的那样,动不动就面向铁窗编程等,正规的爬虫还是相当有市场的!!!

而 Python 作为入门简易的语言,语法也相当简洁,用来入门爬虫再好不过了!

学习Python爬虫需要一定的计划和步骤,以下是一个简单的学习计划:

  1. 学习Python基础知识:首先需要学习Python的基础知识,包括语法、数据类型、函数、模块等。可以通过在线教程或者相关书籍进行学习。

  2. 学习网络编程基础:爬虫的核心是网络编程,需要了解HTTP协议、URL解析、请求库、响应库等相关知识。推荐使用Python内置的requests库进行网络请求。

  3. 学习HTML/CSS解析:爬虫需要解析网页内容,因此需要学习HTML/CSS的相关知识。可以使用Python内置的BeautifulSoup库进行HTML/CSS解析。

  4. 学习数据存储:爬虫获取的数据需要进行存储和管理,可以使用数据库(如MySQL)或者文件(如CSV、JSON)进行存储。

  5. 实践项目:通过实践项目来巩固所学知识,可以选择一些简单的爬虫项目进行练习,例如爬取某个网站的信息并进行分析。

  6. 不断学习和提高:爬虫技术在不断发展变化,需要不断学习和跟进最新的技术和工具,例如Scrapy框架、Selenium等。

除了计划,还需要一定的学习步骤

  • 学习 Python 基础知识:了解 Python 的基本语法、数据类型、流程控制等基础知识。

  • 学习 requests 库:掌握 requests 库的使用,包括发送 HTTP 请求、获取响应内容等。

  • 学习 Beautiful Soup 或 lxml 等库:掌握 Beautiful Soup 或 lxml 等库的使用,包括解析 HTML、提取信息等。

  • 实践项目:通过实践项目来巩固所学知识,例如爬取某个网站的数据、分析网页结构等。

  • 学习数据库和文件操作:了解数据库和文件操作相关知识,以便将爬取的数据保存到本地文件或数据库中。

兵马未动,粮草先行。

我们有了计划和学习步骤之后,就可以着手完成一个个小项目了

一个简单的实战例子

import requests
from bs4 import BeautifulSoup

url = 'https://www.baidu.com'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
title = soup.title.string
print(title)

当然,从总的爬虫流程来看,爬虫主要分为三部分,请求、解析和存储

1、发送请求

使用 Python 的 requests 库发送 HTTP 请求,获取网页内容。

import requests

url = 'https://www.baidu.com'
response = requests.get(url)
html = response.text
print(html)

2、解析 HTML

使用 Beautiful Soup 或 lxml 等库解析 HTML,提取出需要的信息。

from bs4 import BeautifulSoup

html = """
<div>
  <h1>百度一下,你就知道</h1>
  <p>百度一下,全球最大的中文搜索引擎、致力于让网民更便捷地获取信息,找到所求。</p>
</div>
"""
soup = BeautifulSoup(html, 'html.parser')
title = soup.title.string
print(title)

3、存储数据

将提取的数据保存到本地文件或数据库中。

import json

data = {
    'title': '百度一下,你就知道',
    'description': '百度一下,全球最大的中文搜索引擎、致力于让网民更便捷地获取信息,找到所求。',
    'link': 'https://www.baidu.com'
}
with open('data.json', 'w') as f:
    json.dump(data, f)

再来来看一个实战例子

众所周知,B站是用来学习的,下面咱们就通过B站来学习~小美女美照的抓取!

废话不多说,直接开干

网页分析

首先咱们先来分析B站网页,现在B站的搜索框里键入我们的关键词

然后我们点击下一页,通过浏览器的 F12 来查看网络请求

网络请求比较多,不过这都难不倒我们老司机了,咱们一眼就定位到了对应的请求

把上面的请求 URL 复制到 postman 当中,直接 send 一下试试

也是没有问题的,那么下面就是来编写代码了。

对于基础代码,咱们可以直接使用 postman 的提示代码

postman 还是很强大,也深知咱们用户的想法,哈哈哈!

import requests

url = "https://api.bilibili.com/x/web-interface/search/type?page=2&page_size=42&platform=pc&keyword=%E5%B0%8F%E7%BE%8E%E5%A5%B3&qv_id=RdBSJVPTX7sckeQMETPhzRB7aqKqU5rk&ad_resource=5654&source_tag=3&search_type=video&dynamic_offset=30"

payload={}
headers = {}

response = requests.request("GET", url, headers=headers, data=payload)

print(response.text)

编写代码

下面就是改编代码了,我们只需要调整 page 参数,然后再解析响应消息体即可

def fire():
    uri = "https://api.bilibili.com/x/web-interface/search/type?page=current_page&page_size=42&platform=pc&keyword=%E5%B0%8F%E7%BE%8E%E5%A5%B3&qv_id=RdBSJVPTX7sckeQMETPhzRB7aqKqU5rk&ad_resource=5654&source_tag=3&search_type=video&dynamic_offset=30"
    for i in range(1, 25):
        url = uri.replace("current_page", str(i))
        response = requests.request("GET", url, headers=headers, data=payload)
        datas = response.json()
        titles, hrefs = get_hrefs(datas)
        download_pic(titles, hrefs)

通过 for 循环来请求 api 地址,再把拿到的响应数据传递给另外两个函数,分别处理响应数据和保存图片。

再来看看下载图片的代码

    for i in range(len(hrefs)):
        title_t = titles[i].replace('/','').replace(',','').replace('?','')
        title_t = title_t.replace(' ','').replace('|','').replace('。','')
        title_t = title_t.replace('<emclass="keyword">小美女<em>', '')
        title_t = title_t.replace('【', '')
        title_t = title_t.replace('】', '')
        title_t = title_t.replace('*', '')
        filename = '{}{}.jpg'.format(path,title_t)
        with open(filename, 'wb') as f:
            req = requests.get(url=hrefs[i], headers=headers)
            f.write(req.content)
            time.sleep(random.uniform(1.5,3.4))

主要是处理 title 当中的特殊字符

最终效果如下

好了,这就是今天分享的全部内容,喜欢就点个赞吧~


如果你对Python感兴趣,想要学习python,这里给大家分享一份Python全套学习资料,都是我自己学习时整理的,希望可以帮到你,一起加油!

😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓

1️⃣零基础入门

① 学习路线

对于从来没有接触过Python的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

② 路线对应学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~
在这里插入图片描述

③练习题

每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
在这里插入图片描述

Python兼职渠道推荐

学的同时助你创收,每天花1-2小时兼职,轻松稿定生活费.
在这里插入图片描述

2️⃣国内外Python书籍、文档

① 文档和书籍资料

在这里插入图片描述

3️⃣Python工具包+项目源码合集

①Python工具包

学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!
在这里插入图片描述

②Python实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!
在这里插入图片描述

③Python小游戏源码

如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!
在这里插入图片描述

4️⃣Python面试题

我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述

上述所有资料 ⚡️ ,朋友们如果有需要的,可以扫描下方👇👇👇二维码免费领取🆓

### 回答1: Python开发工具有很多种,常用的有 IDLE、PyCharm、VSCode 等。对于初学者来说,建议使用 IDLE 和 VSCode。 IDLE 是 Python 自带的简单 IDE,它很适合初学者练习编写 Python 代码。 VSCode 是微软推出的免费、开源、跨平台的代码编辑器,它具有良好的用户界面和丰富的插件,能满足初学者的大部分需求。 ### 回答2: 初学者学习Python时,可以使用各种不同的开发工具来提高编程效率和方便学习。以下是几个常用的开发工具: 1. Python IDLE:Python自带的集成开发环境,简单易用,适合初学者快速上手。它提供了代码编辑器和交互式解释器,可以直接执行代码并查看结果,帮助理解和调试程序。 2. PyCharm:JetBrains开发的一款强大的Python集成开发环境。它具有丰富的功能和插件,包括代码自动补全、调试器、版本控制等,可以提高编码效率和开发质量。 3. Visual Studio Code:微软提供的轻量级跨平台代码编辑器,支持多种编程语言,包括Python。它具有IntelliSense代码补全、调试器、Git集成等功能,而且可以通过插件扩展更多功能。 4. Jupyter Notebook:一种交互式的编程环境,特别适合用于数据分析和科学计算。它将代码、文档和可视化结果集成在一个网页上,方便展示和分享代码。 无论选择哪个开发工具,初学者应该根据自己的需求和喜好来进行选择。同时,可以多尝试使用不同的工具,探索更适合自己的学习方式和开发体验。 ### 回答3: 初学者学习Python可以使用许多开发工具来进行编码和调试。以下是几个常用的开发工具推荐: 1. PyCharm:PyCharm是一个强大的Python集成开发环境(IDE),拥有丰富的功能和直观的界面。它提供了自动补全、调试、代码分析和版本控制等功能,使得编码过程更加高效和便捷。 2. Jupyter Notebook:Jupyter Notebook是一种基于Web的交互式开发工具,可以将代码、文档和可视化内容集成在一起。初学者可以在Notebook中逐步编写和运行代码,同时还可以添加注释和说明,便于学习和理解。 3. Visual Studio Code:VS Code是一个轻量级的代码编辑器,支持多种编程语言,包括Python。它具有丰富的插件生态系统,可以根据需要自定义和扩展功能。 4. Anaconda:Anaconda是一个数据科学和机器学习开发环境,它提供了Python和许多常用的科学计算库的集成。初学者可以安装Anaconda,获得Python和常用库的一站式解决方案。 不论使用哪种工具,初学者应该根据自己的需求和偏好选择适合自己的开发环境。重要的是熟悉所选工具的基本功能和特性,并且继续学习和掌握Python的语法和编程技巧。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值