python培训笔记
Lkeys
一个普通本科的大学生
展开
-
python爬虫数据解析之bs4
步骤:1、导入bs4库from bs4 import BeautifulSoup2、获取soup对象#html为你获取的网页源代码,将html转化为特定的格式lxml#为后面提取信息做准备soup=BeautifulSoup(html,'lxml')3、利用方法选择器解析find_all()##查询所有符合条件的节点信息,例如soup.find_all(name=“h4”),查询所有节点名称为h4的节点信息for ul in soup.find_all(name="ul"):#寻找名为原创 2020-07-15 23:19:11 · 433 阅读 · 0 评论 -
python中如何将数据保存到数据库(mysql)
步骤:1、导入pymysql库import pymysql2、连接数据库#连接数据库conn=pymysql.connect( host="127.0.0.1", port=3306,#端口号 user="root",#数据库用户 password="241070",#数据库密码 database="demo"#要连接的数据库名称)3、建立游标,用于数据库插入cursor=conn.cursor()4、创建数据库语句并往数据库插入数据sql_原创 2020-07-15 22:45:18 · 12992 阅读 · 0 评论 -
python爬虫数据数据解析之正则表达式
1、利用正则表达式解析页面信息步骤(1)导入re库import re(2)利用最常用的方法compile()和findall()结合获取数据html = res.textp=re.compile('<div class="movie-item-info">.*?<a href="/films/.*?title="(.*?)".*?<p class="star">\s+(.*?)\s+</p>.*?<p class="releasetime">原创 2020-07-15 22:37:41 · 353 阅读 · 0 评论 -
python爬虫步骤解析
一、爬虫概念(1)概念:网络蜘蛛、网络机器人、抓取网络数据的程序用python程序去模拟人访问网站,模拟的 越像越好获取数据的目的:通过有效的大量数据去分析市场走势(2)企业获取数据的方式1)公司自有数据2)第三方平台购买3)爬虫爬取数据(3)python爬虫的优势请求模块,解析模块丰富成熟,具有强大的scrapy框架1)java:代码笨重,代码量很大2)c/c++:虽然效率很高,但是代码成型很慢3)php:对多线程,异步支持不好(4)访问网页的流程(http和https的区别:h原创 2020-07-15 22:13:07 · 429 阅读 · 0 评论 -
python中面向对象的理解
1、面向对象类的定义:class 类名(继承列表):“”“文档说明书”""类的构造函数实例方法(类内的函数)类变量类方法静态方法example:class car(object):pass2、类的实例化:example: car=car()#实例化car类类每次实例化生成的都是不同的对象3、实例的属性(1)在类生产出实例后给实例添加属性:class car():def adf(self):print(‘我是a’)car=car()car.color=“红色”(2)原创 2020-07-15 21:52:27 · 313 阅读 · 0 评论