- 博客(34)
- 收藏
- 关注
原创 xpath的相关知识--51job获取的数据写入表格
第一部分一.网页的解析方式 1.xpath(简单) 2.正则(最难) 3.css(需要懂网页的css) 4.bs4(比xpath难一点点)二.xpath的基本方法 1.环境准备: 火狐浏览器(49.0以下) firebug firepath 2.基本操作 // 元素标签名 例如://div,查...
2018-02-28 20:17:08 809 1
原创 将获取的电影数据写入网页中--css
第一部分1.网页模板:<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>电影信息网</title> <link rel="stylesheet" href=
2018-02-28 20:02:06 403
原创 session自动登录抽屉网(自动携带cookie)
1.获取useragent数据from fake_useragent import UserAgentagent = UserAgent()2. 如果通过session发请求,会自动携带cookie session简化了cookie的作用session = requests.session()3.完整代码# -*- coding:utf-8 -*-import requestsfrom fak...
2018-02-28 19:44:51 430
原创 cookie用法--抽屉网的自动登录(cookie是通过代码自动获取的)
1.引用自己定义一个类from random_agent import RandomAgent2. 引用系统的包from fake_useragent import UserAgent3.创建对象agent = UserAgent()4. 不要重复造轮子 pip search 工具包名字 例如:pip search UserAgent" pip install fake_useragent5...
2018-02-28 19:40:06 927
原创 cookie用法
1.Cookie基础概念 Cookie:小蛋糕,饼干 Cookie特点: 1.用于存储用户的某些信息(不包含隐私信息) 2.只用于存储少量数据 3.cookie是个文件,位于浏览器 4.cookie有生命周期,一旦网页退出,cookie就失效了2.例子:Cookie登录 抽屉网url = "http://dig.chouti.c...
2018-02-27 19:00:36 524
原创 基于requests的歌曲查询--两种写入文件的方法
代码实现功能: 将输入的要查询的歌曲名字存入name.txt文件中 判断输入的名字是否在name.txt文件中,来确定是否可以写入文档 将搜索到的歌曲存入song.txt文件中1.代码中需要引入的包import requestsimport json# 操作文件的包import os 2.判断输入的名字是否为空或者换...
2018-02-27 18:21:42 425
原创 常见的requests的应用--GET/POST/PUT/DELETE/OPTION/HEAD
1. 下面四个都可以用于发送网页请求# import urllib# import urllib2# import urllib3# import httpimport requests2..使用requests发送get/post/put/delete等请求 GTT参数 URL?参数1=内容1&参数2=内容2... 注意:参数部分不能出现空格或者特殊字符3.例如:response ...
2018-02-27 18:13:12 1839
原创 概念总结--常见的状态码
1.常用状态码 1xx 2xx:一般表示成功 3xx:一般表示重定向 4xx:一般表示客户端错误 5xx:一般表示服务器错误 200 表示成功 404 服务器无法找到被请求页面 403 服务器拒绝访问权限不够 Forbidden 500 请求未完成,服务器遇到不可预知的情况 302 2.常用的请求方法 GET/POST ...
2018-02-27 18:07:15 364
原创 通过修改请求头的User-Agent发送请求
1. 抓包工具 Fiddler Charles:Charles可以监控浏览器发送和接收的所有数据2.get的参数 参数1:url,填网址 参数2:params,网址后需要添加的参数 参数3:**kwargs ,不定长键值对参数,一般 key=value headers={} cookies={} 或者 CookieJar timeout=小数或者元组 3....
2018-02-27 18:05:15 14429
原创 号码归属地查询
# -*- coding:utf-8 -*-# 手机号归属地查询import requestsimport json# phone_number = input('请输入要查询的手机号:')phone = "13512345678"url = "https://www.baifubao.com/callback?cmd=1059&callback=phone&phone...
2018-02-26 19:10:11 376
原创 带框架--网页设计
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>Title</title> <link rel="stylesheet" href="boots
2018-02-26 19:08:42 516
原创 html一些常用的标签
完整代码:<html> <head> <meta charset="utf-8"> <title>网页标题</title> <!--<link rel="stylesheet" href="">-->
2018-02-26 19:06:14 145
原创 电影下载
# -*- coding:utf-8 -*-import requestsfrom lxml import etreeurl = "https://www.dy2018.com/html/gndy/dyzz/index.html"response = requests.get(url)# 统一网页的编码格式# 下面这句话最好加上# response.encoding = response....
2018-02-26 19:00:28 1447
原创 图片下载
# -*- coding:utf-8 -*-# 获取网页源码/下载网页/图片/视频/音频...import requests# 解析网页相关数据from lxml import etree# 操作文件夹/路径import os# 1.下载网页源码# 2.解析网页源码(难度比较大)# 3.存储相关数据url = "http://www.ivsky.com/tupian/ziranfengguang/...
2018-02-26 18:55:02 226
原创 获取网页--爬取网页的图片存放在不同的文件夹中--下载图片--requests/lxml(etree)/os
# -*- coding:utf-8 -*-import requestsfrom lxml import etreeimport os第一部分:爬取网页的图片存放在不同的文件夹中1.获取网页,通过requests工具包实现(集成环境自带) 如果没有就手动安装 pip install requestsurl = "http://www.ivsky.com/tupian/ziranfen...
2018-02-24 17:51:37 864
原创 手机销售系统--数据库版--打包
# -*- coding:utf-8 -*-# 函数与函数之间空两行,class类中空一行import sqlite3# 1.轻量级数据库 2.跨平台 3.关系型数据库 4.python内置模块phone_list = []1.查询函数def query_phone(): results = cursor.execute('select * from phone') state...
2018-02-24 17:37:09 1091
原创 配置python3.6的环境--文件打包
1.卸载原来安装的python2和3版本的python,根据以下教程下载安装新的python环境网址为:https://864071694.gitbooks.io/pythonfullstackbook/content/di-er-82823a-python-huan-jing-an-zhuang/windowsxi-tong.html注意:不可以修改文件anaconda3的名字,否则会出现错误2...
2018-02-24 15:44:14 202
原创 学生信息存储到数据库中
# -*- coding:utf-8 -*-import sqlite3#模块类class Student(object): connect = sqlite3.connect('datebase.db') cursor = connect.cursor() sql = 'create table Stu(num integer primary key,nam
2018-02-05 20:19:43 3616
原创 数据库--查询
# -*- coding:utf-8 -*-import sqlite3# 1.连接数据库文件connect = sqlite3.connect('datebase.db')# 2.获取游标cursor = connect.cursor()# 3.准备sql语句# *表示查询所有字段,可以查询指定字段数据# N%查找以N开头的 %N查找以N结尾的 %N% 包含N的
2018-02-05 20:18:38 290
原创 数据库--sqlite
# -*- coding:utf-8 -*-1.下载SQLite sqlite3是python中内置的一个轻量级数据库 数据库用来保存大量的、格式统一的数据,比如name,age,phone,id,在数据库中一般会有多张表,将数据保存到表中import sqlite3 数据库中存放有多张表,在表中存储的是数据 2 .具体代码实现步骤:# a.连接到数据库文件# connec
2018-02-05 20:15:23 149
原创 时间,日期--datetime--time
# -*- coding:utf-8 -*-1. 时间 日期 datetime 日期import datetimetoday = datetime.datetime.now()print(today)2. from 模块 import 类\函数 从datetime模块中 引入datetime这个类,这类中有一些函数可以使用from datetime import dateti
2018-02-05 19:52:13 575
原创 内存--循环引用的处理
# -*- coding:utf-8 -*-1.初始化一个删除的函数# import sysclass People(object): def __del__(self): print(self) print('People对象被移除了')2,调用执行p1 = People()# print(sys.getrefcount(p1)
2018-02-02 20:50:06 610
原创 python的内存管理--自动管理
# -*- coding:utf-8 -*-1. python中自动管理内存的 自动管理内存编程语言,例如:object-c python 手动管理内存编程语言 例如: c 2. python中的内存管理采用的 ‘引用计数’的方式,如果一个对象的引用计数为0,该对象占用的内存会被python解释器清空,对象也会消失,如果一个对象的引用计数超过0,这个对象会一直存放在内
2018-02-02 20:46:19 2167
原创 @property-4
# -*- coding:utf-8 -*-1.代码的实现功能: 给name属性赋值,值必须是字符串,否则抛出异常 给age属性赋值,值必须是整数,否则抛出异常 2.在初始化函数中 执行@name.setter装饰的name函数,在函数中给_name属性赋值 self.name 是一个函数,执行@name.setter装饰
2018-02-02 20:21:08 120
原创 @property-3
# -*- coding:utf-8 -*-1.对@property-1好@property-2的总结class People(object): def __init__(self, name, age): self.name = name self.age = age # 私有属性 self.__number
2018-02-02 19:31:54 148
原创 @property装饰器-2
# -*- coding:utf-8 -*-1.添加了判断是否是成年的函数# 执行age函数,给_age属性赋值 class Women(object): def __init__(self, age): # 执行age函数,给_age属性赋值 self.age = age2.把value的值赋值给一个新的属性 self,_age
2018-02-02 19:22:21 137
原创 @property装饰器-1
# -*- coding:utf-8 -*-一1.@property 负责装饰一个对象函数,让其生成对应的setter和getter函数,调用的时候,直接可以使用对象名,函数名这种类似于属性的调用方式来执行函数class People(object): def __init__(self): self.__age = 20 self.name
2018-02-02 19:13:30 135
原创 复习2.1内容--类的继承--类函数--静态函数
# -*- coding:utf-8 -*-1. 类的继承''' 1.子类继承自父类,子类拥有父类的所有属性和函数 2.子类继承自父类,子类可以拥有自己独有的属性和函数,父类不可以使用子类独有的属性和函数 3.子类继承父类,子类可以重写父类的函数 3.1 完全重写,在子类中重新定义一个和父类函数名称一样的函数,但是这个函数执行的功能和父类中的函数
2018-02-02 18:05:22 147
原创 __slots__的作用
_-slots_de 作用:# 限制只有定义的这些属性才可以动态添加# 以元组的方式定义能给对象添加的属性,除此之外的属性不能添加,对动态添加的属性可以做出一些限制完整代码:# -*- coding:utf-8 -*-class People(object): # 限制只有定义的这些属性才可以动态添加 # 以元组的方式定义能给对象添加的属性,除此之外的属
2018-02-01 21:47:08 165
原创 类--写入一行或多行数据--日期格式化工具类
# -*- coding:utf-8 -*-1,。判断某个对象是否是某种类型 rs = isinstance(str_list, list) # print(rs)class FileManager(object): # 保存文件的名称 filename = 'student.txt' # 写一个写入数据的接口 @clas
2018-02-01 21:38:18 160
原创 类函数 和 静态函数
# -*- coding:utf-8 -*-1. 类函数 和 静态函数调用父类的初始化函数 super(People, self).__init__()class People(object): #类变量 total = 0 def __init__(self, name, age): # 调用父类的初
2018-02-01 21:01:38 556
原创 类--继承--完全重写--部分重写
# -*- coding:utf-8 -*-1.基本知识面向对象编程的三个特点:封装、继承、多态函数是封装代码的基本单位,类和对象的封装是属于更高级的封装方式,在类中经常会声明一些对象属性,用来保存数据的,在类中声明的函数,是用来操作数据的,不同的功能可以封装不同的函数''' 继承特点: 1.子类继承父类,子类拥有父类的所有属性和函数 2.子类
2018-02-01 20:55:48 423
原创 类--保存数据(列表)--类变量
# -*- coding:utf-8 -*-1.声明一个类型class People(object): #类变量 file_name = 'student.txt' def __init__(self, name ,school): self.name = name self.school = school #属性对
2018-02-01 20:48:45 556
原创 复习1.31.内容--类--类变量--类的私有属性的获取和修改--异常捕获
# -*- coding:utf-8 -*-1.什么叫做类? 具有相同属性和行为方法的事物的抽象的集合 人类的属性:身高、体重.... 人类的行为:吃喝拉撒睡 什么叫做对象? 类的实例化2.基本知识: 类变量 私有属性 init初始化函数,不需要手动调用,在创建该类对象的时候,会自动调用这个函数,可以通过初始化函数,给对象添加属性
2018-02-01 20:45:26 191
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人