自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

江玉郎

好想出去吃个火锅呀

  • 博客(17)
  • 收藏
  • 关注

原创 selenium 的详细用法

1 按键操作from selenium.webdriver.common.keys import Keysfrom selenium import webdriverimport timedriver = webdriver.Chrome()driver.get('http://www.baidu.com')time.sleep(3)driver.find_element_...

2018-07-31 21:23:52 2892

原创 CSV 与 selenium

一. CSV的常用操作CSV(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看1 写文件import csvrows = [['张三', '21'], ['李四', '31'], ['王五', '41']]# csv文件 在写入的时候,默认每次写入一个会有一个空行作为分割# 使用newline='' 可以将空行去掉with open('tes...

2018-07-30 20:56:05 536

原创 爬虫解析库之xpath、Beautifulsoup的对比使用

1 xpathXPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 (1)基本介绍/ 从根节点选取,// 从所有匹配的节点选取. 当前节点,.. 当前的父节点nodename 选取节点, @ 选取节点的属性通赔符 *, 选取若干路径用 | 分割text() 选取该节点的文本内容//img/@src: 选取所有...

2018-07-28 16:14:48 13100 2

原创 爬虫常用模块:requests ,cookie处理,xlwt(写入excel), lxml

1. requestsimport requestsurl = 'http://www.baidu.com'response =requests.get(url)print(response) # 请求成功print(response.text) # 返回网页的文本内容print(response.reason) # reason 原因 对请求状态的解释...

2018-07-25 20:28:26 1132 1

原创 初识爬虫

1 http的简单介绍1 数据类型比较广泛, json/text/lxml/html/data 2 请求是无状态协议,这次的请求和上次的请求没有任何关系,请求完了以后,服务器和客户端的连接会断掉。socket 保持长连接,请求以后,服务器和客户端的连接不会断掉 3 http有请求报文 和响应报文 请求报文: 1 请求行 : http://ww.apiopen.to...

2018-07-19 22:29:52 201

原创 初识正则

正则表达式可以判断目标字符串是否符合特定的要求。 正则表达式大致的匹配过程是,首先拿出表达式和文本中的内容进行比较,如果每一个字符都能匹配,则匹配成功,一旦有匹配不成功的字符,则匹配失败。 预定义字符集(可以写在字符集[..]中):\d 表示任意的一位数字 digit \d\d 表示任意的两位数字\D 表示非数字 [^\d] \w 表示任意的字母和数字 wo...

2018-07-18 20:48:02 181

原创 对 类 的重新认识

class People(object): count = 0 def __init__(self,name, sex, age): self.name = name self.sex = sex self.age = age def work(self): print('工作时间太短,不开心') zhan...

2018-07-12 23:01:36 150

原创 time和datetime模块的精简

import time# strftime 根据错误提示,里面必须传一个字符串,所以这里传入一个变量,time.localtime()直接传入不行的# 还得有一个格式化的输出, 年月日是对应的小写,时分秒对应的是大写result = time.strftime('%y %m %d %H:%M:%S', time.localtime())print(result)import date...

2018-07-11 20:19:04 141

原创 Python常见错误类型与对str,list,dict的补充

一 常见错误类型1.SyntaxError: ‘return’ outside function return 不能在方法以外使用 解决:将return放在方法体中 2. TypeError: must be str, not int 解决:使用+号拼接的时候,必须使用字符串,或者将数字转换成字符串。 3 SyntaxError: invalid syntax 语法错误 解决办法...

2018-07-10 21:33:09 986

原创 format与对enumerate的补充

一 format的用法str.format() 字符串格式化功能,用{}代替了以前的%format 函数可以接受不限个数参数,位置可以不按顺序print("{} {}".format("hello", "world"))# 输出:hello worldprint("{},{}".format("hello", "world"))# 输出:hello,world# 由以

2018-07-09 20:10:46 207

原创 python 深浅拷贝、列表推倒式与zip的简单用法

一 深浅拷贝浅拷贝只能拷贝最外层,修改内层则原列表和新列表都会变化。 深拷贝是指将原列表完全克隆一份新的。 二 列表推导式# 列表推倒式li = [1,2,3,4,5,6,7,8,9]print([x**2 for x in li])# 输出:[1, 4, 9, 16, 25, 36, 49, 64, 81]print([x**2 for x in li if x...

2018-07-08 20:19:40 181

原创 简单数据库的操作(splite3)

在python中,存储数据的方式有:1,将数据拼接成字符串 2,用list.append 3,tuple 4, dict 以上方式其实是属于同一种方式,即将数据存储到内存当中。数据的存储方式实际在开发中,数据存贮主要有三种形式 1. 将数据存储到内存当中 优点:使用方便,读写速度快, 缺点:.程序关闭的时候,内存会被释放,数据会消失 2. 将数据写入到文件当中 优...

2018-07-06 21:33:36 4726

原创 Python中的继承与super详解

面向对象编程的三大特点:1. 封装:函数2.继承 子类继承父类3.多态:不同对象调用同样方法,出现不同结果 就是多态继承:子类继承父类, 子类也有父类的属性和方法, 子类也可以重写父类的属性和方法, 子类也可以有自己的属性和方法class People(object): def __init__(self, age='77', sex=''): ...

2018-07-06 19:50:02 1445 1

原创 python中类的介绍

1 基本概念1 类(class):用来描述具有相同的属性和方法的对象的集合,它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。 数据成员:类变量或者实例变量,用于处理类及其实例对象的相关数据。 实例变量:定义在方法中的变量,只作用于当前实例的类。 实例化:创建一个类...

2018-07-05 22:51:40 381

原创 python的异常处理与函数简介

一 异常1 概念:异常是一个事件,该事件会在程序执行过程中发生,影响了程序的正常执行。一般情况下,在Python无法正常处理程序时就会发生一个异常。 异常是Python对象,表示一个错误。当Python脚本发生异常时我们需要捕获处理它,否则程序会终止执行。 2 写法: try:….except 将可能出现的错误放在try里面,如果出现错误,代码会根据错误的类型,进入到指定except。...

2018-07-04 22:00:05 548 1

原创 Python的os模块

operation system 操作系统,os模块获取电脑的相关信息,并且有很强大的文件及文件夹操作能力,所以在操作文件或者文件夹的时候首先要引入os模块:import os1 文件的操作文件的读写,打开指定文件,如果文件不存在,则创建一个。 1 写模式f = open('test.txt', 'w',encoding='utf-8')f.write('')f.close(...

2018-07-03 20:23:35 177

原创 Python中time、datetime、calender(日历)模块

一 time模块     首先导入time模块的包 import time1 time_line = time.time()   获取从1970年到现在的秒数2 time1 = time.localtime()  输出:time.struct_time(tm_year=2018, tm_mon=7, tm_mday=2, tm_hour=20, tm_min=16, tm_sec=35, tm_w...

2018-07-02 22:15:08 630 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除