※槑囧槑※-CSDN博客

原创复习笔记之数据类型和文件操作

数据类型一般包括：列表，元组，集合，字典，字符串列表：增加操作：1、追加 names.append()2、插入及列表嵌套 names.insert(索引位置对应的值,插入对象（可以使列表））3、合并 names.extend()删除操作1. 直接删除del: del names[索引值]2. 删除指定元素并返回删除值names.pop(索引值)3.清空names.clear()修改操作names[索引值] = "修改内容"查操作>>>name

2020-12-07 16:15:25 159

原创 [复习二]网页基础部分

一、网页组成网页可以分文三部分：HTML，CSS和JavaScript1.HTML（Hyper Text Markup Language超文本标记语言）HTML是网页的基础架构，不同类型的文字通过不同类型的标签来表示，各种标签不同的排列和嵌套形成网页的框架。img图片标签，video视频标签，p段落标签等，div为布局标签将其他标签嵌套组合2.CSS（Cascading Style Sheets层叠样式表）CSS目前唯一的网页页面排版样式标准...

2020-11-13 21:50:00 97

原创练习-中国大学排名爬取

#正则表达式学习正则表达式1、通用的字符串表达框架2、简洁表达一组字符串的表达式3、针对字符串表达“简洁”和“特征”思想的工具4、判断某个字符串的属性归属正则表达式主要用于字符串匹配正则表达式的常用操作符操作符说明实例.表示任何单个字符[]字符集，对单个字符给出取值范围[abc]表示a或b或c,[a-z]表示a到z的其中一个字符我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮

2020-11-13 21:48:31 87

原创 [复习一]爬虫基础篇

一、HTTP基本原理1.URL统一资源定位符2.hypertext超文本，网页源代码都是超文本，网页是由超文本解析而成的3.HTTPS是由HTTP下加入SSL层，即通过它传输的内容都是经过SSL加密的，是HTTP的安全版4.Chrome浏览器network面板各列含义第一列 Name：请求的名称，一般会将 URL 的最后一部分内容当作名称。第二列 Status：响应的状态码，这里显示为200，代表响应是正常的。通过状态码，我们可以判断发送了请求之后是否得到了正常的响应。第三列 Type

2020-09-07 14:52:17 109

原创代理使用学习

urllibfrom urllib.error import URLErrorfrom urllib.request import ProxyHandler,build_openerproxy = '123.207.43.128:1080'#proxy = 'username:password@代理IP',需要认证的代理时用这种方法设置proxy_handler = ProxyHandler({ 'http':'http://' + proxy, 'https':'https:/

2020-07-09 18:24:25 2244

原创 selenium爬商品淘宝信息

from selenium import webdriverfrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWaitfr

2020-07-08 11:26:52 109

原创 selenium学习笔记

街拍图片爬取import requestsfrom urllib.parse import urlencodeimport osfrom hashlib import md5import refrom multiprocessing import Pooldef getHTTPText(offset): headers = { 'cookie':'SLARDAR_WEB_ID=3e5af338-2cb4-49a1-ab0d-b3b0ea8637b9; ttcid=5e

2020-07-06 16:33:22 144

原创 Python学习笔记

Python学习笔记（一）HTTP基本原理1. HTTP请求过程name:请求名称status:响应状态码type:请求的文档类型Initator:请求源Size:从服务器下载的文件和请求资源的大小Time：发起请求到获取响应的总时间Waterfall：可视化瀑布流2. 请求方法，网址及请求头方法：get：获取head：获取报头post：提交表单put：取代传送数据的指定文档中的内容delete：删除connect：服务器代替客户端访问其他网页options: 允许客户端

2020-06-29 19:56:24 127

weixin_42288922的博客