![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
千锋
文章平均质量分 64
z.354
这个作者很懒,什么都没留下…
展开
-
day5openpyxl和pyecharts
01房天下 import requests from lxml import etree from pyquery import PyQuery import csv # 字符串.strip() - 将字符串前面和后面的空白去掉 def an_data(data: str): # html = etree.HTML(data) # li_list = html.xpath('//div[@id="newhouse_loupai_list"]/ul/li') # print(l原创 2021-04-06 18:00:40 · 236 阅读 · 1 评论 -
day3bs4AndPyquery
1. bs4AndPyquery: 01代理的使用 import requests import time from re import findall import csv from selenium.webdriver import Chrome from selenium import webdriver # 获取代理ip def get_ips(): url = 'http://piping.mogumiao.com/proxy/api/get_ip_bs?appKey=6226c130原创 2021-03-31 19:20:48 · 86 阅读 · 0 评论 -
day2Selenium
css(层叠样式表\样式表)是用来设计标签的样式和布局 1.css代码写在哪儿 内联样式表:写在标签的style属性中 内部样式表:写在style标签中 2.css代码怎么写 选择器{ css属性1=值1; css属性2=值2; } <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title></title>原创 2021-03-30 19:25:44 · 73 阅读 · 0 评论 -
day1requests
总结 01认识爬虫 爬虫基本步骤 爬虫就是通过代码取获取别人网站上的数据 1)获取网页数据 - requests和自动化测试工具(Selenium) 2)解析数据 - 正则表达式、css选择器、xpath 3)存储数据 - 表格文件(csv、openpyxl)和数据库文件 获取网页数据 认识网站 一个网页由三个部分组成:html、css、javascript(js) html - 决定网页中有什么 css - 决定网页中内容的样式(长什么样) js -原创 2021-03-29 20:46:05 · 105 阅读 · 0 评论 -
2021.3.25 面向对象基础
总结 01 review # 1. 正则语法 # 1)匹配类符号 """ 普通字符 - 表示符号本身 . \d \s \D \S [普通字符集] [\da-z1-9\u4e00-\u9fa5] [.+*?$|(\-)^] [^字符集] """ # 2)检测类符号 """ \b \B ^ $ """ r'\bpython\b' r'\Bme\b' # 3) 控制次数 """ *、*? +、+? ?、?? {N} {M,N}、{M,N}? {,N}、{,N}? {M,}、{M,}? 贪婪和非贪婪 ""原创 2021-03-25 20:59:59 · 90 阅读 · 2 评论 -
2021.3.24 正则表达式
总结 01正则匹配符号 什么是正则(正则表达式) 正则是一种用来处理文本数据的一种工具。(一般用于处理复杂的文本问题) 1)检测输入的数据是否是手机号? 2)检查输入的ip地址是否合法? 3)获取字符串中所有的数字数据:‘sjhfj23世纪东方和79sk试试928sjd’ … 正则的语法 - 用不同的符号来描述字符串规则 匹配类符号 检测类符号 控制次数的符号 分组和分支 其他常用参数 fullmatch(正则表达式,字符串) - 检原创 2021-03-24 21:22:31 · 280 阅读 · 0 评论 -
2021.3.19 json和csv表格文件
01二进制和字符串之间的相互转换 字符串(str)转二进制(byres) 字符串转二进制 1 ) 将字符串数据转换成二进制数据 str1 = 'abc' b_str1 = b'abc' print(type(str1), type(b_str1)) # <class 'str'> <class 'bytes'> 2 ) bytes(字符串) str2 = 'hello' result = bytes(str2, encoding='utf-8') print(t原创 2021-03-20 17:29:47 · 91 阅读 · 0 评论 -
2021.3.17 异常捕获和文件操作
异常捕获和文件操作总结: 01异常捕获 异常 - 程序报错 当程序出现了异常,程序直接结束 print('=====') print('abc'[5]) print('-----') print('+++++') 异常捕获 异常捕获就是让程序在出现异常的时候不崩溃还可以接着往后执行 1) # 语法1: - 捕获所有类型的异常 try: 代码段1(需要捕获异常的代码) except: 代码段2(捕获到异常后会执行的代码) finally: 代码段 其原创 2021-03-18 23:19:06 · 120 阅读 · 0 评论 -
2021.3.17 模块
模块总结: 01 模块 什么是模块,什么是包 一个py文件就是一个模块,文件名就是模块名(如果一个模块想要被其他模块使用,模块名必须是标识符并且不是关键字。 一个包含__ init __. py文件的文件夹就是一个包 使用其他中的内容 一个模块可以使用另外一个模块中所有的全局变量,但是使用前需要先导入模块 导入模块的语法: import 模块名 - 导入指定模块,导入后通过 ‘ 模块名.x ’ 去使用模块中所有的全局变量 from 模块名 import 变量1, 变量2,原创 2021-03-17 20:43:56 · 76 阅读 · 0 评论 -
2021.3.16实参高阶函数和装饰器
实参高阶函数和装饰器总结: 01函数就是变量 函数的本质 python中定义函数其实就是在定义一个类型是function的变量, 函数名就是变量名 变量能做的函数都可以做 a = 10 b = 'abc' c = [1, 29, 8] d = {'a': 23, 'b': 100} e = lambda x: x*2 # e 是变量 """ def e(x): return x*2 """ def func1(): # func1 是变量 print('函数')原创 2021-03-16 20:57:19 · 67 阅读 · 0 评论 -
2021.3.13function2总结
总结: 01 parameter 重点:位置参数和关键字参数、参数默认值 一般:参数类型说明和带*的不定长 了解:**的不定长 位置参数和关键字参数 - 根据函数调用的时候实参的传递方式分类 位置参数 - 让实参和形参在位置上一一对应 关键字参数 - 调用的时候在实参前加 ‘ 形参名=’ 的结构 位置参数和关键字参数可以一起用: 位置参数必须在关键字参数的前面 def func1(a, b, c): prin原创 2021-03-15 21:16:46 · 239 阅读 · 0 评论 -
day9-函数作业
编写一个函数,交换指定字典的key和value。 例如:dict1={'a':1, 'b':2, 'c':3} --> dict1={1:'a', 2:'b', 3:'c'} dict1={'a':1, 'b':2, 'c':3} result = {dict1[x]:x for x in dict1} print(result) 编写一个函数,提取指定字符串中所有的字母,然后拼接在一起产生一个新的字符串 例如: 传入'12a&bc12d-+' --> ..原创 2021-03-13 17:27:34 · 64 阅读 · 0 评论