![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
酸奶的成长记
一个python很烂的小测试
展开
-
【python练习题】输入一个长度为 n 的可能有重复值的数组,找出其中不去重的最小的 k 个数
"""输入一个长度为 n 的可能有重复值的数组,找出其中不去重的最小的 k 个数。例如数组元素是4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4(任意顺序皆可)。2. 输入描述 输入一个长度为 n 的可能有重复值的数组3. 输出描述 输出最小的K个数组成的数组4. 示例输入:[4,5,1,6,2,7,3,8],4返回值:[1,2,3,4]说明:返回最小的4个数即可,返回[1,3,2,4]也可以"""def min_number():原创 2022-04-19 18:56:44 · 2462 阅读 · 0 评论 -
【python练习题】在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。
在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。 例如,如果输入长度为7的数组[2,3,1,0,2,5,3],那么对应的输出是2或者3。存在不合法的输入的话输出-1def repeat_number(): number_list = [] length = int(input("请输入数组长度:")) if length < 1: print原创 2022-04-19 18:54:47 · 1330 阅读 · 0 评论 -
python 使用cx_freeze 打包成exe可执行文件
1.安装cx_freeze打开cmd,输入pip install cx-freeze2.然后在cmd中,切换到Scripts路径下,输入 python cxfreeze-postinstall3.继续在cmd下尝试输入 cxfeeeze -h 验证下,显示成功cx_Freeze将py文件打包成exe如下:利用cx_Freeze将py文件打包成exe文件,链接:http://blog.51cto.com/keliang/661884打包文件时要在Scripts文件夹路径下操作,文件的路径最好是.原创 2022-04-13 10:37:25 · 1515 阅读 · 0 评论 -
python表情包emoji
# 安装pip install emoji -i http://pypi.douban.com/simple --trusted-host pypi.douban.comimport emoji# 默认表情直接字符 thumbs_up 实现result1 = emoji.emojize("Python is :thumbs_up:") # Python is ????print(result1)# 有些特殊的表情需要指定 use_aliases=True 参数才可以实现# Sleeping原创 2022-02-21 20:29:08 · 758 阅读 · 0 评论 -
python生成关键词
import reimport jiebaimport wordclouddef get_text(text): """该函数用来替换文本中出现的特殊字符""" txt = text for i in '!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~,。、 :': txt = txt.replace(i, "") # 将文本中特殊字符替换为空格 return txtstring = open(r'F:\数据原创 2022-02-20 11:23:08 · 766 阅读 · 0 评论 -
python基础之常用的公共方法
# len() 计算容器重元素个数str1 = 'abcdefg'list1 = [10, 20, 30, 40, 50]t1 = (100, 200, 300, 400, 500)s1 = {100, 200, 300, 400, 500}dict1 = {'name': 'python', 'age': '18'}print(len(str1)) # 7print(len(s1)) # 5print(len(list1)) # 5print(len(t1)) # 5print原创 2022-01-22 11:54:16 · 390 阅读 · 0 评论 -
【pyhon读取yaml文件】实现配置自动化测试浏览器切换浏览器
1.读取yaml文件yaml文件内容browser: Chrome#browser: IE#browser: FireFoximport yamlimport osclass ReadYaml(object): def __init__(self, yaml_file_path): if os.path.exists(yaml_file_path): self.yaml_file_path = yaml_file_path el原创 2021-12-15 15:28:35 · 869 阅读 · 0 评论 -
python 破解数字图片验证码自动打卡功能
图片验证吗是数字的情况实现方式直接暴力破解循环写入就行from selenium import webdriverfrom selenium.webdriver.support.wait import WebDriverWaitimport timeclass CrackSlider(object): """ 通过浏览器截图,识别验证码中缺口位置,获取需要滑动距离,并模仿人类行为破解滑动验证码 """ def __init__(self):原创 2021-07-30 13:25:38 · 443 阅读 · 0 评论 -
python字典基础
"""字典特点:符号为⼤大括号数据为键值对形式出现各个键值对之间⽤用逗号隔开"""# 有数据字典dict1 = {'name': 'Tom', 'age': 20, 'gender': '男'}# 空字典dict2 = {}dict3 = dict()"""字典操作增加字典序列列[key] = 值如果key存在则修改这个key对应的值;如果key不不存在则新增此键值对。字典为可变类型"""dict1 = {'name': 'Tom', 'age': 20, 'gender原创 2021-07-27 20:48:46 · 40 阅读 · 0 评论 -
python列表基础,包含所有知识点,最全面最详细的介绍
"""通过下标查找列表元素"""name_list = ['Tom', 'Lily', 'Rose']print(name_list[0]) # Tomprint(name_list[1]) # Lilyprint(name_list[2]) # Rose"""index():返回指定数据所在位置的下标列列表序列列.index(数据, 开始位置下标, 结束位置下标)如果查找的数据不不存在则报错"""name_list = ['Tom', 'Lily', 'Rose']prin原创 2021-07-26 21:17:33 · 104 阅读 · 0 评论 -
python100例015
"""题目015:利用条件运算符的嵌套来完成此题:学习成绩>=90分的同学用A表示,60-89分之间的用B表示,60分以下的用C表示。"""def test0015(): score = int(input("请输入学习成绩:")) if score >= 90: print("成绩为A") elif score >= 60: print("成绩为B") else: print("成绩为C")te原创 2021-07-22 20:52:26 · 56 阅读 · 0 评论 -
python100例014
"""题目014:将一个正整数分解质因数。例如:输入90,打印出90=2*3*3*5。"""import mathdef test0014(): num = int(input("请输入一个正整数:")) arr = [] while num > 1: for i in range(2, int(math.sqrt(num)) + 1): # 因为题目是一个没写范围正整数,开方可以有效减少该值过大时候的计算量 if num原创 2021-07-22 11:26:26 · 51 阅读 · 0 评论 -
python+selenium自动化测试之判断元素可见封装
from selenium import webdriverfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWaitfrom selenium.webdriver.common.by import Byfrom com.base_page import BasePagefrom logs.logger impor.原创 2021-04-03 16:36:07 · 544 阅读 · 0 评论 -
python+selenium webui自动化测试之打开浏览器封装两种方式ini配置文件或者yaml文件
yaml文件:# !/usr/bin/python# -*- coding:utf-8 -*-from logs.logger import Loggerfrom selenium import webdriverimport osfrom configfg.read_yaml import YamlReaderimport timelogger = Logger(logger="BrowserEngine").get_log()# 浏览器引擎类class BrowserEn.原创 2021-03-31 23:08:37 · 721 阅读 · 1 评论 -
python web自动化测试之二次封装 selenium 类
from logs.logger import Loggerfrom selenium.common.exceptions import NoSuchElementExceptionimport timeimport osfrom selenium import webdriver""""""""" 二次封装 selenium 类,又称之为通用类。用于给页面类使用"""# 引用自定义日志文件logger = Logger(logger="BasePage").get_log().原创 2021-03-31 20:14:41 · 274 阅读 · 0 评论 -
python使用time库创建时间路径和时间文件
import timeimport os# 获得当前系统时间的字符串local_time = time.strftime("%Y-%m-%d-%H-%M-%S", time.localtime(time.time()))print(local_time)print(type(local_time))# 获取年字符串year = local_time.split("-")[0]print(year)# 获取月字符串month = local_time.split("-")[1]# 获.原创 2021-03-26 23:19:28 · 531 阅读 · 3 评论 -
lambda函数复习
def test(x): return x*x# 这里我们用lambda定义一个匿名的内联函数。请注意,该函数没有名称。test 是保存创建的lambda函数的变量的名称# 上面的函数和下面的lambda函数是一样的test_f = lambda x: x*xprint(test(3))print(test_f(3))# 常量函数def constant(): return 1constant_f = lambda: 1print(constant())print(co.原创 2021-03-26 16:42:55 · 125 阅读 · 2 评论 -
python使用yaml库读取和写入数据
import yamltest.yml文件数据:yaml_path = r"D:\PycharmProjects\2020study\BBBstudy\test.yml"with open(yaml_path, 'r') as f: cfg = f.read() print(cfg) # 此时读出来的数据是字符串 print(type(cfg)) # 用yaml.load方法转字典 d = yaml.load(cfg) print(d).原创 2021-03-26 15:47:36 · 819 阅读 · 0 评论 -
python使用bs4库爬取网站数据存储到excel
from urllib.request import urlopenfrom bs4 import BeautifulSoupimport pandas as pdimport reimport pprintclass Crawler(object): def __init__(self, url): self.url = url def parser_page(self): html = urlopen(self.url) .原创 2021-03-25 22:16:52 · 442 阅读 · 0 评论 -
python爬虫之正则表达式和BeautifulSoup
# 正则表达式和BeautifulSoupfrom urllib.request import urlopenfrom bs4 import BeautifulSoupimport rehtml = urlopen("http://www.pythonscraping.com/pages/page3.html")bs = BeautifulSoup(html, "html.parser")images = bs.find_all('img', {...原创 2021-03-22 23:20:01 · 194 阅读 · 0 评论 -
python第一个爬虫脚本,使用python爬取百度首页
from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen("http://www.baidu.com")# html.read()获取HTNL类容 html.parser是htmllib的解析器bs = BeautifulSoup(html.read(), "html.parser")print(bs.title)print(bs.div)print(bs.h1)print(bs.a)...原创 2021-03-22 17:28:13 · 417 阅读 · 0 评论