自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 资源 (1)
  • 收藏
  • 关注

原创 合并多个 XLSX 格式的文件

import osimport pandas as pdimport xlrd# 注意这里的 xlsx 文件内容不同(如果相同的话合并干嘛) 但格式是一样的 # 每个文件一个只有 sheet1 有内容 其他地方空白# 在 path 下 找出所有符合要求的文件def file(path): name = [] # 存放符合要求的 xlsx 文件 a = os.listdir(path) # 找出所有的文件 for b in a: if os.p

2020-10-16 17:50:45 1674

原创 04 变量补充

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>变量补充</title> <script> /* 1.如何给已经定义好的变量修改他的值 再次给变量重新赋值 2.如果一个变量 没有进行 变量初始化 那当中存储的是 undefined(bug

2020-07-12 15:17:49 164

原创 03 变量

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>变量</title> <script> /* 可以被修改的数据 定义格式 var 变量名; 如何使用 1.赋值 变量名 = 值;

2020-07-12 15:16:25 139

原创 02 JavaScript 的常量

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>JavaScript 的常量 </title> <script> /* 什么是常量 固定不变的数据 常量的分类 1.整形常量 就是整数 例 33 // 55 /

2020-07-12 15:15:18 106

原创 01 JavaScript 常见的输出

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>JavaScript 常见的输出</title></head><body><script> /* 1.通过弹窗的形式来输出 alert("通过弹窗的形式来输出") 一个按钮

2020-07-12 15:12:58 123

原创 注释与书写

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>注释与书写</title> <!-- 注释--> <!-- script 标签中的 type="text/javascript" 不写默认值也是这样的--> <!-- 书写格式: 1.行内样式 1

2020-07-12 15:07:58 136

原创 爬取b站视频 一个新的库

import requestsimport you_getimport sysimport jsondef get_playurl(): '''获取整个页面的视频播放地址''' url = 'https://s.search.bilibili.com/cate/search?callback=jqueryCallback_bili_16350172032693622&main_ver=v3&search_type=video&view_type=hot_

2020-07-06 11:08:47 328

原创 线程 实践 1

import requestsfrom lxml import etreeimport threading# 单/多 线程爬取 当当书名 不保存headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}urls = ['http://search.dangdang.c

2020-06-17 11:10:10 90

原创 类 1

# 1 创建和使用类 /创建多个class Dog(): '''小狗的一次简单尝试''' def __init__(self,name,age): '''初始化属性''' self.name = name self.age = age def sit(self): '''一条命令''' print(self.name.title() + " 正在蹲下!") def roll(self):

2020-06-16 10:24:16 162

原创 线程 1

import timeimport threadingstart_time = time.time()def one(): for i in range(0,3): print("学习1秒钟") time.sleep(1)def two(): for i in range(0,3): print("看小姐姐1分钟") time.sleep(1)def main(): '''学习线程''' #

2020-06-16 09:04:43 76

原创 bs4 提取数据 保存格式 csv 总结

bs4 的数据转换 soup = BeautifulSoup(html,‘html.parser’)先使用 find_all 找出一个包含所有信息的 最小 父级 盒子这样就得到了 需要提取的全部数据 此时数据类型为列表通过 for 遍历 分别提取 使用方法 find get_text() replace()当内容需要保存为 csv 文件时直接先在就在 for 循环上 写入 with open。。。语法当分别提取得数据 已经得到了f.write("{},{}

2020-06-11 09:07:51 619

原创 01

from tkinter import * # 导入# 创建窗口root = Tk()# 标题root.title("窗口名字")# 设置 宽,高 度 单位 px 像素 宽度x高度root.geometry('500x400')# 标签lable = Label(root,text="窗口内提示的字符串:")# 需要网格布局才可以显示# 网格布局lable.grid()# 输入控件entry = Entry(root,font=('微雅黑体',14)).

2020-06-11 09:05:15 101

原创 哔哩哔哩 后浪 弹幕 获取 保存 csv 并制作词云

''''找出真实的弹幕列表的url保存 csv 文件制作词云图'''import reimport requestsimport csv# headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}# url = 'https://api.bilibili.c

2020-05-13 19:41:03 2155 4

原创 瓜子二手车 翻页 csv

import requestsfrom bs4 import BeautifulSoup# import io# import sys# sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') # 改变标准输出的默认编码headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTM

2020-05-10 11:16:31 475

原创 肯德基门店 csv

import requestsimport pprintimport csvfor page in range(1,6): print("========正在获取{}页数据========1".format(page)) url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword' h...

2020-05-08 13:09:17 230

原创 有道翻译 新(js破解)

'''js 解密有道翻译'''import requestsimport timeimport random # 随机数import hashlib # md5 加密# 爬虫三件套headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (...

2020-04-23 15:22:10 508

原创 拉钩 翻页 方法

import requests# cookie 获取url = 'https://www.lagou.com/jobs/list_python%E5%AE%9E%E4%B9%A0?oquery=python&fromSearch=true&labelWords=relative'resp_2 = requests.get(url,headers={'User-Age...

2020-04-20 13:37:12 170

原创 美丽的汤 xlsx格式 csv 格式

'''美丽的汤的2种用法保存数据文件xlsx 格式文件csv 文件'''from bs4 import BeautifulSoup'''根据 class 的属性值 来提取数据find_all 注意在添加 class 的值是 class 有下划线 class_="属性值"例:豆瓣top 排行榜的电影信息(目标数据在标签外) time: 2020-02-21数据转...

2020-04-17 18:17:43 165

原创 机器猫

# 哆啦A梦 哒哒哒import turtledef flyTo(x, y): turtle.penup() turtle.goto(x, y) turtle.pendown()def drawEye(): turtle.tracer(False) a = 2.5 for i in range(120): if ...

2020-04-11 15:40:27 474

原创 酷6视频获取 函数

import requestsimport jsonheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}# 网页获取def get_htm...

2020-04-09 10:32:09 116

原创 淘宝信息获取(不保存)

from selenium import webdriverimport timeimport re# 输入关键字 收搜 获取总的页码数 用于后边翻页def search_product(): # 元素定位 ——输入框 搜索 按钮 driver.find_element_by_xpath('//*[@id="q"]').send_keys(kw) # xapt...

2020-04-08 15:45:52 150

原创 解析网电影信息获取

'''通过解析网获取电影通过操作发现在 network 控制台中文件名 .ts 结尾的文件为 视频文件(也就是电影某个小片段)需要将这些全部获取下来发现这个后缀的变化规律 .ts 后数字的变化先拿当中的一个 ts 文件中的 url 来下载测试发现命名为 .ts 的格式时也是可以进行播放的为节省下载时间 了解一个新的知识点 进程池(内部需要创建多个来达到效果)在同一个时...

2020-04-05 13:30:53 712

原创 豆瓣电子书

import requestsimport urllib.requestfrom bs4 import BeautifulSoupimport csv'''目标数据:书名作者日期价格评分评价人数'''headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53...

2020-04-05 13:24:41 106

原创 优美图库图片获取

import requestsimport parselheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'}name = 1def down_...

2020-04-01 14:38:43 1256

原创 酷我音乐获取

import requestsheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36', 'Cookie': '_ga=GA1.2.466145602...

2020-04-01 13:43:45 987 5

原创 我主良缘婚姻网图片获取

'''保存图片为例分析数据startage: 21 最小年龄endage: 30 最大年龄gender: 2 性别 女cityid: 149 城市编号startheight: 151 身高endheight: 160 身高marry: 1 婚姻状况 未婚education: 30salary: 2 薪资 kpage: 1 页码http:/...

2020-04-01 13:40:25 123

原创 个人知识点总结

'''1. url headers 参数确定URL: 如果目标网址是静态的网页,那就直接确定是他 遇到 ajax 异步加载 需要通过 Network 中 xhr 来通过抓包获取数据 例如关键字: 梨视频 糖堆等案例Headers: 这个不多说了2.关于请求方式我用的最多的 还是 get 请求 ,还有一个没有怎么学到post(就pass)常...

2020-03-28 09:23:12 124

原创 京东汉服

import requestsfrom bs4 import BeautifulSoupheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}img...

2020-03-28 08:39:25 129

原创 果壳问答——函数

import reimport jsonimport requestsheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}a = []def...

2020-03-28 08:37:11 150

原创 果壳问答

import requestsimport jsonimport reheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}link = 'h...

2020-03-28 08:33:54 643

原创 六房短视频获取 -函数

import requestsimport jsonimport reheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}def chenk_ti...

2020-03-28 08:31:14 74

原创 六房短视频获取

import requestsimport jsonimport reheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}def chenk_t...

2020-03-28 08:27:12 130

原创 贴吧美女图片获取

import requestsimport parselheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko'}name = 1for page in range(0,4): print("\n正在获取第{}页数据".forma...

2020-03-28 08:22:09 551

原创 美女手机壁纸获取

import requestsimport parselheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}num = 1for page in...

2020-03-25 09:51:52 112

原创 lol英雄皮肤图片爬取

import requestsimport json'''lol 英雄及英雄皮肤下载动态加载数据1.先获取英雄 id2.拼接 关于图片 js 的 url3. 请求后将返回体进行数据转换4.此时的 js 数据(2.js) skines(键名) mainImg(图片url) name(皮肤名字)'''headers = { 'User-Agent': 'Mozilla/...

2020-03-25 09:47:33 252

原创 豆瓣电子书知识点梳理

目标地址知识点梳理:''''分析豆瓣图书获取数据及保存的方法1. 网页分析1.1 . url 参数 (例 小说) 将其 str 修改为 ASCII 编码1.2 在 import urllib.request 或 import urllib.parse 导入: 例: key = "小说" key_ASCII = urllib....

2020-03-19 12:43:17 185

原创 Xpath 语法理解(parsel)

''''xpath 理解在 html / xhtml 文档信息查找信息'''import parsel # pip install parsel 进行安装# 当前为字符串类型 strhtml_str = '''<div> <ul> <li class="item_1"> <...

2020-03-19 12:28:13 1230

原创 快代理ip爬取 并验证

目标地址import requestsimport parselimport timedef chenk_ip(proxies_list): '''检测代理 IP 的可用性''' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML...

2020-03-12 13:33:26 391

原创 鼠标控制01

# 信息轰炸# 控制信息 xxxxxx 发送 x 条 在 xxx时间内# 控制 键盘 鼠标 发送信息# 循环import timefrom pynput.keyboard import Controller as key_cl # as 后别名方便后面调用 鼠标from pynput.mouse import Button,Controlle...

2020-03-12 13:22:42 106

原创 糖堆图片获取

目标地址import requestsimport jsonimport jsonpathimport urllib'''糖堆动态加载 无法直接找出翻页规律在 XHR 中 向下找(页面下滑) 发现 Request_URL 的 参数 里 start的值会一直递增 js 文件经过 js 美化后 发现图片的 url 是 键名为 path 的值 '''he...

2020-03-12 13:19:23 397

01注释与书写.html

零基础,想来学习这个,我们大家可以一起交流学习,不是恰饭机构哈

2020-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除