自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (2)
  • 收藏
  • 关注

原创 hexo搭建个人博客

部署个人博客安装noejs和git安装网站:nodejsgit安装完后需要确认有无添加系统路径安装部署Hexo使用npm命令安装Hexonpm install -g hexo-cli部署Hexocmd到指定路径执行命令生成blog:hexo init <folder>cd <folder>npm install将blog部署到本地静态:hexo s命令添加博客:hexo n "文件名" 或hexo new "文件名"美化主题可以自己寻找或者魔改

2021-03-28 20:50:54 227

原创 [学习笔记] 数据结构与算法排序

跟b站up主学习数据结构与算法的代码笔记视频链接:https://www.bilibili.com/video/BV1mp4y1D7UP代码涵盖了基本的一些排序算法包括:冒泡、选择、插入、快速、堆排序、桶排序、归并排序、希尔排序、ji计数、基数排序import numpy as np# 冒泡排序Bubble sortdef bubble_sort(li): for i in range(len(li)-1): exchange = False for

2020-09-17 13:14:06 158

原创 tkinter&psutil实现系统网络监控

tkinter&psutil实现系统网络监控基于tkinter-label标签和psutil实现网络的监控后期可以通过pyinstaller封装成exe使用代码可能冗余,敬请指教import tkinter as tkimport psutilimport timedef update(): recv1=psutil.net_io_counters().bytes_recv/1024 time.sleep(1) recv2=psutil.net_io_co

2020-09-17 12:52:01 286

原创 爬取京东销售商品并保存为xls文件

获取京东商品售价等信息需要安装selenium,lxml,xlwt等模块通过selenium模块模拟登录爬取京东销售页面将爬取的数据通过xlwt模块保存至指定xls文件中from selenium import webdriverfrom lxml import etreefrom time import sleepfrom urllib.parse import urlencodeimport xlwtimport timeif __name__=='__main__':

2020-08-26 14:41:59 744

原创 爬取央视新闻国内版块新闻

爬取央视新闻国内版块一个练习项目,爬取央视新闻的国内新闻板块,保存为txt文件。格式未经仔细排版。import requestsimport refrom lxml import etreeimport timeif __name__=='__main__': start_time=time.time() print('正在爬取。。。') fp=open('./央视新闻.txt','w',encoding='utf-8') headers = {

2020-08-25 00:05:20 1101

原创 多线程爬取下载凤凰网视频

基于正则和xpath爬取并下载凤凰网视频网页爬取源码需要用正则表达式(re)解析获得视频网页地址对爬取的视频网址网页分析,采用xpath解析视频下载地址使用线程池多线程同步进行,节省时间缺点:无法自动加载更多获得更多的视频。作为初学者,欢迎各位大佬提出解决方法以及欢迎指正!import reimport requestsfrom lxml import etreefrom multiprocessing.dummy import Poolimport os# 创建下载文件夹if

2020-08-23 20:55:46 747

原创 time,datetime,calendar模块使用方法详解

Python 有很多种方式处理日期和时间,常见的时间处理的模块是datetime、time、calendar。能融汇贯通的了解和使用这三个模块,才能轻而易举地用python处理时间。datetime(日期时间)模块主要是用来表示日期的,就是我们常说的年月日时分秒,calendar(日历)模块主要是用来表示年月日,是星期几之类的信息.time(时间)模块主要侧重点在时分秒.datetime对象就是date对象和time对象的组合。# 导入datetime模块三个核心的类from dateti

2020-08-23 09:18:13 1234

原创 基于百度智能云api识别验证码

基于百度智能云api识别验证码通过调用百度智能云api接口进行验证码识别并输出。使用baidu-aip模块进行模拟client登录,client.basicgeneral()函数识别图片文字并返回图片数据获取古诗词网的验证码,其验证码格式为gif格式,需要通过PIL包将保存的图片格式修改为png或者jpg格式。注意:百度ocr文字识别的图片格式为:PNG、JPG、JPEG、BMP、TIFF、PNM、WebP否则会报错:image format errorfrom aip import AipOc

2020-08-22 17:33:00 936

原创 爬取英雄联盟英雄皮肤数据

爬取英雄联盟英雄皮肤数据import requestsimport jsonpathimport osfrom urllib.request import urlretrieve # 下载文件包from lxml import etree# 获取英雄IDdef get_id(): response=requests.get('https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js').json()

2020-08-21 18:25:39 441

原创 爬取化工行业招聘信息

爬取化工行业招聘信息** 博主现为化工准研究生一名,作为化工行业未来的搬砖工,对于未来的就业前景一片迷茫,所以在自己拙劣的敲码水平下,编了一段代码爬取化工招聘信息。可以基于此代码,爬取其他招聘网页的信息。水平有限,仅供参考,欢迎指正。**import requestsfrom lxml import etreeif __name__=='__main__': url='http://www.chenhr.com/hotjobs/huagong/%d' # UA伪装

2020-08-21 09:29:54 227

原创 requests模块爬取微博热搜榜

爬取微博热搜榜作为爬虫新手,这是一个练手项目,水平有限,仅供参考,欢迎交流此代码基于requests包和lxml包编写,同时可以查看爬取热搜时间。因为水平有限,暂时还未想到置顶热搜写入txt办法。import requestsfrom lxml import etreeimport datetimeif __name__=='__main__': headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win

2020-08-21 09:12:35 767

百度文字识别—post请求

基于百度api,通过requests.post()请求获取文字识别功能,其中requests_url可以更改,实现更多的识别功能。requests_url的具体信息在调用url.txt文件中

2020-08-22

百度云文字识别-调用aip.py

使用baidu-aip模块,调用百度aip只能识别图片文字,并将文字整合输出,可用于二维码验证登录。

2020-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除