自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 正则表达式

简述正则表达式语法及使用案例

2023-07-04 13:02:13 97

原创 网页解析工具(XPath与正则表达式)

XPath lxml库 功能 lxml是一个HTML/XML的解析器,主要的功能是如何解析和提取HTML/XML数据 基本使用 利用来解析HTML代码,并在解析时,如果HTML代码不规范,将自动进行补全 from lxml import etree text = ''' <div> hello world </div> ''' html = etree.HTML(text) #返回html对象 #html = etree.parse('hello.html') #从文件读取ht

2022-04-07 23:25:31 3046

原创 javascript

动态添加表格内容 function create_menu(infos){ /** * 根据数组infos中的内容按添加信息 * */ var table = document.getElementById('menuTable');//获取表对象 for(var i = 0;i<infos.length;i++){ table.appendChild(mk_row(infos[i]));//向表格中添加一行按钮 } } function mk_cell(htmIfno){ /**

2022-01-08 00:11:04 308

原创 window环境Eclipse配置

一、 java安装 1.下载JDK 至oracle官网下载对应版本JDK,并安装。建议使用与拟部署服务器相同版本。 2. 配置环境变量 进入JDK安装根目录,并复制路径,如:D:\Program Files\Java\jdk-15.0.2 右击“我的电脑->属性” “高级系统设置->环境变量” “系统变量->新建”,新建变量:JAVA_HOME,值为JDK安装路径(D:\Program Files\Java\jdk-15.0.2) 继续新建变量:CLASSPATH,值为:.;%JAVA_

2022-01-06 07:42:56 627

原创 定时任务命令Crontab

一、安装 检查是否安装 crontab -l #报错表示未安装 安装服务 yum -y install vixie-cron crontabs 启动服务 service crond status #查看服务状态 service crond start #启动服务 service crond stop #关闭服务 service crond restart #重启服务 二、格式 crontab [-u user] file crontab [-u user] -e

2021-04-19 14:54:06 98

原创 关于类变量、成员变量、局部变量和全局变量

python中类的变量可分为类变量、成员变量和局部变量 class Demo(): classVar = 50 #类变量,类似静态变量,不同点,在实例中改变只影响本实例 def __init__(self,x) self.numberVar = x def fuc(self): localVar = 20 return self.numberVar + localVar def show(self): return classVar

2021-04-14 12:20:00 407

原创 scrapy数据库异步存储操作

异步保存使应用程序无需等待存储操作完成即可执行后续命令,进而提高执行效率。scrapy通过twisted框架实现,twisted为事件驱动的异步框架。 使用twisted.enterprise.adbapi来创建连接池 使用runlnteraction来运行插入sql语句的函数 在插入sql语句的函数中,第一个非self的参数就是cursor对象,使用这个对象执行sql语句。 settings.py 解除Configure item pipelines的注释 添加数据库信息 item_pipeli

2021-03-27 17:21:00 506 3

原创 MySql数据库操作

安装PyMySql库 pip install pymysql 连接数据库 # --coding:utf-8-- import pymysql import time #建立连接 connect = pymysql.Connect( host='localhost', #IP地址 port=3306, #端口,默认为3306,实际项目建议更改 user='xxxx', #通常为root,实际项目应更改 password='x

2021-03-25 22:32:34 67

原创 scrapy下载文件

spider.py 导入用于保存文件下载信息的item类. 在爬虫类中解析文件url,并保存在列表中,根据需要提取标题等其它信息 返回赋值后的item类 from ..items import FileItem class MySpider(Spider): def parse(self,response): titles = response.xpath('xxxxxxxx') #list,获取文件名称列表 fileUrls = respons

2021-03-24 22:05:48 1276

原创 scrapy下载图片

spider.py 导入用于保存图片下载信息的item类. 在爬虫类中解析图片url,并保存在列表中,根据需要提取标题等其它信息 返回赋值后的item类 from ..items import ImageItem class MySpider(Spider): def parse(self,response): titles = response.xpath('xxxxxxxxx') #list,获取网页标题 title = ''.join(ti

2021-03-24 16:11:05 626

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除