自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Gateway

gateway网关什么是网关微服务中网关位置Gateway处理流程Gateway三大核心概念Route(路由)使用微服务名实现动态路由Predicate(断言)使用Filter(过滤)常用的GatewayFilter-----AddRequestParameter自定义全局GlobalFiltergateway和nginx的区别什么是网关Spring Cloud Gateway 使用的Webflux中的reactor-netty响应式编程组件,底层使用了Netty通讯框架微服务中网关位置Gat

2021-03-16 12:37:57 134

原创 SQLAlchemy模块和scrapy框架

SQLAlchemy模块SQLAlchemy连接数据库使用数据库连接池技术,原理是在系统数据库初始化的时候,将数据库连接作为对象存储在内存中,当用户需要访问数据库时,并非建立一个新的连接,而是从连接池中取出一个已建立的空闲连接对象。使用完毕后,用户也并非将连接关闭,而是将连接放回连接池中,以供下一个请求访问使用。而连接的建立、断开都由连接池自身来管理。同时,还可以通过设置连接池的参数来控制连接池...

2019-07-13 11:25:43 362

原创 csv文件操作,selenium库,多线程爬虫,tesseract库

[1] 读取csv文件和写入数据到csv文件读取csv文件以下方式可通过下标获取元素:import csv with open('stock.csv','r') as fp: reader = csv.reader(fp) titles = next(reader) for x in reader: print(x)以下方式可通过标题获取元素:import c...

2019-07-06 21:41:55 248

原创 JSON

JSON        JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于...

2019-06-22 19:20:32 100

转载 Tkinter库

转载自C语言中文网,侵删Tkinter库        Tkinter 模块(Tk 接口)是 Python 的标准 Tk GUI 工具包的接口 .Tk 和 Tkinter 可以在大多数的 Unix 平台下使用,同样可以应用在 Windows 和 Macintosh 系统里。Tk8.0 的后续版本可以实现本地窗口风格...

2019-06-15 12:06:32 749

原创 正则表达式和re模块

正则表达式        通俗理解:按照一定的规则,从某个字符串中匹配出想要的数据。这个规则就是正则表达式。正则表达式是处理字符串的强大工具,它有向己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下使用正则表达式匹配单个字符匹配某个字符串:text = ‘hello’ret = re.mat...

2019-06-08 20:32:55 89

原创 BeautifulSoup库

BeautifulSoup4库        和 lxml 一样,BeautifulSoup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lxml 只会局部遍历,而BeautifulSoup 是基于HTML DOM(Document Object Model)的,会载入整个...

2019-05-31 21:16:15 143

原创 XPath与lxml库

XPath及开发工具        XPath, 全称XMLPath Language ,即 XML路径语言,它是一门在XML 文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML 文档的搜索。所以在做爬虫时,可以使用 XPath 来做相应的信息抽取。XPath开发工具:Chrome插件...

2019-05-25 21:03:05 387

原创 request库

request库        虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,比如处理网页验证和Cookies 时,需要写 Opener 和 Handler 来处理。 为了更加方便地实现这些操作,就有了更为强大的库requests,Reque...

2019-05-18 21:31:31 118

原创 爬虫urllib库

urllib库        urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。它包含如下4 个模块。        request : 它是最基本的 H...

2019-05-11 23:10:09 111

原创 网络爬虫与HTTP协议

网络爬虫        网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。 &n...

2019-05-04 20:14:53 686

原创 Python多线程

threading模块        threading模块是Python支持多线程的重要模块,该模块是咋低层模块_thread的基础上开发的更高层次的线程编程接口,提供了大量的方法和类来支持多线程编程,极大地方便了用户。threading模块常用方法:threading.active_count():返回当前处...

2019-04-27 21:59:57 1222

原创 Python异常处理

1. try…except结构异常处理结构中最常见也最基本的结构。其中try子句中的代码块包含可能出现的语句,而except子句用来不做相应的异常,except子句中的代码块用来处理异常。如果try中的代码块没有出现异常,则继续往下执行异常处理结构后面的代码;如果出现异常并且被except子句捕获,则执行except子句中的异常处理代码;如果出现异常单没有被except捕获,则继续往外层抛出;如...

2019-04-20 21:31:10 12174 1

原创 Python文件操作

最近开始学习Python,第一次写博客,现在写下Python文件操作资料。部分资料来自互联网,欢迎大家互相讨论Python文件I/O读取键盘输入Python提供了两个内置函数从标准输入读入一行文本,默认的标准输入是键盘。如下:raw_input()函数:从标准输入读取一个行,并返回一个字符串(去掉结尾的换行符)Input函数:和raw_input()函数基本类似,但是input可以接收一...

2019-04-13 21:09:40 91

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除