weixin_43967584-CSDN博客

原创 Gateway

gateway网关什么是网关微服务中网关位置Gateway处理流程Gateway三大核心概念Route（路由）使用微服务名实现动态路由Predicate（断言）使用Filter（过滤）常用的GatewayFilter-----AddRequestParameter自定义全局GlobalFiltergateway和nginx的区别什么是网关Spring Cloud Gateway 使用的Webflux中的reactor-netty响应式编程组件，底层使用了Netty通讯框架微服务中网关位置Gat

2021-03-16 12:37:57 388

原创 SQLAlchemy模块和scrapy框架

SQLAlchemy模块SQLAlchemy连接数据库使用数据库连接池技术，原理是在系统数据库初始化的时候，将数据库连接作为对象存储在内存中，当用户需要访问数据库时，并非建立一个新的连接，而是从连接池中取出一个已建立的空闲连接对象。使用完毕后，用户也并非将连接关闭，而是将连接放回连接池中，以供下一个请求访问使用。而连接的建立、断开都由连接池自身来管理。同时，还可以通过设置连接池的参数来控制连接池...

2019-07-13 11:25:43 401

原创 csv文件操作，selenium库，多线程爬虫，tesseract库

[1] 读取csv文件和写入数据到csv文件读取csv文件以下方式可通过下标获取元素：import csv with open('stock.csv','r') as fp: reader = csv.reader(fp) titles = next(reader) for x in reader: print(x)以下方式可通过标题获取元素：import c...

2019-07-06 21:41:55 276

原创 JSON

JSON JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECMAScript (w3c制定的js规范)的一个子集，采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。易于...

2019-06-22 19:20:32 140

转载 Tkinter库

转载自C语言中文网，侵删Tkinter库 Tkinter 模块(Tk 接口)是 Python 的标准 Tk GUI 工具包的接口 .Tk 和 Tkinter 可以在大多数的 Unix 平台下使用,同样可以应用在 Windows 和 Macintosh 系统里。Tk8.0 的后续版本可以实现本地窗口风格...

2019-06-15 12:06:32 836

原创正则表达式和re模块

正则表达式通俗理解：按照一定的规则，从某个字符串中匹配出想要的数据。这个规则就是正则表达式。正则表达式是处理字符串的强大工具，它有向己特定的语法结构，有了它，实现字符串的检索、替换、匹配验证都不在话下使用正则表达式匹配单个字符匹配某个字符串：text = ‘hello’ret = re.mat...

2019-06-08 20:32:55 115

原创 BeautifulSoup库

BeautifulSoup4库和 lxml 一样，BeautifulSoup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。lxml 只会局部遍历，而BeautifulSoup 是基于HTML DOM（Document Object Model）的，会载入整个...

2019-05-31 21:16:15 170

原创 XPath与lxml库

XPath及开发工具 XPath，全称XMLPath Language ，即 XML路径语言，它是一门在XML 文档中查找信息的语言。它最初是用来搜寻XML文档的，但是它同样适用于HTML 文档的搜索。所以在做爬虫时，可以使用 XPath 来做相应的信息抽取。XPath开发工具：Chrome插件...

2019-05-25 21:03:05 468

原创 request库

request库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能，但是它的 API 使用起来让人感觉不太好，比如处理网页验证和Cookies 时，需要写 Opener 和 Handler 来处理。为了更加方便地实现这些操作，就有了更为强大的库requests，Reque...

2019-05-18 21:31:31 149

原创爬虫urllib库

urllib库 urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为，向指定的服务器发送一个请求，并可以保存服务器返回的数据。它包含如下4 个模块。 request ：它是最基本的 H...

2019-05-11 23:10:09 148

原创网络爬虫与HTTP协议

网络爬虫网络爬虫(又被称为网页蜘蛛，网络机器人)，是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本，是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列，直到满足系统的一定停止条件。 &n...

2019-05-04 20:14:53 750

原创 Python多线程

threading模块 threading模块是Python支持多线程的重要模块，该模块是咋低层模块_thread的基础上开发的更高层次的线程编程接口，提供了大量的方法和类来支持多线程编程，极大地方便了用户。threading模块常用方法：threading.active_count():返回当前处...

2019-04-27 21:59:57 1273

原创 Python异常处理

1. try…except结构异常处理结构中最常见也最基本的结构。其中try子句中的代码块包含可能出现的语句，而except子句用来不做相应的异常，except子句中的代码块用来处理异常。如果try中的代码块没有出现异常，则继续往下执行异常处理结构后面的代码；如果出现异常并且被except子句捕获，则执行except子句中的异常处理代码；如果出现异常单没有被except捕获，则继续往外层抛出；如...

2019-04-20 21:31:10 12254 1

原创 Python文件操作

最近开始学习Python，第一次写博客，现在写下Python文件操作资料。部分资料来自互联网，欢迎大家互相讨论Python文件I/O读取键盘输入Python提供了两个内置函数从标准输入读入一行文本，默认的标准输入是键盘。如下：raw_input()函数：从标准输入读取一个行，并返回一个字符串（去掉结尾的换行符）Input函数：和raw_input（）函数基本类似，但是input可以接收一...

2019-04-13 21:09:40 119

weixin_43967584的博客