【Linux进程篇-----进程优先级】 PATH : 指定命令的搜索路径例如我们使用的 Linux 中 ls pwd命令,其实就是一个个 C 语言写的一个个小程序,为什么我们运行自己写的程序就要用./ + 自己的程序名 ,而我们运行ls pwd 从来不加./,这就和环境变量 PATH 有关了!我们查看环境变量可以使用echo $环境变量命令:默认情况下我们使用的 Linux 指令会去 PATH 路径下寻找源程序,由于ls指令的路径位置就在 PATH 的环境变量中所以我们可以不用加./
Django中ORM中queryset方法详解 1.queryset的含义queryset是查询集,就是传到服务器上的url里面的查询内容。Django会对查询返回的结果集QuerySet进行缓存,这是为了提高查询效率。也就是说,在你创建一个QuerySet对象的时候,Django并不会立即向数据库发出查询命令,只有在你需要用到这个QuerySet的时候才会这样做。Objects是django实现的mvc中的m,Django中的模型类都有一个objects对象,它是一个Django中定义的QuerySet类型的对象,它包含了模型对象的实例2...
关于Python语言中字符串的isdigit()、isalpha()、isalnum()方法以及in 和 find()方法详解 这里写自定义目录标题isdigit()S.isdigit()返回的是布尔值:True FalseS中至少有一个字符且如果S中的所有字符都是数字,那么返回结果就是True;否则,就返回False例:结果为 Trueisalpha()S.isalpha()返回的是布尔值:True FalseS中至少有一个字符且如果S中的所有字符都是字母,那么返回结果就是True;否则,就返回False结果为 Trueisalnum()S.isalnum()返回的是布尔值:True FalseS中
布隆过滤器 小谈布隆过滤器BitMapBit-map的基本思想就是用一个bit位来标记某个元素对应的Value,而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。(PS:划重点 节省存储空间)假设有这样一个需求:在20亿个随机整数中找出某个数m是否存在其中,并假设32位操作系统,4G内存在Java中,int占4字节,1字节=8位(1 byte = 8 bit)如果每个数字用int存储,那就是20亿个int,因而占用的空间约为 (2000000000*4/1024/1
2021-09-23 Mysql部分操作总结(limit&offset)1.limit 和offsetlimit和offset用法mysql里分页一般用limit来实现select* from article LIMIT 1,3select * from article LIMIT 3 OFFSET 1上面两种写法都表示取2,3,4三条条数据当limit后面跟两个参数的时候,第一个数表示要跳过的数量,后一位表示要取的数量,例如select* from article LIMIT 1,3 就是跳过1条数
2021-09-23 这里写自定义目录标题Mysql 部分知识整理Mysql 部分知识整理1.三大范式第一范式:字段具有原子性,不可再分(字段单一职责)第二范式:满足第一范式,每行应该被唯一区分,加一列存放每行的唯一标识符,称为 主键(都要依赖主键)第三范式:满足一二范式,且一个表不能包含其他表已存在的非主键信息(不间接依赖-不存在其他表的非主键信息)(1)简单归纳: 第一范式(1NF):字段不可分; 第二范式(2NF):有主键,非主键字段依赖主键; 第三范式(3NF):非主键字段不能相互依赖。(
Mongodb常用命令(增删改查) 1、remove删除命令查询表达式删除name=zhangsan删除age大于10删除age小于11大于等于:gte小于等于:gte小于等于:gte小于等于:lte不等于:$ne只删除一个,{justOne:true},默认全部删除更新update语法: db.collection.update(查询表达式,新值,选项)如果使用下面语句,不是更新数据,而是更新文档。...
MongoDB数据库安装详解 1.mongo安装:(1)路径最重要的是制指定路径:路径中不能包含中文和空格。C:\MongoDB\Server\3.4(2)环境变量:将下面的路径配置到path中C:\MongoDB\Server\3.4\bin(3)验证:打开cmd,输出mongod(4)新建一个存放数据库的文件夹:C:\MongoDB\Server\3.4\data\db(5)启动mongomongod...
Python爬取数据中分页的两种方法 分页的两种方法:(1)for循环for i in range(1,20): response = requests.get(url %i)这种方法只能用你知道最大页的前提下。(2)while True循环i =0 #初始页码while True:# print(2) json_str = get_conent(url.format(type_,i) ,headers =he...
python爬虫中多线程问题 1.什么是程序、进程和线程。程序:一个应用可以当做一个程序,比如qq软件进程:程序运行最小的资源分配单位。一个程序可以有多个进程。线程:cpu最小的调度单位,必须依赖进程而存在。线程没有独立的资源,所有线程共享他所在进程的资源。他们之间的关系:一个程序至少有一个进程,一个进程至少有一个线程。2.多线程:多线程是指一个程序包含多个并行的线程来完成不同的任务。多线程的优点:可以提高cpu的...
爬虫小练习---爬药网数据 1、药网数据爬取:url:https://www.111.com.cn/categories/953710?tp=10-1要求:抓取50页字段:总价,描述,评论数量,详情页链接用正则爬取。代码如下import re,requests,jsonbase_url='https://www.111.com.cn/categories/953710?-j%s.html'# https:/...
Xpath的一些基本知识 要想了解xpath,绕不开xml1.什么是xml(1)定义:xml称为可扩展标记性语言。(2)特点:xml具有自描述特性。是一种半结构化数据。(3)作用:xml的设计宗旨是用来传输数据。2.xml和html的区别(1)语法要求不同:xml的语法要求更严格。 1、在html中不区分大小写,在xml中严格区分&nbs...
Python爬虫数据的分类及json数据小结 数据的结构化分类 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为三部分,结构化的数据、半结构化的数据和非机构化数据。1.结构化数据: 可以用统一的结构加以表示的数据。可以使用关系型数据库表...
Python爬虫requests模块中如何设置代理 代理(一)代理基本原理 代理实际上指的就是代理服务器, 英文叫作proxy server ,它的功能是代理网络用户去取得网络信息。形象地说, 它是网络信息的中转站。在我们正常请求一个网站时, 是发送了请求给web 服务器,web 服务器把响应传回给我们。如果设置了代理服务器, 实际上就是在本机和服务器之间搭建...
Python爬虫中requests模块的两种请求 requests模块get请求步骤: 1.导包 import requests 2、确定请求的url base_url = '' 3.发送请求,获取响应。 response = requests.get( url = base_url,#请求的url headers={},请求头 params = {},请求参数字典 ) 新浪新闻搜索“区块...
Python爬虫学习了解的小知识 网络爬虫的定义一个程序脚本—>自动的抓取互联网上信息的脚本。爬虫可以解决的问题(1)解决冷启动问题。(2)搜索引擎的根基:做搜索引擎少不了爬虫。(3)建立知识图谱,帮助建立机器学习知识图谱。(4)可以制作各种商品的比价软件,趋势分析。搜索引擎1.搜索引擎的主要组成: 通用爬虫:就是将互联网的上页面整体的爬取下来之后,保存到本地。 1.通用爬虫要想爬取网页,需要网站的u...
基于sqlite3的Django读写分离 1.在项目中的settings文件中配置数据库2.将主库中的数据库表结构进行迁移migrate --database slave(自己从库的库名)3.在项目主目录中创建一个py文件,这里的我叫mydbrouterdef db_for_read() 决定读操作的数据库(从库)def db_for_write() 决定写操作的数据库(主库)4.在settings中加上数据库路...