笔记
十三t
安静安己
展开
-
进制之间的转换
二进制与十进制:1、十进制转二进制。方法为:十进制数除2取余法,即十进制数除2,余数为权位上的数,得到的商值继续除2,依此步骤继续向下运算直到商为0为止。2、二进制转十进制二进制转十进制。方法为:把二进制数按权展开、相加即得十进制数。如下1000(二进制)= 1x2^3 + 0 x2^2 +0x2^1 +0x2^0。中文描述:用二进制数,原码相应的数位乘以2的(n-1)次方(例子为4比特)的积再相加。二进制与八进制1、二进制转八进制。方法为:3位二进制数按权展开相加得到1位八进制数原创 2020-08-17 16:26:31 · 662 阅读 · 0 评论 -
-1的源码、反码、补码
-1的补码为11111111(8bit)过程1.通常把一个数的最高为定义为符号位,用“0”表示正,用“1”表示负。-1的原码=100000012.反码:对于负数,数符位为1,数符位不变,将数值位诸位取反为反码。-1:的反码=111111103.补码:对于负数,数符位为1,数符位不变,将反码+1=补码。-1:的补码=11111111...原创 2020-08-17 15:13:08 · 34861 阅读 · 0 评论 -
浅谈护眼模式
护眼模式: 原理是什么?,先说原理,所谓的“护眼模式",其实是减少屏幕的蓝光,从而减少对眼睛的伤害。蓝光是什么? 蓝光是指液晶屏幕发出的波长在400nm 500纳米之间的光, 这部分的光线能够直接穿透眼睛的角膜和晶状体,到达视网膜,从而诱发眼睛疲劳、干眼、生物钟紊乱等不适症状。而"护眼模式则是调节屏幕色温,让蓝光减少,利用的是红和黄光柔和产生光线,所以我们看到屏幕会变黄变暗就是这原因。祝愿注意养成良好的卫生习惯:1、电脑操作者不宜边操作电脑边吃东西, 也不宜在操作室内就餐,否则易造成消化不良或胃炎。原创 2020-07-29 10:33:49 · 1647 阅读 · 0 评论 -
顿悟
歌曲《太阳》曾写到:你总感到落寞沮丧,你总感到失望,对于人生未来总有太多迷惘。你总伪装自己不痛,你总笑着逞强对于爱情害怕触碰放弃挣扎。你看着我眼睛你记着我声音无畏风雨别忘记还有我站在这里。我只想做你的太阳 ,你的太阳,在你的心里呀在你的心底呀!不管是多远的远方不要害怕我在身旁。想做你的太阳, 你的太阳在你的心里呀!在你的心底呀!就算不能在你身旁也要奋力为你而发光。可想想谁的青春不迷茫,谁的青春又没有遗憾呢?我们总是在成长中慢慢失去,失去了那个曾经非常热情的你自己,失去了那个曾经很喜欢你的人,失去了曾经拥原创 2020-06-09 02:37:39 · 213 阅读 · 0 评论 -
Requests数据抓取
Requests简介Requests是Python的一个很实用的HTTP客户端。与urllib比,Requests是在urllib基础上进一步封装的,具备urllib的全部功能;语法简单易懂,兼容性较强。请求方式HTTP的常见请求是GET和POST,Requests区分两种不同的请求方式。GET请求有两种,分别是不带参数和带参数。可以用“?”判断是否带有参数,如何需要带多个参数可以用&am...原创 2020-02-05 01:28:13 · 287 阅读 · 0 评论 -
Urllib数据抓取
Urllib简介Urllib是Python自带的标准库,无需安装直接可以调用。在Python 2和Python 3中,Urllib在不同版本中的语法有改变。Python 2分为Urllib和Urllib2,Urllib2可以接收一个Request对象,并以此设置一个URL的Headers,但是Urllib只接收一个URL。Urllib模块提供进行Urlencode的方法,该方法用于GET查询字符...原创 2020-02-04 12:39:33 · 201 阅读 · 0 评论 -
一些有用的it名词
冒泡排序,选择排序,插入排序,快速排序,堆排序,归并排序,希尔排序,桶排序,基数排序。有向图,无向图,有环图,无环图,完全图,稠密图,稀疏图,拓扑图。最长路,最短路,单源路径,所有节点对路径。二叉树,红黑树,van Emde Boas树,最小生成树。最大流,网络流,标准输入流,标准输出流,文件输入流,文件输出流。线性动规,区间动规,坐标动规,背包动规,树型动归。散列表,哈希表,邻接表...原创 2020-02-03 17:14:03 · 167 阅读 · 0 评论 -
Fiddler抓包工具
Fiddler介绍Fiddler是一款非常流行并且实用的HTTP抓包工具,原理是在电脑上开启一个HTTP代理服务器,然后转发所有的HTTP请求和响应。不仅支持请求重放一些高级功能,也可以支持对手机应用进行HTTP抓包。Fiddler是用C#开发的工具,包含一个简单却功能强大的基于JScript.NET事件的脚本子系统,灵活性非常棒,可以支持众多的HTTP调试任务,并且能用.net框架语言进行扩...原创 2020-02-02 16:02:06 · 175 阅读 · 0 评论 -
Chrome分析网站
Chrome开发工具浏览器是从事编程开发人员必备的开发工具。世界上五大主流浏览器分别是:IE、Opera、Google Chrome、Safari和Firefox。其中,Chrome和Firefox是编程开发人员的首选,主要是两者运行速度、扩展性和用户体验都符合开发人员所需。以Chrome作为分析网站的工具,因为其简洁、速度快(无论是启动速度、页面解析速度还是JavaSript执行速度),对H...原创 2020-02-01 14:55:40 · 1727 阅读 · 1 评论 -
前端的一些开发技术
原创 2020-01-31 15:22:03 · 197 阅读 · 0 评论 -
Ajax
ajax不是一种新的编程语言,而是一种用于创建更好、更快以及交互性更强的Web应用程序的技术。使用JavaScript向服务器提出请求并处理响应而不是阻塞用户,核心对象是XMLHTTPRequest。通过这个对象,JavaScript可在不重载页面的情况下与Web服务器交换数据,即在不需要刷新页面的情况下就可以产生局部刷新的效果。Ajax在浏览器与Web服务器之间使用异步数据传输(HTTP请求...原创 2020-01-31 15:11:58 · 262 阅读 · 0 评论 -
JSON
JSON(JavaScript Object Notation,JS对象标记)是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言,易于阅读和编写,同时也易于机器解析和生成,并有效的提升网络传输效率。在JS语言中一切都是对象。因此任何支持的类型都可以通过JSON来表示。JSON格式说明如下:对象表示为键值对。...原创 2020-01-31 14:33:05 · 285 阅读 · 0 评论 -
JavaScript
JavaScript是一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型。它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在HTML网页上使用的,用来给HTML网页增加动态功能。JavaScript脚本语言同其他语言一样,有自身的数据类型、表达式和算数运算符及程序的基本框架。JavaScript提供了4种基本数据类型和两种特殊的数...原创 2020-01-31 14:04:01 · 170 阅读 · 0 评论 -
Cookies
Cookies也可以称为Cookie,指某些网站为了辨别用户身份、进行Session跟踪而存储在用户本地终端上的数据。一个Cookies就是存储在用户主机浏览器中的文本文件。Cookie是纯文本形式,他们不包含任何可执行脚本代码。服务器告诉浏览器将这些信息存储,并且每个请求中都将该信息返回到服务器。服务器之后可以利用这些信息来识别用户。大部分需要登录的网站通常会在用户登录后将用户信息写入Cook...原创 2020-01-31 13:35:37 · 183 阅读 · 0 评论 -
请求头
请求头描述客户端向服务器发送请求时使用的协议类型、所使用的编码以及发送内容的长度等。客户端(浏览器)通过输入URL后确定等于做了一次向服务器的请求动作,在这个请求里面带有请求参数,请求头在网络爬虫中的作用是相当重要的一部分。请求头的参数如。(1) Accept: text/html,image/(浏览器可以接收的类型)。(2) Accpt-Charset: ISO-8859-1 (浏览器可以...原创 2020-01-30 14:26:28 · 314 阅读 · 0 评论 -
HTTP与HTTPS
http是一个客户端和服务器请求和应答的标准(TCP)。客户端是终端用户,服务器端是网站。通过使用Web浏览器、网络爬虫或者其他工具,客户端发起一个到服务器上指定端口的http请求。这个客户端叫用户代理(UserAgent)。响应的服务器上存储着资源,比如HTML文件和图像,这个服务器为源服务器,在用户代理和服务器中间可能存在多个中间层,比如代理、网关或隧道。通常由http客户端发起一个请求到服务...原创 2020-01-30 13:36:42 · 322 阅读 · 0 评论 -
反爬虫技术及解决方案
不同类型的网站都有不一样的反爬虫机制,判断一个网站是否有反爬虫机制需要根据网站设计架构、数据传输方式和请求方式等各个方面评估。下面是常用的反爬虫机制。用户请求的Headers。用户操作网站行为。网站目录数据加载方式。数据加密。验证码识别。网站设置的反爬虫机制不代表不能爬取数据。1、基于用户请求的Headers从用户请求的Headers反爬虫是最常见的反爬虫机制。很多网站会对He...原创 2020-01-29 17:06:35 · 952 阅读 · 0 评论 -
爬虫的搜索策略
1、深度优先搜索该策略在爬虫开发的早期使用的较多。目的是达到被搜索结构的叶节点(那些不包含任何超级URL的HTNL文件)。不断的爬取HTML文件中的URL,直到HTML文件中没有URL为止。深度优先搜索沿着HTML文件中的URL走到不能再深入为止然后返回到某一个JTML文件,再继续选择该HTML文件中的其他URL。当不再有其他的URL可选择时,说明搜索已经结束。优点是能遍历一个Web站点或者深...原创 2020-01-29 15:40:22 · 1966 阅读 · 0 评论 -
爬虫的原理及过程
通用网络爬虫一、实现过程如下图所示二、实现原理如下获取初始的URL。初始的URL地址可以人为的指定,也可以由用户指定的某几个或者某个初始爬取网页决定。根据初始的URL爬取页面并获得新的URL。爬取当前初始的URL地址中的网页信息后,解析网页信息内容将网页信息内容存储到原始数据库中,并且在当前获得的网页信息里面发现新的URL地址,存放到一个URL队列里面。从URL队列中读取新的URL,...原创 2020-01-28 00:00:19 · 1504 阅读 · 0 评论 -
了解网络爬虫
爬虫的定义网络爬虫是一种按照一定的规则自动地抓取网络信息的程序或者脚本。简单的说,网络爬虫就是根据一定的算法实现编程开发,主要通过URL实现数据的抓取和发掘。传统的爬虫有百度、Google、必应等搜索引擎,这类通用的搜索引擎都有自己的核心算法。同时这类通用搜索引擎也有一定的局限性:不同的搜索引擎对于同一个搜索会有不同的结果,搜索出来的结果未必是用户需要的信息。通用的搜索引擎扩大了网络覆盖...原创 2020-01-27 15:34:15 · 788 阅读 · 0 评论