自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 从零到入职-番外篇-Python-网络爬虫4

selenium 软件功能测试工具在环境中安装selenium依旧是选择spider环境,然后pip下载安装完成就会有成功提示然后我们就能在环境里面找到。第二部我们要安装浏览器驱动因为selenium是之际操作浏览器啊,所以要python操作浏览器的驱动程序进入之后他会有很多版本,我们需要下载跟自己浏览器版本一致的驱动。这里说一下,先找下面有没有跟你版本号完全一致的驱动程序,如果有,一定下载与版本号完全一致的驱动,如果没有就找最新的,然后进入点击notes看看是否支持你的版本

2020-12-23 21:51:24 149

原创 从零到入职-番外篇-Python-SQLite

轻量级数据库SQlite关系型数据库基于文件的数据库只要有文件就可以直接使用SQL语言SQL语言,结构化查询语言当然查看数据库之前是要先导入的不是选择第一个哈,是选择SQLite如果下面出现Download,就下载,如果没有就选择文件。...

2020-12-20 20:28:53 143 1

原创 从零到入职-番外篇-Python-网络爬虫3

Python对HTML解析Python对HTML的解析主要有以下几个库使用BeautifulSoup库使用XPath使用pyquery但是我们使用的一般是第一个库即bs说明一下,这个库实在Python基础库中找不到的,即不属于Python的基础库,是属于第三方的库,所以我们要去下载BeautifulSoup4库的安装安装第四版第一步是进入Anaconda的环境目录第二部是选择项目用的环境第三步是安装命令.安装过程,最后是一个验证。最后如果想卸载就pip uninstall

2020-12-18 15:33:53 108

原创 从零到入职-番外篇-Python-网络爬虫-两个很小的实例

直接上源代码'''纵横小说推荐榜'''from urllib.request import urlopendef get_one_page(index): url = 'http://www.zongheng.com/rank/details.html?rt=6&d=1&p={}'.format(index) # url = 'http://www.zongheng.com/rank/details.html?rt=6&d=1&p=%d'%

2020-12-17 16:32:07 125

原创 从零到入职-番外篇-Python-网络爬虫2

request的其他信息返回访问的urlrequest的头信息读取单个信息伪造头信息。这里先说明一下为什么要伪造头信息。打开一个百度主页。然后打开F12控制台找到这里,然后下滑User-Agent,就是访问时,用户的信息。而我们使用爬虫进行爬取某个网站,显示出来的用户信息是这样的。我们可以借助一个网站来看我们的访问用户信息,把网站放在这httpbin.org我们用爬虫访问网站就是返回这个结果,而一些网站就用这个来拒绝爬虫访问,所以我们要伪造头信息...

2020-12-17 11:10:02 129

原创 Java+大数据,从零到入职,第六周

Java中的数组将一些数据按照线性顺序连续存储的序列。这里的数据,是指一切可以存储的数据,不单单是指数字。数组是效率最高的访问和存储元素的一种方式数组的基本定义,除了八种基本数据类型,像String这种引用类型的变量也可以定义数组。数组的赋值这就是数组的完整的定义,至于new,这里就是另外的一种使用方式,它可以在后面紧跟数组的类型。中括号里面的数字的就是你数组的长度(即你可以填充的数据的个数)大括号里面的数据填充到数组中,数组的长度就是大括号元素的个数。第一种的方式数组的长度确定了,那

2020-12-16 13:33:06 128

原创 从零到入职-番外篇-Python-网络爬虫1

环境问题Python的第三方的库比较多,我们必须安装到Python环境中才能使用。所以我们的解决办法是为不同的项目配置不一样的环境例如我们的爬虫可以配置一个单独的环境。所以我们就用到了之前我们说过的一个Python的环境管理工具Anaconda3我们利用它创建一个完全单独的Python环境叫啥,我们是写网络爬虫,我这里就命名spider然后选择版本,我这里选择的是3.8版本,然后等他自己从服务器把Python环境下载完成即可。如果报错,从新来一次就好。如果可视化界面打不开咋办,

2020-12-13 19:28:20 104

原创 从零到入职-番外篇-Python-网络爬虫

工具准备Python环境 -> 建议用Anaconda浏览器 -> Chrome (它提供了强大的开发者工具)PycharmWeb应用(需要了解一下网络访问的全过程)HTML(超文本标记协议,组织网页结构内容)CSS(层叠样式表,页面的展示方式)JavaScript(弥补HTML,CSS的不足,为用户提供更丰富的交互模式)爬虫网络爬虫(网络蜘蛛、网络机器人)获取网络海量数据的方法买数据(操作简单,成本高,针对性不强)买服务(针对性比较强,灵活性不强)开发爬虫,跟

2020-12-13 18:10:13 159

原创 从零到入职-番外篇-Python-8

Python中的面向对象1.类是对现实事物的一种抽象描述的形式2.对象是类的具体化(实例化)但是如果你的类是继承来的,括号必须要有,因为你要指定父类。这里集中讲解一下None代表无法设置默认值,设置为空,因为python不像Java那样可以定义变量不设置初值第二个点,python类中的方法函数必须至少有一个参数,一般定义为self,用来描述指定对象创建对象,以及使用接下来我们讲讲self的作用,她到底是干啥。当用对象调用方法函数时,em就相当于self,或者说,self像相当于

2020-12-12 23:12:19 147 1

原创 从零到入职-番外篇-Python-7

流程控制与函数流程控制各个语言中,流程控制语句无非就三种1.顺序结构2.选择分支结构这里需要注意一下,在Python中,只有if……else结构提醒一下,在Python中书写代码一定要注意代码的缩进。3.循环结构这里为啥只说了一个循环结构呢,别着急,for很重要,并且他不算是严格意义上的循环结构列表也是一样的操作。我们着重讲一下字典的操作这里打印出来的是我们字典里面的键就相当于若果想遍历值两种写法最主要的是如何同时遍历键与值这里用到了一个我们前面没讲到的内置方

2020-12-11 21:46:36 111

原创 从零到入职-番外篇-Python-6

运算符算术运算符补充一下 乘可以用于字符串操作比较运算符赋值运算符逻辑运算符位运算符成员运算符身份运算符

2020-12-11 12:24:38 208 1

原创 从零到入职-番外篇-计算机网络-概述

计算机网络的早期发展进入21实际,我们进入了一个以网络为核心的

2020-12-11 11:21:45 447

原创 从零到入职-番外篇-Python-5

字典字典一种无序的集和。字典里面存放的数据是一种键值对(Key-Value)无序的集和就不能使用像列表一样的下标的方式访问元素,只能通过键和值的方式访问,即知道键(Key)访问值(Value),知道值(Value)访问键(Key)例如字典的访问1.通过键访问值2.通过值访问键这里说一种通过前面讲过的列表来实现当然你也可以写成一句他俩是等价的,不习惯写多点也没事。修改字典内的值例如删除某一个元素(移除键值对)如果不小心删除错误,字典的内置函数1.获取字典所有的键

2020-12-10 19:25:58 77 1

原创 从零到入职番外篇-服务器的配置与管理-DHCP

DHCP基本概念与工作原理Dynamic Host Configuration Protocol(动态主机配置协议)DHCP主要用于动态局域网主要作用:对IP地址进行集中的管理和分配,使网络环境中的主机,动态的获得IP地址、网关地址、DNS服务器地址等信息,提高IP地址的使用率。为什么要使用DHCP,每一台设备都是需要一个IP地址才能上网,人为的去分配IP肯定是行不通的,所以就需要利用DHCP去自动的分配IP、网关、DNS服务器等。当然在一个地方可能存在多个DHCP服务器,负责不同网段的IP地址

2020-12-10 18:25:32 236 1

原创 从零到入职-番外篇-Python-4

Python的数据类型标准数据类型1.数字2.字符串3.列表4.元组5.字典6.set集和数字类型1.整数 (Python中整数理论上没有表示范围,它的范围由计算机硬件决定)2.浮点数3.复数(Python中非常重要的一种类型) 表示数学概念上的复数 实数部分+虚数部分4.布尔型 表示布尔值 True False 是数字1和0的一种表示方式他们的定义方式:字符串类型字符串的定义的四种形式:...

2020-12-09 14:27:47 124 1

原创 从零到入职番外篇-服务器的管理与配置-2

虚拟机的相关知识与设置虚拟机概念:是指通过软件模拟的具有完整硬件系统功能的,运行在一个完全隔离环境中的完整的计算机系统。虚拟机系统概念:通过在虚拟机软件上生成现有操作系统的全新虚拟镜像,它具有真实Windows系统完全一样的功能。虚拟化概念:通过虚拟化技术将一台计算机虚拟为多台逻辑计算机。虚拟化技术概念:把计算机有限固定的资源根据不同的需求进行重新规划以达到最大利用率的思路。作用:扩大硬盘容量简化软件配置四种虚拟化技术:1.平台虚拟化:针对计算机和操作系统的虚拟化,又分为服务器虚拟

2020-12-09 10:33:48 121

原创 从零到入职-番外篇-Python-3

Python的关键字在Python中已经定义好的,具有某些特殊功能的单词。例如for while if elsePython中的关键字一般都是小写,除Ture,False。变量定义在程序中,程序运行过程,可以改变的量,不需要指定数据类型,使用之前必须先定义(这里的定义相对于其他语言的定义稍弱)。使用变量时,一定要 初始化这样就可以了。标识符变量的名字算是一种标识符。函数的名字,类的名字。规则:1.只能由字母、数字、下划线组成。2.不能以数字开头。3.标识符严格区分大小写(大小

2020-12-08 20:46:34 122

原创 Java+大数据,从零到入职,第五周

Java的流程控制语句顺序分支循环顺序语句(程序中最常见,也是出现最多的)顺序语句即从main主方法进入后,按照从左到右,从上往下的顺序,顺序执行。分支执行语句if……elseif 关键字(判断条件){}if 的作用范围即为其后面大括号范围。else的作用范围也为{}内部。if else的多分支结构,每个的作用域依旧是自己后面紧跟的{}内。if ……else结构可以把{}去掉,但是去掉{}之后,他们的作用域就从{}内部所有的语句变成了紧跟着的第一条语句。return

2020-12-08 19:40:03 100

原创 Java+大数据,从零到入职,第四周

Java的数据类型1.基本数据类型2.引用类型基本数据类型byteshortintlongfloatdoublecharboolean True/False这里需要注意一下,有些数据类型为了区分,所以有一个叫标志的东西比如float = 1.1 F;其他的还有long lg = 1L;double dl = 2.2D;有时候有些情况是不需要加标志的,比如double,因为浮点类型的数据默认的就是双精度浮点型。转义字符:\t 、 \n 、\ 、 \’ 、 \"。..

2020-12-08 12:11:27 128

原创 Java+大数据,从零到入职,第三周

Java的语法规则我们从新建一个Java文件开始我们定义(声明)相关的代码可以直接放在类体中。类体里面定义的东西(最基本的)变量的定义,方法的定义 。切记功能类的代码不可以直接放在类体中。变量的定义...

2020-12-05 12:47:21 112

原创 Java+大数据,从零到入职,简单的练习题

求三位数水仙花数具体要说的就是两个地方,一个是,import 导入其他的类方法,因为我们要用到数学上的三次幂,所以我们要导入math类第二个就是为什么要强制类型转换,我们都知道三位数不可能超出int 范围,但是Java不这么认为,三个三次幂,可能会超出int 的范围,所以要强制类型转换,不然会报错。如果想单行输出的话,println->print,当然单行输出得有空格隔开才好看,千万千万不要用单引号,要用双引号,因为单引号代表是一个字符,用单引号你会发现,输出的数字变化了,其实就是本应该

2020-12-04 19:26:36 146

原创 从零到入职番外篇-服务器的配置与管理

这部分内容是我大学选的网络安全方向学习的内容,当然也做得详细一点第一部分肯定也是学习前的准备,我们要准备啥呢1.当然是我们的运行的软件(涉及版权问题)2.然后就是咱们需要用到的Windows Server 2016镜像文件链接还是在下面接下来就是我们的服务器镜像文件链接: https://pan.baidu.com/s/17ZrDY46wdqmOWiOvtTz9P

2020-12-02 18:54:48 332

原创 从零到入职-Python-练习题

1.求水仙花数水仙花数就是他的每一位的三次幂加起来正好等于本身这里因为是刚开始,所以我们只求三位数的水仙花数。但是之后我们要写一个不管是几位的水仙花数都要求出来。2.求100以内的素数素数大家肯定都不陌生,我在这里就不解释了。这个就是看你的逻辑思维能力,俗话说就是脑子能不能转过来。跟第二题有点像,给定一个数,求他的所有因数因数这个概念我也不讲了,大家都知道。这个题很简单很简单,只要你能想到。这里说一下一个很重要的对于Python来说。这里Python的输入的格式是 x = inpu

2020-12-02 15:06:02 129

原创 从零到入职-番外篇-Python--2

我们从现在开始就是以一些实例来学习Python首先是求1-100的和那么python的书写要比C语言的代码量少很多,而且差别也是比较大的。这里呢,用到了一个循环,当然你也可以使用for循环,python是没有do–while循环的。for循环在这里显得更简单一些,但是,他用到的东西比while多,我们一步步来讲。Python是一种弱类型的语言,它不需要必须指定变量类型sum = 0;sum就是int类型sum = ‘abc’;sum就是String类型即你给他什么类型,他就是什么类型变量

2020-12-02 14:37:02 99

原创 Java+大数据,从零到入职,第二周

Java一些基础的必须知道的知识点我们在Eclipse书写的源代码文件一般被称为源文件,也可以叫(Java文件)。源文件里面存放的东西就叫源代码。而被编译器编译之后的生成的文件就叫-字节码文件,也叫(class文件)具体过程:源文件(Java文件)-JDK编译-字节码文件(Class文件)-JVM解析运行。咱们还是结合实际的来看一看这就是我们书写的源文件,也叫Java文件,如果自己试过利用命令来编辑运行Java代码的小伙伴,可能见识过class文件。因为我们是用开发工具,就不用非得去了解。

2020-12-01 20:40:42 426

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除