- 博客(31)
- 收藏
- 关注
原创 python网络爬虫三Re正则表达式库及应用实例
导学Re正则表达式库的基本使用以及实例代码分析单元7:Re(正则表达式)库入门正则表达式的概念regular expression RE用来简洁表达一组字符串的表达式。# 'PY'# 'PYY' 等价于 PY+# 'PYYY' 正则表达式的语法主要操作符语法实例Re库的基本使用正则表达式的表示类型raw string类型(原生字符串类型,不包含对转义符再次转义的字符串)表示:r’text‘类如:r’[1-9]\d{5}’ 表示邮
2021-11-27 22:44:25 528
原创 python爬取淘宝页面cookie requests库和re正则表达式库 (最新) 中国大学MOOC嵩天Python网络爬虫与信息提取cookie
爬取淘宝商品信息时必须获取cookie,因为淘宝有反爬虫机制!!!**淘宝爬虫机制查看:**https://www.taobao.com/robots.txt我们需要headers标签修改我们的cookie,让爬虫像人一样搜索页面此处以爬取书包信息为例import requestsimport redef getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_sta
2021-11-27 21:14:41 4464 5
原创 python网络爬虫三BeautifulSoup库 及其实例操作
导学requests库与beautiful soup库结合使用解析html页面安装命令pip install beautifulsoup4单元4:Beautiful Soup库入门beautifulsoup4库的安装演示hmtl页面地址:http://python123.io/ws/demo.html识别出源代码import requestsr = requests.get('http://python123.io/ws/demo.html')print(r.text)解析出的html
2021-11-26 22:49:53 1009
原创 编译原理二词法分析
lex快速入门一.Lex 代表 Lexical Analyzar。Lex 是一种生成扫描器的工具。扫描器是一种识别文本中的词汇模式的程序。这些词汇模式(或者常规表达式)在一种特殊的句子结构中定义,这个我们一会儿就要讨论。一种匹配的常规表达式可能会包含相关的动作。这一动作可能还包括返回一个标记。当 Lex 接收到文件或文本形式的输入时,它试图将文本与常规表达式进行匹配。它一次读入一个输入字符,直到找到一个匹配的模式。如果能够找到一个匹配的模式,Lex 就执行相关的动作(可能包括返回一个标记)。另一方面,如
2021-11-26 13:05:19 492
原创 编译原理一导学
本实验面向的是本科阶段的编译原理课程设计,主要应用lex&yacc来实现我们自定义的一种Tiny语言的编译器。一.实验内容本学期的编译实验内容是实现一个简单的TINY语言的编译器。这个编译器的输入是TINY语言源代码,输出为自定义汇编语言。整个编译器又分为词法分析、语法分析、语义分析、汇编代码生成四部分。二.实验环境Windows操作系统,集成调试环境采用VC++或vs 2010。编程语言是Lex扫描程序生成器(Flex),Yacc分析生成器(Bison)。最后生成TINY语言的编译器。
2021-11-26 12:46:04 452
原创 操作系统实验-动态资源分配
一、实验目的要求通过编写和调试一个系统动态分配资源的简单模拟程序,观察死锁产生的条件,掌握死锁产生的原因和必要条件以及银行家算法的实现。二、实验材料和仪器设备Windows操作系统环境下的个人微机。三、实验内容设计一个3进程共享10个资源的系统,进程可动态地申请和释放资源,系统利用银行家算法对进程运行过程中提出的资源请求进行检查,若分配后,系统处于安全状态则满足请求,否则拒绝申请。程序要求:为了清楚地观察资源分配过程,程序中应有显示或打印各进程依次要求申请的资源号以及依次分配资源的情况,程序最终
2021-11-26 12:24:55 3797 8
原创 操作系统实验-单处理机系统的进程调度
一、实验目的要求通过模拟进程控制方法和单处理机系统下的进程调度,了解进程的结构、进程的创建与撤销,进程的组织及进程的状态及其转换,掌握进程调度策略。二、实验材料和仪器设备Windows操作系统环境下的个人微机。三、实验内容实现对N(N的值不小于5)个进程采用动态优先权优先算法的进程调度。注意:本实验为单机模拟进程调度算法,在程序设计时不需真正地建立线程或进程。程序要求:为了清楚地观察诸进程的调度过程,程序中应有显示或打印语句,能显示或打印每次被选中进程的进程名,以及运行一次后进程队列的变化。打
2021-11-26 12:21:33 3852
原创 Python网络爬虫二requests库
#requests库的学习与应用实例导学Request:自动爬取HTML页面自动网络请求提交robots协议:网络爬虫排除标准Projects:实战项目单元1:Requests库入门Requests库安装:pip install requestsget() head()最常用get()方法import requestsr = requests.get("url")#get->request:构造一个向服务器请求的资源的Requests对象#response->r:返
2021-11-25 22:39:25 429
原创 Python网络爬虫一导学
导学掌握定向网络数据爬取和网页解析的基本内容Request:自动爬取HTML页面自动网络请求提交robots.txt:网络爬虫排除标准Beautiful Soup:解析HTML页面Projects:实战项目Re:正则表达式详解 提取页面关键信息Scrapy:网络爬虫原理介绍 专业爬虫框架介绍Python语言开发工具选择常用的Python IDE工具文本工具类IDLE(本身自带的编译器)Sublime Text(专为程序员开发的第三方专用编程工具)集成工具类Py
2021-11-25 22:31:16 461
原创 c++ 标准库(vector)
c++中的一个容器它能够像容器一样存放各种类型的对象,简单地说,vector是一个能够存放任意类型的动态数组,能够增加和压缩数据。实例:vector<int>test;//建立一个vector,int为数组元素的数据类型,test为动态数组名.基本操作函数(1)头文件#include<vector>.(2)创建vector对象,vector<int> vec;(3)尾部插入数字:vec.push_back(a);(4)使用下标访问元素,cout<&l
2021-11-19 15:20:13 222
原创 c++标准库(queue)
queue的核心接口主要由成员函数push(),front(),back(),pop()构成;push():会将一个元素置入queue中;front():会返回queue内的第一个元素(也就是第一个被置入的元素)back():会返回queue中的最后一个元素(也就是最后被插入的元素)pop():会移除queue内的第一个元素(也就是第一个被置入的元素)...
2021-11-17 09:39:22 3804
原创 节日快乐!
1024程序员节是广大程序员的共同节日。1024是2的十次方,二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况,部分互联网机构倡议每年的10月24日为1024程序员节,在这一天建议程序员拒绝加班。程序员就像是一个个1024,以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M,而1G与1级谐音,也有一级棒的意思。...
2021-10-24 11:08:39 126
原创 Vue超详细学习笔记
VUE1.前端三要素HTML(结构):超文本标记语言(Hyper Text Markup Language),决定网页的结构和内容CSS(表现):层叠样式表(Cascading Style Sheets),设定网页的表现样式JavaScript(行为):是一种弱类型脚本语言,其源代码不需经过编译,而是由浏览器解释运行,用于控制网页的行为。结构层(HTML)表现层(CSS)CSS 层叠样式表是一门标记语言,并不是编程语言,因此不可以自定义变量,不可以引用等,换句话说就是不
2021-02-08 22:39:56 492
原创 JS超详细学习笔记
1.什么是JavaScript1.1概述JavaScript一门世界上最流行脚本语言。一个合格的后端人员,必须精通JavaScript。1.2历史ECMAscript它可以理解为JavaScript的一个标准,最新版本已经到es6版本,但是大部分浏览器还只停留在支持es5代码上!开发环境—线上环境,版本不一致。2.快速入门2.1 引入JavaScript1.内部标签<script> //....</script>2.外部引入abc.js//...
2021-02-08 22:36:00 448
原创 Java数组
7.1数组的定义数组是相同类型数据的有序集合。数组描述的是相同类型的若干个数据,按照一定的先后次序排列组合而成。每一个数组称作一个数组元素,每个数组元素可以通过一个下标来访问他们7.2数组的声明和创建首先必须声明数组变量,才能在程序中使用数组。 int[] nums;Java语言使用new操作符来创建数组int[] nums=new int[10];数组元素是通过索引访问的,数组索引从0开始获取数组长度; arrays.lengthpublic clas
2021-01-20 21:09:01 184 1
原创 Java方法
6.1何谓方法?Java方法是语句的集合,他们在一起执行一个功能方法是解决一类问题的步骤的有序组合方法包含于类或对象中方法在程序中被创建,在其他地方被引用设计方法原则方法本意是功能块,就是实现某个功能的语句块的集合。设计时尽量保持方法原子性(就是一个方法只完成一个功能)这样有利于我们后期的扩展。方法命名规则首字母小写+驼峰命名规则6.2方法的定义和调用调用方法:对象名.方法名(实参列表)Java的方法类似于其它语言的函数,使用一段代码片段完成特定功能。修饰
2021-01-20 21:06:59 161
原创 Java流程控制
1.用户交互Scanner之前我们学的基本语法中我们并没有实现程序和人的交互,但是Java给我们提供了这样一个工具类,我们可以获取用户输入。java.util.Scanner是Java5新特征,我们可以通过Scanner类获取用户的输入基本语法Scanner s=new Scanner(System.in);通过Scanner类的next()与nextline()方法获取输入的字符串,再读取前我们一般需要使用 hasNext()与hasNextLine()判断是否还有输入的数据。pack
2021-01-20 21:05:17 104
原创 CSS3超详细学习笔记
一.什么是CSS前提HTML+CSS+JavaScript=结构+表现+交互1.CSS的简单介绍如何学习?css是什么css怎么用(快速入门)CSS选择器(重点+难点)美化网页(文字,阴影,超链接,列表,渐变…)盒子模型浮动定位网页动画(特效效果)2.什么是CSS和发展史Cascading Style Sheet 层叠级联样式表CSS:表现(美化网页)字体,颜色,边距,高度,宽度,背景图片,网页定位,网页浮动发展史:css1.
2021-01-19 10:10:10 713
原创 Html5超详细学习笔记
1初识HTMLHTMHyper Text Mark-up Language (超文本标记语言)超文本包括文字,图片,音频,视频,动画等。优势世界知名浏览器厂商对HTML5的支持微软google苹果市场需求跨平台W3CW3C标准包括结构化标准语言(html,xml)表现标准语言(css)行为标准(dom,ecmascript)html基本结构2网页基本信息3网页基本标签标题标签段落标签换行标签水平线标签字
2021-01-19 10:05:21 185
原创 git的基本使用
1.前言之版本控制版本控制是一种在开发的过程中用于管理我们对文件,目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。实现区域多人协同开发追踪和记载一个或多个文件的历史记录统计工作量并行开发,提高效率组织和保护源代码和文档简单来说用于管理多人协同开发项目和技术.2.Git和SVN的区别常用的版本控制工具Git(当下最流行)SVNCVSVSSTFS版本控制分类本地版本控制(适用于个人)集中版本控制(集中放到一个中央服务
2021-01-19 10:02:57 112
原创 Java预科
一.Markdown的基本使用标题二级标题三级标题四级标题字体hello,world!hello,world!hello,world!hello,world!引用选择kk,走向人生巅峰分割线图片!截图1! 截图2超链接点击跳转到kk的CSDN博客列表ABAB表格名字性别生日kk男20010227代码publichello二.电脑常用快捷键键盘功能键:Tab Shift Ctrl Alt 空格 E
2021-01-19 09:55:14 122 1
原创 Java基础
1.注释平常编写代码,代码量少的时候能直接看懂,但是当项目结构一旦复杂,这是需要注释.注释不会被执行.分为 单行注释 // 多行注释/* / 文档注释/* */2.标识符关键字[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JzjloWje-1611021090930)(C:\Users\HQKJ\AppData\Roaming\Typora\typora-user-images\image-20201216104819600.pn
2021-01-19 09:52:18 127
原创 Draw.io的使用
draw.io介绍draw.io 是一个强大简洁的在线的绘图网站,支持流程图,UML图,架构图,原型图等图标。支持Github,Google Drive, One drive等网盘同步,并且永久免费。如果觉得使用Web版不方便,draw.io 也提供了多平台的离线桌面版可供下载。在线版:https://www.draw.io/PC电脑版:http://t.cn/Aid48ecf使用首先将语言设置为中文。中文模式下基本操作通俗易懂此处为流程图基本图片样式,直接拖动拽用就行,可以通
2021-01-08 14:00:27 2518 2
原创 Xmind的基本使用
思维导图及其作用思维导图又叫心智导图是表达发散性思维的有效的图形思维工具 ,它简单却又很有效,是一种革命性的思维工具。思维导图运用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接。无论是在工作还是生活中,我们都希望达成一个关键目标——提高学习、记忆和记录信息的能力。思维导图的放射性结构反映了大脑的自然结构,它让以笔记形式出现的思想快速扩展,从而得到一张清晰准确的图形。让想法就可以很快而且非常深刻地生发出来,同时又能清晰地集中于中心主题。这种制作技巧
2021-01-08 13:59:23 391
原创 markdown
Markdown的基本使用标题二级标题三级标题四级标题字体hello,world!hello,world!hello,world!hello,world!引用选择kk,走向人生巅峰分割线图片!截图1! 截图2超链接点击跳转到kk的CSDN博客列表ABAB表格名字性别生日kk男20010227代码publichello...
2021-01-08 13:58:11 97
原创 基本运维及协同开发.git的基本使用
1.前言之版本控制版本控制是一种在开发的过程中用于管理我们对文件,目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。实现区域多人协同开发追踪和记载一个或多个文件的历史记录统计工作量并行开发,提高效率组织和保护源代码和文档简单来说用于管理多人协同开发项目和技术.2.Git和SVN的区别常用的版本控制工具Git(当下最流行)SVNCVSVSSTFS版本控制分类本地版本控制(适用于个人)集中版本控制(集中放到一个中央服务
2021-01-07 21:14:36 168
原创 java入门
java的发展:java在c/c++的环境下开发出来的一种语言,亦称c+±-。java平台java开发的平台,系统,工具。构建工具 ant,Maven, kekins等。应用服务器 tomcat等。web开发 spring 等。开发工具 ecllpse, netbean, idea 等。hadoop。android。Java的特性与优势简单性面向对象可移植性多线程高性能 分布式 动态性 安全性 健壮性java的三大版本write once,run anywhere
2020-12-15 08:55:18 186
原创 基本的dos命令
打开CMD的方式开始+系统+命令提示符win键+r 输入cmd打开控制台(推荐使用)资源管理器的地址栏前面加上cmd路径管理员方式运行开始+系统+命令提示符+右键以管理员方式运行常用的Dos命令1. #盘符切换 大写字母+: C:2.#查看当前目录下的所有文件 dir cd+出现出来的名字可转换3.#切换目录 cd change directory4.cd ..返回上一级5.#清理屏幕 cls6.#退出终端 exit7.#打开ip地址 ipconfig8.
2020-12-14 13:28:20 112
原创 windows常用命令
电脑常用快捷键键盘功能键:Tab Shift Ctrl Alt 空格 Enter Window键盘快捷键:kk说java,努力提供最优质内容ctrl+c 复制ctrl+x 剪切ctrl+v 粘贴ctrl+a 全选ctrl+z 撤销ctrl+s 保存alt+f4 关闭shfit+delete 永久删除windows +r 搜索键windows +tab 切换应用windows +e 打开我的电脑ctrl+alt+delete 打开任务管理器...
2020-12-14 13:27:42 124
原创 markdown基本使用
Markdown的基本使用标题二级标题三级标题四级标题字体hello,world!hello,world!hello,world!hello,world!引用选择kk,走向人生巅峰分割线图片!截图1! 截图2超链接点击跳转到kk的CSDN博客列表ABAB表格名字性别生日栾学宏男20010227代码publichello...
2020-12-14 12:24:50 118
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人