自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (2)
  • 收藏
  • 关注

原创 蓝桥杯真题——幸运树

问题描述幸运数是波兰数学家乌拉姆命名的。它采用与生成素数类似的“筛法”生成。首先从1开始写出自然数1,2,3,4,5,6,…1 就是第一个幸运数。我们从2这个数开始。把所有序号能被2整除的项删除,变为:1 _ 3 _ 5 _ 7 _ 9 …把它们缩紧,重新记序,为:1 3 5 7 9 … 。这时,3为第2个幸运数,然后把所有能被3整除的序号位置的数删去。注意,是序号位置,不是那个数...

2020-02-29 18:54:23 538

原创 蓝桥杯真题——买不到的数目

问题描述小明开了一家糖果店。他别出心裁:把水果糖包成4颗一包和7颗一包的两种。糖果不能拆包卖。小朋友来买糖的时候,他就用这两种包装来组合。当然有些糖果数目是无法组合出来的,比如要买 10 颗糖。你可以用计算机测试一下,在这种包装情况下,最大不能买到的数量是17。大于17的任何数字都可以用4和7组合出来。本题的要求就是在已知两个包装的数量时,求最大不能组合出的数字。输入格式两个正整数,表...

2020-02-29 13:31:19 556

原创 蓝桥杯真题——连号区间数目

小明这些天一直在思考这样一个奇怪而有趣的问题:在1~N的某个全排列中有多少个连号区间呢?这里所说的连号区间的定义是:如果区间[L, R] 里的所有元素(即此排列的第L个到第R个元素)递增排序后能得到一个长度为R-L+1的“连续”数列,则称这个区间连号区间。当N很小的时候,小明可以很快地算出答案,但是当N变大的时候,问题就不是那么简单了,现在小明需要你的帮助。输入格式第一行是一个正整数N ...

2020-02-29 10:50:54 168

原创 蓝桥杯真题——翻硬币,贪心算法

贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关。 [1]小明正在玩一个“翻硬币”的游戏。桌上放着排成一排的若干硬币。我们用 * 表示正...

2020-02-28 22:35:29 400

原创 蓝桥杯真题——错误票据

问题描述某涉密单位下发了某种票据,并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的,但ID的开始数码是随机选定的。因为工作人员疏忽,在录入ID号的时候发生了一处错误,造成了某个ID断号,另外一个ID重号。你的任务是通过编程,找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入格式要求程序首先输入一个整数N(N<100)表示后面数据行数。接...

2020-02-28 21:17:25 335

原创 一个将多线程多进程结合爬取图片网站的示例

在图片网站爬取图片时候,我们需要取得具体每张图片的url地址,然后下载到电脑保存下来。这其中,对时间消耗最多的步骤是保存图片到本地硬盘,机械硬盘的读写性能速度较慢。如果采取单线程单进程的话,在读写的同时没法进行其他的操作,只能等待,浪费了性能。对单个存有图片的页面而言,如果可以采取多线程的话,在写入图片的同时还能去请求新的图片地址保存到列表将会更合理的利用时间。因为图片网站,图片存放在很多页面...

2020-02-25 12:03:51 328

原创 我对软件工程之理解

作为一名本科大学生,他在大学期间所学的专业,很可能是本科毕业后的饭碗,或者是读研究生时所深造的领域。因此,认识自己的专业并深刻理解自己所学的专业是十分必要的,也是最基本的学习态度。对于软件工程的定义很多,在这其中我最欣赏喜欢的定义是:软件工程是应用计算机科学、数学、逻辑学及管理科学等原理,开发软件的工程。软件工程是计算机科学下的一个分支专业,我认为其主要培养的能力就是能够开发软件,而且开发出...

2020-02-24 17:17:18 468

原创 scrapy爬取某视频网站的部分视频信息

此次爬取的信息有:1、视频名称2、在线观看人数3、弹幕内容4、弹幕发送时间5、弹幕在视频中的位置6、点赞7、收藏8、投币数由于b站的很多信息是动态加载的。所以部分信息,需要自己抓包,进入对应的网址抽取信息。例如在线观看视频人数...

2020-02-09 18:52:30 682

原创 Scrapy爬取内容的入库操作(mongodb数据库)

电脑先预装MongoDB和数据库可视化软件robo3t,python下载pymongo库预先启动数据库可以自己写一个小脚本文件方便启动内容:E:\mongodb_64\bin\mongod.exe --dbpath E:\mongodb_64\data\db出现了等待连接的 27017端口时,说明启动成功打开可视化软件 robo3t 并连接数据库打开自己的pyc...

2020-02-05 11:51:32 316

原创 Scrapy的中间件Downloader Middleware实现User-Agent随机切换

爬虫的本质就是“抓取”第二方网站中有价值的数据,因此,每个网站都会或多或少地采用一些反爬虫技术来防范爬虫。比如通过 User-Agent 请求头验证是否为浏览器

2020-02-05 11:16:58 137

原创 Scrapy 框架介绍及入门

1. Scrapy 框架介绍Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy = Scrach+PythonScrapy用途广泛,可以用于数据挖掘、监测和自动化测试、信息处理和历史档案等大量应用范围内抽取结构化数据的应用程序框架,广泛用于工业Scrapy 使用Twisted 这个异步网络库来处...

2020-01-10 19:35:09 325

原创 Java制作学生管理系统,实现学生信息增删改查

技术要求1.将学生信息(学号,姓名,成绩)保存在集合中(可以先保存一部分,再添加新的;也可以后面录入。2.在控制台输入指令,系统可以对学生信息进行基本的增加、删除、修改、查询、对成绩进行排序然后输出3.像C语言题库里面的那种菜单式的系统,如输入1进行…操作,输入2进行…操作4.注意代码风格,命名规范,写上注释package StudentJavaSE;public class Stud...

2019-05-23 00:51:11 18307 4

原创 超详细的正则表达式

正则表达式概述概念正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑(可以用来做检索,截取或者替换操作)简介正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定...

2019-05-14 23:24:05 788

原创 史上最全的GIT简介及操作

史上最全的GIT简介及操作集中式版本控制软件分布式版本控制软件背景故事:Git下载安装使用前准备版本库暂存区分支常用命令文件添加操作文件删除操作文件修改操作文件撤销操作创建分支查看分支切换分支创建+切换分支合并某分支到当前分支删除某分支查看日志记录(以图形形式展现)1. 切换到当前分支12. 和分支2进行合并3. 执行第二步后出现冲突(CONFLICT)4. 解决方案:采用快进模式合并的缺陷采用非...

2019-05-08 16:09:39 157

原创 Web前端—基本结构的属性、基本元素、图片标签

基本结构中的属性定义HTML文档,这个元素浏览器看后就知道这个是个HTML文档,所以你的其他元素包裹在他的里面,标签限定了文档的起始点和结束点。在它们之间是文档的头部和主体。<html> <head> <title>我的第一个HTML页面 </title> </h...

2019-05-08 00:07:58 880

原创 Web前端—开发工具及HTML介绍、基本结构

开发工具推荐HTML介绍1.超文本标记语言(HyperText Mark-up Language)2.用来设计网页的标记语言3.用改语言编写的文件,以.html或.htm为后缀4.浏览器解释执行5.HTML不区分大小写,建议都小写HTML标签1.HTML用于描述功能的符号成为标签2.标签都封装在一对尖括号“<…>”之中,如就是一个标签3.非封闭类型标记,也叫作空标...

2019-05-07 09:57:40 554

原创 实现对任意百度贴吧的html爬取

爬取百度贴吧的代码from urllib.request import Request,urlopenfrom urllib.parse import quote#设置请求头,使用浏览器代理def get_html(url): headers={ "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:6...

2019-05-06 20:40:08 242

原创 设计模式——策略模式、解释器模式

策略模式策略模式:定义一系列算法,把它们一 一封装起来,并且使它们之间可以相互替换。此模式让算法的变化不会影响到使用算法的客户。举例:电商领域根据客户的属性或订单中的商品计算折扣。策略模式包含以下3个角色: Context(环境类) Strategy(抽象策略类) ConcreteStrategy(具体策略类)from abc import ABC, abstractmethodfro...

2019-04-23 15:15:20 488

原创 设计模式——代理模式、外观模式

代理模式代理模式作用:为其他对象提供一种代理控制对这个对象的访问。代理模式一般涉及的对象有:抽象对象:声明真实对象和代理对象的共同基类(接口)真实对象:代理对象所代表的真实对象,是我们最终要引用的对象代理对象:代理对象内部含有对真实对象的引用,从而可以操作真实对象,代理对象内部还有与真实对象共有的基类(接口),可以在任何时刻都能代替真实对象。代理对象可在执行对真实对象操作时,可以附加其它...

2019-04-23 14:19:44 287

原创 python代码上传github

背景:今天根据百度——pycharm上传代码到github,成功地第一次将代码上传到了github,但后续的上传出现了问题,于是选择用本地的powershell ,git上传代码。导航pycharm 操作实现代码上传:本地 操作实现代码上传pycharm 操作实现代码上传:1File->Settings->Version Control->Github 找到Github,输...

2019-04-23 00:14:44 1157

原创 设计模式——工厂模式与单例模式

设计模式是面向对象特有的内容,是我们在面临某一类问题时候固定的做法,设计模式有很多种,比较流行的是GOF(Goup of four)23种设计模式。初学者最常使用的模式 工厂模式和单例模式设计模式—工厂模式工厂模式实现了 使用者和调用者的分离,使用专门的工厂类将选择实现类、创建对象进行统一的管理和控制。#测试工厂模式#定义车工厂类class Carfactory: #定义生产...

2019-04-22 10:50:42 223

原创 Python——爬虫

爬虫基本操作*基本流程目标数据来源地址结构分析实现构思操刀编码*基本手段破解请求限制请求头控制控制请求书频率(根据实际情景)IP代理签名/加密参数从html/cookie/js分析破解登录授权请求带上用户cookie信息破解验证码简单的验证码可以使用识图验证码第三方库*解析数据HTML Dom解析正则匹配,通过的正则表达式来匹配想要爬取的数据,如有些数据不是...

2019-04-16 23:31:03 182

原创 网络基础——协议、socket

网络基础——协议作用:将世界范围的所有电脑都能连接ISO国际标准化组织根据TCP/IP协议簇功能不同,将它分为了几种层次-网络接口层(链路层)-网络层-传输层 TCP UDPsocket-应用层 应用进程-物理层-数据链路层-网络层-传输层-会话层-表示层-应用层互联网协议统称为 TCP/IP协议Socketsocket:通过网络完成进程间通...

2019-04-16 14:10:25 229

原创 网络通信——IP、子网掩码、端口号

IP:标记电脑在网络中的一串数字网络号:标识计算机处于哪个网络中,一个局域网 网络号一样。主机号:标识计算机是当前网络第几台。注意设置主机号时 0和255 不能用,0是无主机号,255是广播地址。A类地址范围1.0.0.1——>126.255.255.254 同一局域网可容纳电脑数:16777214B类地址范围128.1.0.1——>191.255.25...

2019-04-16 09:49:37 1714

原创 数据库的概述

一. 数据库简介1.数据管理技术发展人工管理文件管理数据库系统管理2.数据库相关概念*数据 描述事物的符号 例如:文本 图片 视频 音频…*数据库管理系统 对数据库中数据进行管理流行的关系型数据库有(oracle MySQL DB2 SQL Server)*数据库应用程序最终用户使用的应用程序,在数据库管理系统基础上,带有图形化界面的应用程序*数据库管理人员对数据库系统操作...

2019-04-15 11:46:53 514

proxy_pool-master.zip

https://codeload.github.com/jhao104/proxy_pool/zip/master

2020-02-23

Student.class

1将学生信息(学号,姓名,成绩)保存在集合中(可以先保存一部分,再添加新的;也可以后面录入。) 2在控制台输入指令,系统可以对学生信息进行基本的增加、删除、修改、查询、对成绩进行排序然后输出 3像C语言题库里面的那种菜单式的系统,如输入1进行...操作,输入2进行...操作 4注意代码风格,命名规范,写上注释

2019-05-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除