- 博客(214)
- 资源 (27)
- 收藏
- 关注
原创 01背包问题的最优方案数
有n件物品(假设编号为从1到n),每件物品的重量为w_i,价值为c_i。现在需要选出若干件物品放入一个容量为V的背包中(每件物品至多选一次),使得在选入背包的物品重量之和不超过容量V的前提下,让背包中物品的价值之和最大,求最大价值与对应的最优方案。
2023-03-31 11:41:07 1285 1
原创 动态规划问题中边界和边界值的确定
在动态规划问题中,首先需要抽象出原问题的状态,然后写出状态转移方程,最后根据边界状态值和转移方程求解所有的状态。在本文中,我们将以01背包问题为例来探讨分析如何确定边界状态和边界状态值。
2023-03-29 10:20:56 866
原创 命名实体识别和情感分类项目总结
命名实体识别(Named Entity Recognition,NER)是NLP中一项非常基础的任务。NER是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。命名实体识别的准确度,决定了下游任务的效果,是NLP中非常重要的一个基础问题。情感分析(sentiment analysis)是近年来国内外研究的热点,其任务是帮助用户快速获取、整理和分析相关评价信息,对带有情感色彩的主观性文本进行分析、处理、归纳和推理。本文将依赖银行评论数据集,对评论数据的命名实体识别和情感分类课题做详尽报告。
2023-03-23 13:45:13 1415
原创 Java读写文件时的GBK和UTF8转换问题
文件中的文本以UTF-8的编码方式存储,在Java程序中以GBK的编码方式从文件中读入,最后再将读入的内容转换为UTF-8编码,即。这种操作方式能正确读入文件中的内容吗?
2022-11-26 23:30:20 7749
原创 纳什均衡求解器
本次实验要求使用Python语言在给定代码框架下编程求解纳什均衡 (Nash Equilibrium, NE), 包括纯策略 NE 与混合策略 NE, 并提交相应源码、输出文件以及实验报告。本次大作业要求我们用Python语言写一个纳什均衡求解器,除 Python 标准库外, 仅允许额外引入Numpy和Scipy两个包。Numpy是一个用于科学计算的基础包,使用它可以提高我们代码运行的效率;Scipy是一个用于执行数学、科学和工程计算的python开源代码,我们会用到它的模块求解线性规划问题,用到它的模块求
2022-11-11 10:47:40 2875 1
原创 关联规则挖掘(南京大学复杂数据结构挖掘课程作业)
本次实验的主要任务是对给定数据集进行关联规则挖掘。通过改变support和confidence的值,比较Aprioir、FP-growth和最基本的穷举法之间的差别,在进行比较时,主要着眼于产生的频繁项集的数目,算法运行过程中的内存消耗和时间消耗。
2022-03-18 10:36:27 2553 1
原创 使用Charles抓取百词斩单词音频、单词翻译、例句音频、例句翻译
本文将会带领大家抓取百词斩任意词书(比如六级词汇、考研词汇等)的单词信息,包括但不限于单词的拼写,单词的音频,单词的中文含义,例句原文,例句的中文翻译,例句的音频等。总而言之,你在百词斩APP上所能看到的所有与某个单词有关的信息,都可以抓取下来。音频以mp3的格式保存,其余信息以文本的形式保存。
2022-03-17 10:41:07 5823 1
原创 用Numpy手写多层感知机神经网络(MLP)
这是在python下,用Numpy手写的多层感知机神经网络,包括前向传播过程,后向传播过程,多种激活函数和多种损失函数。本代码所用的测试数据集为mnist,当使用MSE损失函数,Sigmoid激活函数时,我用numpy实现的神经网络和用pytorch实现的神经网络完全相同。
2022-02-20 11:01:50 6488 3
原创 GlidedSky爬虫-雪碧图1
题目描述题目链接:http://glidedsky.com/level/crawler-sprite-image-1题目分析 还是像之前的题目一样,先看一下数据页的源代码,如下图所示。 源代码中没有任何数据,但是我们注意到每个内层的div标签的class属性都有两个值,一个是sprite,另一个的名称不固定,看起来像是随机生成的。那么我们先在源代码中搜索一下sprite,看看这个class属性是怎样的,搜索结果如下图所示。 可以很清楚的看到,sprite是用来显示背景图片的,并且要显示
2021-08-02 17:04:28 504
原创 GlideSky爬虫-JS加密1
题目描述题目链接:http://glidedsky.com/level/crawler-javascript-obfuscation-1题目分析 不管是爬取什么网站,我们要做的第一件事一般是看一下这个网站的源代码,所以我们在数据页右键,选择查看网页源代码,如下图所示。 出乎意料的是,这个网站的源代码中竟然什么数据也没有,而且每个div标签的class属性都是相同的,所以可以排除在前端上做手脚的可能性,那么下面我们就看一下在加载数据页时,会有哪些网络请求。首先按F12快捷键打开开发者工具,然后
2021-07-27 22:15:07 475
原创 GlidedSky爬虫-验证码1
题目描述题目链接:http://glidedsky.com/level/crawler-captcha-1题目分析 本题在每个数据页中都加了一个滑动拼图验证码,要想获取页面的数据,首先必须得完成拼图。滑动拼图验证码对于人类来说难度不大,但如果想要让程序也能通过验证,那么就必须得模拟人类的行为。识别验证码需要完成如下三步。 (1)模拟点击拖动按钮 (2)识别滑动缺口的位置 (3)模拟拖动滑块 第(1)步操作非常简单,我们可以使用selenium很轻松的模拟点击某个元素的操作。第(3)
2021-07-17 13:17:23 467 1
原创 GlidedSky爬虫-CSS反爬
题目描述题目链接:http://glidedsky.com/level/crawler-css-puzzle-1题目分析 爬虫一般都是从网页的源代码中提取数据,因此本题我们也是先看一下数据页的源代码。将光标移动到数据页的数字上面,右键选择检查元素,可以看到对应数字的源代码,如下图所示。 我查看的是数字322的源代码,上图中的查看结果有点意外。我们再多找几个数字看一下他们的源代码,当查看数字285的源代码时,又出现了比较意外的结果。源代码如下图所示。 在做字体反爬1时,虽然源代码中看到的
2021-07-15 19:11:22 520 1
原创 GlidedSky爬虫-字体反爬2
题目描述题目链接:http://glidedsky.com/level/crawler-font-puzzle-2题目分析 和上一道字体反爬题相比,本题中使用到的字体会更多,因此在构造从字体图像到真正的数字之间的映射时会麻烦许多,但是一旦这个映射关系构建完成之后,剩下的就和上一道字体反爬题一样了。有关字体文件的内容已经在字体反爬1中介绍过了,如果对字体没有了解,可以翻阅我的字体反爬1的讲解,本文不再赘述。文章地址为:点我查看 我们首先打开要爬取的数据页,看一下它的源代码,如下图所示。 在
2021-07-13 14:35:36 660
原创 GlidedSky爬虫-字体反爬1
题目描述题目链接:http://glidedsky.com/level/crawler-font-puzzle-1题目分析 我们首先看一下这道题与之前的题目有什么不同,前面的几道题不管用了哪种反爬手段,都是可以直接从源代码中提取数字的,但是这道题却不可以。将光标放到数字上,右键选择检查元素,可以看到数字的源码,源代码中显示的数字和我们在网页中看到的数字并不相同,且每次刷新页面时,网页上的数字不变,源代码中的数字会发生变化,因此本题的字体是动态映射的,无法通过事先构造映射表的方式来爬取。 我们看
2021-07-12 19:09:55 557 2
原创 GlidedSky爬虫-IP屏蔽2
题目描述题目链接:http://glidedsky.com/level/crawler-ip-block-2题目分析 这道题和第一道IP屏蔽题差不多,只不过是把别人使用过的IP也给封禁了,但是对于我们编码来说是没有什么区别的,只是消耗的IP数量会比第一道IP屏蔽题多一点。在做第一道IP屏蔽题时就发现,使用代理IP偶尔会出现403禁止访问的情况,因此我加了个判断状态码的操作,如果请求数据页的状态码不是200,那么就换一个IP重新请求,直到返回的状态码为200为止。详细解题过程可以查看我写的第一道IP
2021-07-09 18:12:03 298
原创 GlidedSky爬虫-IP屏蔽1
题目描述题目地址:http://glidedsky.com/level/crawler-ip-block-1题目分析 本题是一道关于ip代理的题目,要想解决此题,必须获取大量的IP地址。目前网络上有很多免费的代理,但是经过我的测试,这些代理的可用性不强。提供付费代理的公司也有很多,但是大多价格不菲,我们没有必要为了做这一道题而花费大量的钱财。我最终选择的方案是使用付费代理公司的新用户免费使用服务,芝麻IP代理为新注册的用户提供了24小时10000个代理的体验服务,可以很好的满足本题对代理的使用需求
2021-07-08 08:39:28 507 1
原创 GlidedSky爬虫-基础2
题目描述题目分析 第二题和第一题的区别在于,第一题把所有的数据都放在了同一页面上,而第二题把数据放到了1000个页面上,其余的像页面的解析都是相同的。在爬取的时候,第一题只请求了一次数据页,本题需要循环请求1000次数据页,那么就需要1000个url,下面来看一下如何得到这1000个数据页的url。 首先进入待爬取的网站,可以从浏览器的地址栏看到当前页面的地址,如下图所示。 从这个地址中好像没有看出规律性的信息,那么点击下一页,看看地址会发生什么变化,第二页的地址如下图所示。 相比第
2021-07-06 13:19:02 339
原创 GlidedSky爬虫-基础1
题目描述题目链接:http://glidedsky.com/level/crawler-basic-1题目分析 第一个题目相对来说比较简单,可能就是模拟登录的时候需要稍微分析一下,下面就详细的分析一下登录过程。 首先打开登录界面:http://glidedsky.com/login,按F12唤起开发者工具,选中Network选项卡,并且勾选Preserve log复选框,随便输入账号和密码,点击登录,这时会在开发者工具中看到浏览器发出了很多请求,这其中就包含了登录请求,因为账号密码都是随便输入
2021-07-05 12:58:12 507
原创 python爬虫模拟登录学校教务系统(青果教务系统)并查询个人成绩
全文简介 本文介绍用python模拟登录中国海洋大学教务系统的方法,此系统为湖南青果软件公司开发,因此如果你学校的教务系统也是青果开发的,那么此文对你的模拟登录也会有一定的借鉴意义。全文总共包含4部分,登录过程分析部分会详细分析我们在浏览器中输入账号和密码进行登录请求时,会向服务器发出哪些请求,以及请求的参数是如何构造的;验证码识别部分会介绍如何使用百度的OCR来进行验证码的识别,以实现程序的自动化操作;成绩查询部分是当我们用程序登录进教务系统之后,模拟查询成绩的操作,此处会用到execjs来在pyth
2021-07-03 19:52:21 5438 9
原创 我的python爬虫学习之路
很早之前就想学一下爬虫,但是一直没学成,这次终于趁着做完毕设的这段时间,把基于python的爬虫学了一下,现在记录一下我的学习之路,以供想学习爬虫的新手参考。 虽然在写爬虫程序之前没有用过python,但是很久之前读过一本python教程,所以也就没有再去系统的学习python,而是直接学习爬虫,遇到看不懂的语法时现百度。我读的第一本爬虫书籍是Ryan Mitchell著,陶俊杰、陈小莉译的《python网络数据采集》,这本书比较适合新手入门,总共才28万字,用不了几天就可以看完,虽然看完之后对于大
2021-06-30 21:29:10 853 5
原创 2020同济大学电子与信息工程学院计算机系夏令营机试题目
第一题:签到题(10分)题目要求:键盘依次输入 4 个字符串,分别是临时学号、姓名、报考类别和本科学校,按右对齐方式输出,要求其中最长的字符串输出时左边无空格,4 行的冒号对齐,冒号为半角字符,前后各一个空格输入要求:1、四个字符串均不含空格,长度不超过 402、不考虑输入错误输出要求:1、共四行,不要有多余的空行2、每行最后无多余的空格或其它字符输入示例1:输出示例1:输入示例2:输出示例2:源代码#include<bits/stdc++.h>using
2020-11-26 15:38:02 6791 7
原创 2020北航计算机夏令营机试题目讲解
一、二叉树(60分) 给你一个整数序列,用这些数构成一个完全有序二叉树,现在需要输出此二叉树的层序遍历序列。题目解析等我以后再写,一定尽快源代码#include <bits/stdc++.h>using namespace std;int arr[105];queue < pair<int, int> > q;pair<int, int> p1, p2;void root(int n, int r) {//n是序列的长度,r是此序列最右边
2020-10-26 08:44:41 6664 14
原创 Codeblocks17.12编译器的Debug教程
#include<stdio.h>#include<math.h>bool IsPrime(int n){ int t = sqrt(n); for(int i = 2; i <= t; i++) { int r = n % i; if(r == 0) return false; } return true;}int main(){ int i, n;
2020-10-25 13:49:17 9020 5
原创 2020保研夏令营——无科研无竞赛的夏令营之旅
个人情况:学校:中国海洋大学(末9)专业:计算机科学与技术前五学期平均学分绩:91.998前五学期成绩排名:1/156六级:467获奖:只有学习奖学金,无国奖其他:和物理系的同学参加过一项国创,此项目中写的软件申请到了软件著作权 夏令营投录情况:南开大学人工智能学院:入营,群面被刷南京大学人工智能学院:优营中国人名大学信息学院:入营,无offer中山大学数据科学与计算机学院:优营,但今年中大好像是只要参加面试就有优营同济大学电子与信息工程学院:优营北京航空航天大学计算机学
2020-10-17 21:15:51 22465 30
原创 机器学习优化中的交叉熵及改进形式
机器学习优化中的交叉熵及改进形式 【摘要】目前分类问题广泛的应用到我们的实际生活中[1],因而我们应该研究如何分类,研究它的算法。交叉熵通常在机器学习的分类问题中用作损失函数来判断分类模型的优劣,即把交叉熵当做损失函数。在实际的使用过程中,有时会不加区分交叉熵和相对熵,或者说用交叉熵代替相对熵。本文将从三个方面对机器学习优化中的交叉熵进行综述,分别是交叉熵的定义和理论推导,交叉熵的适用性分析,利用交叉熵办法的各种改良方式。 关键词:交叉熵、机器学习、改进的交叉熵Cross-entropy and
2020-09-29 13:46:30 4127
原创 傅里叶变换在图像滤波中的应用
傅里叶变换在图像滤波中的应用1回顾傅里叶变换 首先回顾一下在《信号与系统》这门课中主要学习了什么。在第一章中,学习了与信号和系统的数学表示有关的某些基本概念,特别练习了信号的某些变换(如时移和尺度变换),接着又学习了几个非常重要的基本连续时间信号和离散时间信号(复指数信号、单位冲击阶跃等),最后学习了系统的六个基本性质,如线性、时不变性等。第二章建立在上述两个性质的基础之上,即线性时不变系统LTI,学习了如何计算LTI系统的卷积以及卷积的性质。最后,介绍了一些奇异函数(阶跃、冲击和冲击偶等)及其在描述
2020-09-26 17:44:18 6342 2
原创 VS2019安装和使用教程
提示:安装过程请保持网络流畅。首先需要去官网下载安装工具:点击此处跳转跳转到官网后,如下图所示,点击社区模块的免费下载,之后应该会自动下载安装工具,如果没有自动下载,可以根据提示手动操作。从浏览器的下载位置中找到下载好的安装工具,如下图所示,双击运行安装。等待其下载必要的文件,如下图所示。下载完成之后会自动安装,安装完毕后会出现如下图所示的界面。因为我们现在只用来写C语言程序,因此在工作负载中只勾选“使用C++的桌面开发”这一项就可以了,如下图所示。点击安
2020-09-21 22:05:14 16211 1
原创 二进制逆向实验——寻找flag
博文中所用程序:点我下载提取码:xlfqlab1-1: 第一道题目主要是用来熟悉IDA的使用的,不涉及太复杂的逆向问题,只是一个简单的字符串比较。通过阅读经过反汇编之后的汇编码,可以发现,待比较的字符串被放到了栈中,如下图所示。这些字符串的十六进制表示为666c61677b57656c636f6d655f74305f73656375726974795f6330757273657d,可以看到,我这儿给出的十六进制和代码中的十六进制还是有一些差别的,产生这种不一致的主要原因是大端模式和小端模式的区
2020-09-19 18:08:57 6710 1
原创 栈溢出攻击4——通过数组越界拿到shell
unsigned int sayHi(){ char v1; // [esp+2h] [ebp-16h] unsigned int v2; // [esp+Ch] [ebp-Ch] v2 = __readgsdword(0x14u); puts("What's your name?"); __isoc99_scanf("%9s", &v1); printf("Welcome %s, here is a tiny program.\n", &v1); retur
2020-09-18 12:14:42 1597 6
原创 栈溢出攻击3——限制read读取长度的溢出
博文中的程序:点我下载提取码:gtes 这道题目乍一看感觉没有什么漏洞,虽然使用了read函数,但是对数据的读取长度都有要求,并且在规定的长度内,不会发生缓冲区溢出的问题。但是仔细阅读一下反汇编之后的伪代码,可以发现,在getLens函数中int getLens(){ char buf; // [esp+0h] [ebp-18h] int v2; // [esp+Ch] [ebp-Ch] while ( 1 ) { printf("length:"); read
2020-09-17 13:34:12 4179 4
原创 栈溢出攻击2——绕过Canary通过后门函数拿到shell
博文中的程序:点击下载提取码:qbdd 能看到这篇博客,我相信大家对栈溢出攻击已经有了一定的了解。一个入门级的题目就是程序中本身有后门函数,我们用后门函数的入口地址覆盖当前正在执行函数的返回地址,这样当前函数执行结束之后,就会跳到后门函数执行,从而达到攻击的目的。那么我们有没有办法防范这种攻击呢?答案是有的,我们可以不使用像read、scanf等有缓冲区溢出漏洞的函数,当然,如果无法避免这些函数的使用,我们还可以使用canary机制来保护我们的程序。canary的英文名称是金丝雀,它可以用来判断我们
2020-09-16 09:37:07 2282
原创 栈溢出攻击1——注入shellcode指令拿到shell
在IDA的Function name这一栏里面,如下图所示,没有发现后门函数,说明这道题目需要自己写shellcode来拿到shell权限。查看sub_80484E9函数的伪代码,如下所示。int sub_80484E9(){ char v1; // [esp+0h] [ebp-28h] puts("Could I know your name?"); myRead((int)&unk_804A060, 32); printf("Hi, %s.\n", &unk
2020-09-15 13:53:04 2135 7
原创 栈溢出攻击0——利用后门函数拿到shell权限
博文中所用程序:点我下载提取码:v8qi 在IDA中经过反编译之后可以看到,这个题中seeme函数的功能就是拿到shell,因此不需要再去手动注入shellcode,只需将sayhi函数的返回地址覆盖成seeme函数的入口地址即可。int seeme(){ return system("/bin/sh");} 在IDA中可以很容易的得到seeme函数的入口地址为0x080485B3,如下图所示。 下面考虑如何覆盖sayhi函数的返回地址。在IDA中,查看sayhi函数的伪代码。
2020-09-12 14:36:10 1364
原创 CSP 202006-2 稀疏向量
题目分析 每一个取值不等于0的维度,都可以用结构体变量来存储,其结构体的定义如下,内部成员有维度索引idx,此维度上的值val。struct Node{ int idx; int val;}vec1[500005], vec2[500005]; 题目中涉及到两个向量,并且每个向量的非零值的数量不会超过500000,因此可以用结构体数组vec1和vec2来表示这两个向量的稀疏表示。 每个向量在输入时,都是按照索引值有序的,这为我们求内积提供了很大的方便。定义两个下标索引p..
2020-09-10 15:00:55 939 3
原创 C++实验12 对象的持久化和异常
实验十二 对象的持久化和异常1 实验目的(1)学习对象的持久化方法 —— 文件操作(2)学习如何读取和写入文本文件(3)学习如何读取和写入二进制固定长文件(4)正确理解 C++的异常处理机制,学习异常处理的声明和执行过程2 实验内容在《实验十 抽象类》的基础上进行扩展。(1)在类的层次中添加正方形框架(Square),声明为长方形的子类。为每类框架定义一个 classId,即圆,...
2020-08-09 08:05:03 1494 3
原创 C++实验11 函数模板
实验十一 函数模板1 实验目的学习函数模板的使用方法,包括以下几个方面:(1)学习为什么要使用模板,掌握函数模板的定义方法;(2)理解函数模板实例化的原理。2 实验内容定义一个求最大值的函数模板,可以求出一个下列数组中的最大者。(1)点(Point)对象数组。对《实验三 面向对象初步》中的 Point 类进行适当修改,通过调用函数模板,求出数组中离坐标系原点最远的点。请使用 Poin...
2020-08-05 14:00:02 1220
原创 C++实验10 多态:抽象类
实验十 多态:抽象类1 实验目的学习为什么要使用抽象类;学习通过继承,实现代码重用的机制和方法;学习如何声明函数为纯虚函数;学习如何利用纯虚函数,编写一般成员函数。2 实验内容(1)问题描述有一家叫“周大框”的公司,用金属线为客户定制各种图案的框架。目前,该公司只生产圆(Circle)、长方形(Rectangle)和直角三角形(Right Triangle)等三种框架。店铺负...
2020-08-04 09:46:59 2310 4
中国海洋大学软件工程期末试卷.zip
2020-04-03
中国海洋大学2018操作系统A卷.rar
2020-04-03
C#窗体绘制动态曲线
2020-03-25
计算机网络期末考试试题及参考答案.rar
2020-01-21
C#自定义控件.rar
2019-10-26
Chrome插件.rar
2019-09-03
C#TabControl控件实现窗体的整合与切换示例
2019-08-28
C#串口编程之串口助手
2019-08-06
和风天气OUC.zip
2019-07-24
数据结构资料.zip
2019-07-24
C++课程设计——基于MFC的银行储蓄管理系统
2019-03-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人