- 博客(63)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 自然语言处理(文本预处理基础)
X是特征集,labels是目标变量。函数识别规则为:首先,对输入的句子进行分词,将分好的词组放入列表中,对比分好的词,是否与自定义列表中的词相同,相同就将其加入对应的列表分类中,不相同就将其放入剩下的一个列表中。对文本进行预处理,先对文本进行分词操作,在定义一个停用词列表,将句子中的干扰项去掉,包括一些连词和特殊符号,对文本进行优化,将优化好的文本连接起来,作为一个字符串返回。定义一个文本预处理函数,定义停用词,将传入函数的句子进行分词,返回为列表类型,返回words中,不在停用词范围内的词。
2024-10-27 00:24:16 982
原创 队列的基本操作(数据结构)
(4)出队一个元素,输出该元素。(3)依次进队元素a、b、c。(5)依次进队元素d、e、f。(2)判断队列q是否非空。
2024-10-24 23:17:36 366
原创 Python爬虫进阶(实战篇一)
在package下创建url_manager.py文件,用于存放url管理器模块代码。查看豆瓣250的url,可以看到每一页都不一样,间隔25,最后一页start=225。右键检查,选择网络(network),不关闭页面的同时,点击更改年份,抓包获取数据。点击获取到的数据,在请求头中找到Uer_Agent,也可以看到请求方式为get。可以判断出,网页存在隐藏的步奏,需要对网页进行抓包操作。首先进入网站,更换年份、月份,发现网站地址没有改变。爬取内容:榜单数,标题,评分和评价人数。
2024-10-20 19:48:09 921 1
原创 栈的操作算法实现(数据结构)
验证性实验内容:编写一个程序sqstack.cpp,实现顺序栈(假设栈中元素类型ElemType为char的各种基本运算,并在此基础上设计一个程序exp3-1.cpp。验证性实验:实现顺序栈各种基本运算的算法掌握栈的存储结构的表示和实现方法。目的:领会顺序栈存储结构和掌握顺序栈中各种基本运算算法设计。(3)依次进栈元素a、b、c、d、e。(2)判断栈s是否非空。(4)判断栈s是否非空。(6)判断栈s是否非空。(5)输出出栈序列。
2024-10-09 22:32:14 417
原创 数据结构(链表的操作算法)
编写一个程序exp2_2.cpp,采用单链表表示集合(假设同一个集合中不存在重复素),将其按递增方式排序,构成有序单链表,并求这样的两个集合的并、交和差。(2)依次采用尾插法插入a、b、c、d、e元素。(8)在第4个元素位置上插人1元素。(10)删除单链表h的第3个元素。(6)输出单链表h的第3个元素。(5)判断单链表h是否为空。(4)输出单链表h长度。(7)输出元素a的位置。(1)初始化单链表h。(11)输出单链表h。(12)释放单链表h。(3)输出单链表h。(9)输出单链表h。
2024-09-30 13:43:16 622 1
原创 自然语言处理(jieba库分词)
一个好的NLP系统一定要有完备的词典,用于判断算法分出的词是否是具有实际意义的词。自定义一个词典,比如dic = ["项目", "研究", "目的", "商品", "服务", "和服", "和尚", "尚未", "生命", "起源", "当下", "雨天", "地面", "积水", "下雨天", "欢迎", "老师", "生前", "就餐", "迎新", "师生", "前来"]。实现相关的分词方法:完全切分、正向最长匹配、逆向最长匹配、双向最长匹配算法,并输入一些句子验证分词结果的正确性。
2024-09-27 22:47:07 770
原创 数据结构验证性实验(附有代码及逐行解释)
2、要求:编写一个程序sqlist.cpp,实现顺序表的各种基本运算和整体建表算法(假设顺序表的元素类型ElemType为char),并在此基础上设计一个主程序,完成相应的功能。2、clock_t clock()函数的返回值,unsigned long,clock返回的是时钟中断数,除以CLOCKS_PER_SEC(1000)就是进程运行秒数。3、time_t 存储日历时间类型,time()函数的返回值,从1970/01/01/00:00:00开始到现在的秒数。求1~n的连续整数和。
2024-09-15 23:56:26 341
原创 miniconda环境管理器安装及jupyter下载
Miniconda是一款小巧的python环境管理工具,安装包大约只有50M多点,其安装程序中包含conda软件包管理器和Python。一旦安装了Miniconda,就可以使用conda命令安装任何其他软件工具包并创建环境等。
2024-05-13 20:21:24 710 1
原创 python爬虫入门(所有演示代码,均有逐行分析!)
网络爬虫,也称为网页蜘蛛或网络机器人,是一种自动抓取万维网信息的程序或脚本。爬虫的基本原理是通过模拟人的网络行为,如点击按钮、查看数据等,来获取服务器上的数据。这些数据可以是文本、图片、视频等多种格式。爬虫分为通用爬虫和聚焦爬虫两大类,其中通用爬虫的目标是在保持一定内容质量的情况下爬取尽可能多的站点,如搜索引擎;而聚焦爬虫则主要针对特定对象或网站,有一台指定的爬取路径、数据抽取规则。此外,爬虫还被广泛应用于多个领域,如数据聚合、舆情分析、网络安全、税务稽查等。这部分内容简单看一下想深入了解看可以看看。
2024-05-10 02:04:46 7892 2
原创 windows许可证即将过期,解决方法
依次输入下面命令,每一部都会有弹窗,下面秘钥不是永久的,到2024年6月20日过期,先用着。在底部导航栏,win图标处右键,选择:Windows PowerShell,打开管理员窗口。1.1 键盘上Win+R打开小窗口。会提示你,许可证过期时间。
2023-12-23 10:48:38 4339
原创 buuctf web [BJDCTF2020]Easy MD5
md5()可以计算字符串的「MD5散列值」。语法stringmd5&str, raw)参数$str:需要计算的字符串raw:指定十六进制或二进制输出格式返回值计算成功,就返回MD5值;计算失败,就返回false。
2023-12-13 09:21:50 479
原创 [极客大挑战 2019]BuyFlag
所以password不能只是数字,在404后加上任意字符即可。提示要输入password,password=404。直接传入数字太长,将数字类型转化为数组,传入。打开burp抓包,cookie显示0个用户。这里涉及数字与字符串的比较问题可以看看。burp太慢了,换了一种方式来传。你一定是CUIT的学生!你必须回答正确的密码!但是上面的注释代码提示;查看源码,发现两处调用。将cookie改为1。
2023-11-29 11:12:15 158
原创 buuctf web [RoarCTF 2019]Easy Calc
show_source()函数只能显示PHP文件的源代码,不能显示其他类型的文件。另外,由于安全原因,该函数默认情况下只能显示本地文件的源代码,无法显示远程文件的源代码。需要更换命令进行绕过,使用var_dump()和scandir()函数,找到了类似于flag的f1agg。()里出现空格等,上列被过滤的字符时,返回what are you want to do?+foo=bar变成Array([foo]=> “bar”)。show_source()函数用于将指定文件的源代码输出到浏览器或者写入到文件中。
2023-11-28 15:09:36 331
原创 chr(ascii)码对照表大全
Chr("0") 为0的字符 Chr("45") - Chr("90") Z Chr("1") Chr("46") . Chr("91") [ Chr("2") Chr("47") / Chr("92") \ Chr("3") Chr("48") 0 Chr("92") Chr("4") Chr("49") 1 Chr("93") ] Chr("5") Chr("50") 2 Chr("94") ^ Chr("6
2023-11-28 15:03:20 1744
原创 [ACTF2020 新生赛]BackupFile
它接受一个参数,即要检查的变量,可以是一个整数、浮点数、甚至是一个数值字符串。否则,返回false。由以上实践可得出,$a与$b比较,$b中含有数字和字符,截取到第一次出现字符,$b中第一次出现字符前的数字与$a比较。is_numeric()函数用于检查一个变量是否为数值,并返回一个布尔值,即true(1)或者false(空)。数字和字符串进行比较时,当这个字符串是一个无法转换为数字的字符串,它就会被强制转化为数字,结果总是为0。当数字与字符串作比较时,系统会先将字符串转化为数字,再与数字进行比较。
2023-11-27 11:17:27 385
原创 buuctf web [极客大挑战 2019]PHP
意思是:引用class.php页面,用get方法传参,获取变量select,将select进行反序列化,@符号表示忽略可能出现的错误信息。这里的作用是,在wakeup函数调用完后,进行判断,如果password不为100为真:抛出错误回显,并利用die()函数退出当前脚本。在_destuct()函数下,要求的条件是password==100,username==='admin',具体来看看各个函数。因为在反序列化时,当前属性个数大于实际属性个数时,就会跳过__wakeup(),去执行__destruct。
2023-11-25 13:48:46 486
原创 buuctf web [极客大挑战 2019]BabySQL
又是你,还来?好好好依旧老方法,先试探一手有错误?你有一个错误在你的SQL语法;检查与您的MariaDB服务器版本对应的手册,以便在第1行'1=1#'和password='1 "附近使用正确的语法看来是or被过滤了,试试双写双写可以绕过,这下就好办了,后面遇到同样被过滤的词,直接双写就🆗了。
2023-09-22 15:28:36 519
原创 buuctf web [ACTF2020 新生赛]Upload
常见的php格式绕过有:php,php3,php4,php5,phtml,pht。这是上个图片题上传的木马,没有改格式,让上传图片,最好加上(GIF89a)行,抓包吧,php格式不行,就先上传要求的格式:jpg、png、gif。抓到上传的包之后,再修改成我们想要的。上传成功,它也把保存的路径告诉你了。一句话木马:GIF89a。掏出蚁剑大宝贝梭哈就完了。明了但不明显的文件上传。
2023-09-21 15:41:11 545
原创 buuctf web [极客大挑战 2019]Upload
ps(补充):文件绕过的格式php,php3,php4,php5,phtml.pht。根据题目提示,大胆猜测文件位置在/upload/1.phtml。上传成功,下面就要看看,上传的文件被放在了什么位置。改两个地方,符合上传图片的要求,上传试试。但是此时文件格式为.jpg我们利用不了。抓包,抓取上传时的数据,看看限制条件。上传头像,上传一下,看看能不能成功。所以,换成没有被过滤的网页格式。phtml没有被过滤,可以使用。先访问一下/upload。
2023-09-20 20:36:35 461
原创 buuctf web [极客大挑战 2019]Http
X-Forwarded-For://如果提示只能由本地访问,这里内容必须改为127.0.0.1如果给了其他ip,那就改为其他IP地址.但是页面中有提示:It doesn't come from 'https://Sycsecret.buuoj.cn'所以,我们添加Referer:https://Sycsecret.buuoj.cn。User-Agent: //一般这个地方也需要改,看题目给的啥提示来改.Referer://这地方也需要改,看看题目给的提示,看给哪个url。检查了一下源码,有一个跳转页面。
2023-09-18 15:38:54 344
原创 buuctf web [极客大挑战 2019]LoveSQL
又是这样的界面,这糟糕的熟悉感,依旧使用上题套路有一串很像flag的字符,但是很可惜,这不是flag看了一眼源代码,没有可以跳转的页面要换个思路了,重新查看题目,发现输入的东西在check.php页面有回显,并且url上也有显示,所以尝试sql注入。
2023-09-17 21:49:43 390
原创 buuctf web [极客大挑战 2019]Secret File
看不到看不到看不到,我的flag呢,我的flag呢,我的flag呢,还给我还给我还给我,呜呜呜还给我啊,你还给我,啊啊啊啊啊啊,掀桌,不学了,不学了,掀桌,砸电脑,砸桌子,砸学校(不敢)提示找到了,却看不见,应该想到php代码是无法在前端直接显示的(即flag应该是被包含在<?嘿嘿,是flag是flag是flag,找到你了,找到你了,找到你了,终于出来了,终于出来了,终于出来了。这一块源码中有个隐藏的超链接,点击后跳转到了新页面。新页面的源码里,也有一处可以跳转的超链接。flag放在flag.php里。
2023-09-13 19:33:31 338
原创 Buuctf web [GXYCTF2019]Ping Ping Ping
根据题目提示和页面显示的/?ip=ip=是get传参的表现,跟据题目ping尝试在/?ip=后面加127.0.0.0有回显,看来方向是对的,接下来用管道符拼接ls尝试看到了flag.php,直接cat flag,发现没有找到,发现空格被过滤了fxck your space(空格)!
2023-09-12 17:17:06 394
原创 buuctf web 前5题
sql注入万能密码:admin ' or 1=1 #GET请求通过URL请求参数,可以在URL后面添加参数,以“?”作为分隔符,参数之间用“&”符号链接。简单php代码。php伪协议,获取网页源码,用于获取简单的被注释掉的重要信息伪协议构造格式中的一种:ping命令后可跟管道符,管道符的用法。
2023-09-07 20:52:18 706
原创 基于python的matplotlib、numpy库实现的图形绘制(数据可视化)
按照自定义的布局结构绘制子图,具体如图1:图1 自定义的布局结构。
2023-06-23 19:57:06 7612 5
原创 VirtualBox ping和xshell切换
使用virtualbox有一个奇怪的现象,每次连接xshell的时候ping百度,ping不通,能ping通的时候又连接不了xsell。两种模式来回切换每次都要查要修改的东西,太麻烦了,就在这记录一下。
2023-05-15 18:24:03 609 1
原创 neo4j数据库的安装及使用
安装neo4j数据库,需要先安装jdk,jdk版本不能太低,不然运行neo4j的时候会报错。我下载的是jdk11,以前已经下载过了,这里不再进行演示,下载jdk11的教程应该挺多的,自己搜一个吧下面是安装neo4j的步骤。
2023-04-19 11:19:00 1376 1
原创 javaweb入门级操作教学,tomcal的使用
bin:可在powershell窗口执行的命令conf:配置lib: 类似于tomcat依赖的Java库log:日志(若登录错误可查看)temp:临时webapps: 可执行的项目(编写网页存放处,PS:网页文件后缀为:.html)
2022-09-06 12:33:21 324 4
原创 王爽 《汇编语言》之寄存器
王爽 《汇编语言》之寄存器寄存器概念寄存器是CPU中的主要部件,是CPU中程序员可以读写的部件。程序员通过改变各种寄存器中的内容来实现对CPU的控制。不同的CPU,寄存器的个数、结构是不同的。8086CPU有14个寄存器,每个寄存器有一个名称。这些寄存器是:AX、BX、CX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW。..................
2022-07-06 20:28:48 3193
原创 kali的基础命令之文件夹操作
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决.
2022-06-04 13:06:15 8034
原创 Windows10家庭版 提升管理员权限
在C盘创建一个文本文件,将一下代码复制粘贴@echo offpushd "%~dp0"dir /b C:\Windows\servicing\Packages\Microsoft-Windows-GroupPolicy-ClientExtensions-Package~3*.mum >List.txtdir /b C:\Windows\servicing\Packages\Microsoft-Windows-GroupPolicy-ClientTools-Package~3*.mum &g
2022-05-15 00:15:00 2772 8
原创 Python实现 第三方库自动安装脚本(嵩天老师)
实例14:第三方库自动安装脚本问题分析-需求:批量安装第三方库需要人工干预,能否自动安装?-自动执行pip注意根据安装需求安装如何自动执行一个程序?例如:pip?需要安装的第三方库NumPy N维数据表示和运算 pip install numpy Matplotilb 二维数据可视化 pip install matplotlib PIL 图像处理 pip install pillow Scikit-Learn 机器学习和数据挖掘
2022-04-17 16:54:25 401
原创 python os库的使用
os库基本介绍os库提供通用的、基本的操作系统交互功能-os库是python标准库,包含几百个函数-常用路径操作、进程管理、环境参数等几类-路径操作:os.path字库、处理文件路径及信息-进程管理:启动系统中其他程序-环境参数:获得系统软硬件信息等环境参数os.path字库以path为入口,用于操作和处理文件路径import os.pathimport os.path as op路径操作os.path.abspath(path) 返回path在当前系统中的
2022-04-17 11:30:42 996
原创 Python实现 体育竞技问题分析(嵩天老师)
实例13:体育竞技分析问题分析失之毫厘,谬之千里-需求:毫厘是多少?如何科学分析体育竞技比赛?-输入:球员的水平-输出:可预测的比赛成绩模拟N场比赛-计算思维:抽象+自动化-模拟:抽象比赛过程+自动化执行N场比赛-当N越大时,比赛结果分析会越科学抽象一种比赛规则-双人击球比赛:A&B,回合制,5局3胜-开始时一方先发球,直至判分,接下来胜者发球-球员只能在发球局得分,15分胜一局自顶向下设计解决复杂问题的有效方法-将一个总问题表达为若干个小问题组成的形式-
2022-04-16 15:54:22 874
原创 python实现 政府工作报告词云的生成(嵩天老师)
实例12:政府工作报告词云基本思路-步骤1:读取文件、分词整理-步骤2:设置并输出词云-步骤3:观察结果,优化迭代
2022-04-14 14:28:58 5952
原创 Python wordcloud库
认识wordcloud库wordcloud是优秀的词云展示第三方库-词云以词语为基本单位,更加直直观和艺术的展示文本如图:wordcloud库的安装pip install wordcloud
2022-04-10 15:46:12 4506
原创 一波三折的wordcloud库安装
第一个错误如下解决的时候我找了个博主的文挺详细的,就直接放出来了,以下所有问题都是基于此博主的教程,在自己尝试的时候产生的python3安装wordcloud库出错及其解决办法(使用命令行安装)_远帆zyf的博客-CSDN博客_wordcloud库安装失败感谢这位博主去“https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud”下载wordcloud.whl文件时候遇到了如图问题经查证这是应为,是ISS服务器设置了文件大.
2022-04-09 15:26:53 2245
为什么逆序数字不能用以下程序
2022-03-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人