- 博客(546)
- 资源 (15)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 付费课程:对于爬虫、逆向、抓包、接口构造感兴趣的同学可以了解下
因人而异,感兴趣的同学可以私聊我,进行针对性指导、教学。线上或者线下课程皆可,一对一教学。
2023-04-27 23:20:04
1958
5
原创 Windows11安装软件提示MSVCP140.dll丢失解决方案
下载地址:https://learn.microsoft.com/zh-CN/cpp/windows/latest-supported-vc-redist?安装最新的Microsoft Visual C++ 2019 Redistributable Package.选择最上面的最新版本下载,然后运行安装。切记,选X64版本!
2024-07-26 15:03:21
244
原创 linux离线环境下安装anaconda
下载对应linux版本的anaconda版本安装包,这里选择linux平台的64位 版本(64-Bit(x86) Installer),点击进行下载。基于内网离linux线环境下,且账号无root权限,无法直接安装python,通过按照anaconda,来间接实现安装python。完成后重新打开终端,可以看到用户名前显示**(base)**,表示安装成功,以后终端会默认打开在conda的base环境下。此处为是否修改anaconda路径,按下enter键安装在默认路径,输入路径安装在自定义路径。
2024-07-26 14:32:27
124
原创 使用LobeChat+Ollama快速搭建本地大模型,离线可用
Ollama 是一个轻量级、可扩展的框架,旨在在本地计算机上构建和运行大型语言模型(LLM)。它支持多种模型架构,如 Llama 3、Phi 3、Mistral 和 Gemma 2,并提供了简洁的 API 以创建、运行和管理这些模型。Ollama 可以在 macOS、Linux 和 Windows 上运行,适合于需要在本地运行大模型的应用场景 (Ollama) (GitHub)。易用性:API设计简洁,用户可以轻松上手,即使是没有经验的用户也能快速使用 (腾讯云 - 产业智变 云启未来)。
2024-07-16 16:48:43
571
原创 机器学习聚类算法---K-Means算法
而,一旦算法有效,那么就会对选举结果产生非常大的影响,甚至,直接决定了最后的总统归属。可见,聚类算法是一个非常了不起的算法。下面,我们就正式开始今天的新算法,K-means聚类算法。
2024-07-12 16:08:24
277
原创 Python办公自动化:增值税发票批量识别和核验
可以通过地址:https://console.cloud.tencent.com/ocr/overview。可以看到,每个月有1000次免费识别和50次校验资格。首先进行识别,这里以python为例子。然后根据返回结果的参数作为校验参数。
2024-07-10 17:04:00
136
原创 linux中top、htop监控工具命令详解
top 命令是 Unix 和 Linux 系统中一个强大的监控工具,可以显示系统中运行的所有进程及其相关的实时信息。它的输出会动态更新,通常每隔几秒刷新一次。用户界面:htop 提供更直观和用户友好的界面,支持鼠标操作和颜色显示。功能性:htop 提供更多高级功能和更强的交互性,适合需要频繁监控和管理进程的用户。安装和配置:top 通常预装在系统中,htop 需要手动安装,但配置更灵活。通过以上比较,你可以更好地理解 top 和 htop 的区别,并根据需要选择合适的工具进行系统监控和管理。
2024-07-09 17:05:14
683
原创 Linux实现CPU物理隔离
假设有8个脚本,脚本以process_split_{}.py命名,linux有16个CPU,每个脚本按照顺序绑定2个CPU,实现物理隔离,这样每个脚本只使用2个CPU同时运行任务,互相隔离。或 CPU pinning),可以通过将特定的任务或进程绑定到特定的 CPU 核心来实现。以下是几种实现方法。确定要绑定的 CPU 核:例如,如果你想将脚本绑定到第0和第1个CPU核,可以使用CPU编号0和1。可以使用htop或top命令来查看进程的CPU使用情况,并确认进程确实绑定到了指定的CPU核。
2024-07-09 16:14:28
392
原创 python解决pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed
在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = ‘tesseract’,修改成 tesseract_cmd =r’C:\Program Files\Tesseract-OCR\tesseract.exe’(刚才安装的路径下)在我们下载了PIL(命令pip install pillow)后,找到pytesseract.py文件,里面的tesseract_cmd =‘tesseract’,这里并没有指定文件路径。
2024-06-22 22:17:55
228
1
原创 Charles复制出的CURL无法转换为curl bash
当复制出来的Charles CURL数据不能成功转换为burl bash时,如下所示。问题出现在结尾网址,请将结尾网址提到最前面就可以了。如图所示,复制CURL Request。
2024-06-11 19:59:24
262
原创 Python启发式自动化之钉钉推送消息
总而言之钉钉机器人推送是一种非常不错的选择,足以应对日常工作中的各类场景 (定时提醒、阈值告警、事件通知 等等)出于安全考虑,添加签名,即 secret。以上就是钉钉群机器人通知的几种类型。首先下载windows桌面版钉钉。其次创建群组,将机器人拉入群组中。整体跳转ActionCard类型。添加一个自定义机器人并指定群组。得到一个 Webhook 地址。
2024-06-09 11:51:47
106
原创 携程演出协议下单
文章目录软件功能订阅须知早期代码携程演出展览地址:https://m.ctrip.com/webapp/tnt/list?pagetype=city&citytype=dt&id=2&name=%E4%B8%8A%E6%B5%B7&pshowcode=music&ctm_ref=vactang_page_19534软件功能自持自定义搜索演唱会信息支持添加、删除观影人信息支持多账号并发抢票支持捡漏模式支持IP代理订阅须知订阅后如果有问题,请联
2024-06-03 18:05:52
462
6
原创 免费使用知网下载文献
第一步:输入网址:https://digi.library.hb.cn:8443/#/(或搜索湖北省图书馆)第二步:点击登录按钮。第三步:使用手机 支付宝 扫描页面左侧二维码。第四步:手机点击“电子读者证注册”。(支付宝支付积分需大于605分)第五步:微信扫描电脑界面右侧二维码,输入个人信息完成登录与账号绑定。第六步:返回网站首页,点击进入知网即可进行文献查找与下载。
2024-05-28 16:18:12
460
3
原创 189. Rotate Array
完全按照题目的意思,每次把末尾的元素移动到开头,当然移动前需要把所有元素后移一位,把第一个位置腾出来。转动数组,将数组的最后一个元素移动到开头,重复操作 k 次。新开辟数组,增加空间复杂度。
2024-05-23 11:00:48
267
1
原创 JS逆向之企名科技
说咱们的f没有被定义,咱们去找一下f,f就在decode函数里,鼠标放上去发现f就是一串固定正则:/[\t\n\f\r ]/g,我们把它定义好放到decode函数里,即 var f = /[\t\n\f\r ]/g。好了,目前为止我们已经把我们需要的加密函数搞到了,接下来就开始编写python代码进行调试。打上断点开始调试,像这种加密的一般都会有一个json.parse的函数。发现网页数据encrypt_data被加密了,接下来开始尝试解密。发现c没有被定义,依然是在decode函数里。
2024-05-20 17:03:34
285
原创 169. Majority Element
由于 2 是超过半数的数,它的二进制是 010,所以对于从右边数第一列一定是 0 超过半数,从右边数第二列一定是 1 超过半数,从右边数第三列一定是 0 超过半数。当然,我们可以只统计 1 的个数,让每一位开始默认为 0,如果发现某一列的 1 的个数超过半数,就将当前位改为 1。这样经过充分时间的游戏后,最后的结果是确定的,一定是超过半数的那个队伍留在了最后。,0 或者 1,然后这些超过半数的二进制位组成一个数字,就是我们要找的数。遍历每一位,如果某一位上1的个数超过 n//2,则将该位设置为1。
2024-05-20 14:55:38
616
原创 Kaggle赛题总结:Enefit - Predict Energy Behavior of Prosumers
竞赛旨在解决能源不平衡的问题,即预计使用的能源与实际使用或产生的能源不符。自发自用者是既消耗又产生能源的个体,他们在造成能源不平衡方面起到了重要作用。尽管他们只占所有能源消费者的一小部分,但他们不可预测的能源使用行为给能源公司带来了物流和财务问题。如果不加以解决,可能会导致运营成本增加、电网不稳定以及能源资源的低效利用。如果这个问题得到有效解决,将显著降低不平衡成本,提高电网的可靠性,并使自发自用者更高效和可持续地融入能源系统中。
2024-05-14 09:21:49
132
1
原创 solar-features时间序列任务完整数据处理&预测流程
文章目录引言Read base DataRead and Preprocess External Datasetsholiday_path:Calendar.csv,日期相关数据izmir_tempizmir_humizmir_windizmir_meteostatproduction.csv:能源产出Feature EngineeringMerge Features to Main DFModellingparams参数介绍catboost参数介绍Feature ImportanceStage 1 Mod
2024-05-14 09:12:51
61
原创 spark分布式预测和保存过程中遇到的问题记录
通过上述配置,使得可以在内网jupyter环境下完成对江苏省30w+台区,三个月数据的预测和保存。大大缩短了时间,提高了处理效率。
2024-05-09 22:19:15
125
1
原创 python实现socks5IP代理
针对之前做的软件,由于IP限制,因此加入IP代理,方便后期直接调用。IP代理商:https://www.laoliu.cn/ips/
2024-04-17 15:00:53
489
原创 雪球acw_sc__v2 加密参数构造解析
接着,跳转到源代码,刷新网页,进行调试,首先进入debugger模式,需要反debug调试。依旧是先清除cookie,打开源代码,在右侧时间侦听器断点,在脚本处勾选,刷新网页。下面先对第一个today进行代码编写,可以看到获取到一段js代码和acw_tc参数。进入到最终的reload函数中,这和第一段today脚本获取的js代码对上。继续执行,进入到debug中了,这时候反debug解析。点击保留日志,这里显示有两次请求,分别分析下。这个参数才可以,下面对其进行分析。然后直到还原完成,大体内容就如此。
2024-04-05 16:25:12
216
原创 有道翻译实现接口加密解密
我们仔细看一下,发现它是一个解密过程,传进已加密的数据 + key + iv ,经验足够的兄弟可以看出可能是一个aes加密解密。初看:post请求,携带的参数有我们输入的中文:你好,再看返回数据:多试试结果翻译结果发现它是变化的,对于这样我们只有去多找找了。并且发现key 和 iv 没有变,是固定值,找到规律了,因为发现 key 和 iv 是没变的,所以先将他们 MD5处理了。还真找到了一个,对有道网页翻页的结果,也就是happy点击的时候,发现了新的接口。发现是md5加密,也就是先加密,再解密。
2024-03-24 21:55:26
206
原创 IOS抓包工具Stream抓包使用教程
安装完成后会提示信任证书点击信任证书,或者直接在设置中搜索信任进入证书信任页面。这时app会自动跳转至浏览器下载证书文件,允许即可。点击开始抓包,进入需要抓包的页面或者app。1.首先在应用商店搜索并下载stream。进入抓包历史页面就可以查看抓取的数据了。选择安装证书,允许应用添加vpn配置。下载完成后在描述与文件中安装证书。抓包结束后点击停止抓包。
2024-02-26 14:31:18
1766
1
原创 三次样条函数插值(Cubic spline function interpolation)
已知部分离散的数据,但不知道满足这些数据的函数表达式,插值(和拟合)都是为了找到对应的函数表达式。区别在于,插值函数能够穿过已知点,拟合只求函数图形神似而不求穿过已知点。
2024-02-22 09:14:45
90
原创 使用python给程序添加授权码,设置授权时间、撤销授权和管理授权
若查到记录,则检查其授权时间是否过期,若过期说明授权失效,验证失败,否则验证通过。是否合法,若验证通过,则直接进入程序,若未找到授权文件或者授权文件校验失败,则进入重新授权流程。添加授权时,输入机器码和授权时间,然后向服务器请求注册,服务器收到请求后会在授权表中新增一条记录。删除授权时,输入机器码,然后向服务器请求删除授权,服务器收到请求后会在授权表中清空相应的记录。注册机程序用来对程序进行授权管理,包括 添加授权,删除授权,授权查询 等功能。撤销授权时,根据机器码查找记录,并将该条记录中的授权时间清零。
2024-02-07 10:38:44
848
原创 校准大麦服务器时间,实现本地时间和服务器时间同步,无缝衔接抢购
这时候有两种思路,第一种是每秒钟请求一次服务器,这种操作不推荐,因为频繁访问可能会导致服务器崩溃,并对安全性很低。另一种是发送ajax请求,从响应头获取服务器时间,然后和本地时间进行对比,计算两者之差,然后让本地之间加上时间差,就是准确的时间了。在使用大麦进行商品抢购倒计时,涉及到一个问题,就是时间的准确性,如果使用本地手机或者电脑的时间与服务器时间不同步,即使是1秒或者百毫秒内的误差,都会影响抢购的成功准确率。因此,针对上述问题,我们提出了一种解决方法,将本地时间和服务器时间同步。
2024-02-05 16:30:07
2259
10
原创 sklearn模型指标和特征贡献度查看
r2_score 是一种用于衡量回归模型性能的统计指标,也被称为决定系数。这个指标表示模型对数据的拟合程度。计算总平方和 (Total Sum of Squares, TSS): 这是真实值与其平均值的差的平方和。计算残差平方和 (Residual Sum of Squares, RSS): 这是真实值与预测值的差的平方和。计算 R² 分数: R² 分数是 1 减去 RSS 与 TSS 的比值。R21−RSSTSSR21−TSSRSS其中,yiy_iy。
2024-02-05 15:10:42
725
原创 遗传算法 (Genetic Algorithm, GA) 详解与实现
选择的基准就是个体的适应度。如果交叉发生,则对child1,child2,parent1,parent2进行适应度比较后,保留较好的进入新种群,也可以都进入新种群,具体怎么做没有标准,可以根据具体问题自行选择。初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度(fitness)大小选择个体,幵借助于自然遗传学的遗传算子(genetic operators)进行组合交叉和变异,产生出代表新的解集的种群。
2024-01-11 15:08:40
580
原创 粒子群算法Particle Swarm Optimization超详细解析+代码实例讲解
粒子群算法,也称粒子群优化算法或鸟群觅食算法(Particle Swarm Optimization),缩写为 PSO, 是近年来由J. Kennedy和R. C. Eberhart等开发的一种新的进化算法(Evolutionary Algorithm - EA)。
2024-01-11 11:27:35
488
原创 详述numpy中的np.random各个函数的用法
该函数括号内的参数指定的是返回结果的形状,如果不指定,那么生成的是一个浮点型的数;返回结果:返回值是一个大小为size的数组,如果指定了low和high这两个参数,那么生成的元素值的范围为[low,high),不包括high;我们前面已经说过了rand()这个函数,它返回的元素值是服从0-1的均匀分布,那如果不想要生成的是0-1范围内的均匀分布,想要其它范围内的均匀分布怎么办呢。其返回值的元素类型为浮点型。结果中的每一个元素是服从0~1均匀分布的随机样本值,也就是返回的结果中的每一个元素值在0-1之间。
2023-12-28 10:45:14
1253
原创 装饰器处理超时函数退出&线程堵塞场景、处理方式
在购物场景中,一个常见的线程堵塞案例可能涉及到库存管理。线程堵塞通常发生在多线程程序中,当一个线程在等待某个条件满足或等待其他线程释放资源时,它会停止执行,进入"堵塞"状态。什么是线程阻塞:在某一时刻某一个线程在运行一段代码的时候,这时候另一个线程也需要运行,但是在运行过程中的那个线程执行完成之前,另一个线程无法获取到CPU执行权,这时就会造成线程阻塞。输出结果如下,task在等待3秒后,退出程序,导致后面的语句没有执行,导致线程堵塞,因为上面只有一个主线程,没有创建其他线程。
2023-12-26 17:12:42
965
原创 浅拷贝和深拷贝
浅拷贝:仅复制对象的第一层,子对象仍然是共享的。深拷贝:完全复制整个对象,包括所有层级的子对象,新对象完全独立于原对象。在实际编程中,选择使用浅拷贝还是深拷贝取决于你的具体需求,特别是你是否需要完全独立的对象副本。
2023-12-26 16:07:13
383
原创 numpy中一些常见计算
总而言之,虽然方差提供了离散程度的数学定义,但标准差因为其直观性和实用性,在实际应用中更为广泛。它提供了一种简单、直观的方式来描述数据的变异性,并且在许多统计方法和实际应用中都非常重要。总而言之,方差提供了一种量化数据波动性和不确定性的方式,对于理解数据集的特性、评估风险和不确定性以及进行科学研究都至关重要。在一个numpy数组求和、均值时,如果这个数组里包含了nan,则程序会报错或者求出来的值是nan,如下代码所示。方差是统计学中衡量数据离散程度的一个重要指标。方差越大,表示数据的分散程度越高;
2023-12-22 19:33:45
896
原创 apply&lambda&agg函数用法
求每一列平均值求每一行的均值支持匿名函数df.apply(lambda x : x.max() - x.mean())#列对每个值运算自定义函数及传参对部分列进行操作结合if的用法。
2023-12-22 19:28:56
392
原创 Python基于joblib的并行计算&进程&线程&multiprocessing多核并行计算
总的来说,joblib是一个非常适用于需要大规模并行处理和缓存重复计算结果的任务的库,特别是在数据密集型的应用中,如机器学习、数据预处理和科学计算。X, y,这段代码的意思非常简单,即是用n_jobs个CPU来计算函数,其中参数为而这里只有作为被枚举的变量,其它参数始终保持不变。至于里为何要用clone函数是因为如果直接将传入的话,这个模型在外部也将会被改变。具体原因可以参看其它文档。
2023-12-19 21:05:37
1406
原创 pandas中date_range生成指定日期
start:string或datetime-like,默认值是None,表示日期的起点。end:string或datetime-like,默认值是None,表示日期的终点。periods:integer或None,默认值是None,表示你要从这个函数产生多少个日期索引值;如果是None的话,那么start和end必须不能为None。freq:string或DateOffset,默认值是’D’,表示以自然日为单位,这个参数用来指定计时单位,比如’5H’表示每隔5个小时计算一次。
2023-12-18 13:55:48
449
原创 Transformer注意力机制模型介绍
Transformer是一个利用注意力机制来提高模型训练速度的模型。关于注意力机制可以参看这篇文章,trasnformer可以说是完全基于自注意力机制的一个深度学习模型,因为它适用于并行化计算,和它本身模型的复杂程度导致它在精度和性能上都要高于之前流行的RNN循环神经网络。最后祭出这张经典的图,最初看这张图的时候可能难以理解,希望大家在深入理解Transformer后再看这张图能够有更深刻的认识。
2023-12-14 15:14:55
973
原创 NLP中的Seq2Seq与attention注意力机制
到这里,本文已经介绍了seq2seq模型的基本概念及seq2seq中的注意力机制,希望能帮到大家。
2023-12-13 17:06:09
1011
c# Aspose.Slides 17.9版本
2022-09-22
TensorFlow 2.0深度学习算法实战---第7章 反向传播算法.rar
2020-03-28
4.猫眼电影爬取并分析.rar
2020-03-09
bigdata-master.rar
2020-02-27
seetaface.rar
2020-02-27
seetaface人脸识别模块-FaceIdentification.rar
2020-02-27
FaceAlignment-人脸对齐.rar
2020-02-27
人脸检测-检测到人脸.rar
2020-02-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人