自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Rnan_prince的博客

知是行之始,行是知之成(1352638748@qq.com)

  • 博客(351)
  • 收藏
  • 关注

原创 机器学习相关学习资料(收藏)

https://www.cntofu.com/book/85/index.html

2021-07-09 01:16:34 233

原创 Web安全学习资料(收藏)

很不错的web安全学习材料,推荐给大家:网址:https://websec.readthedocs.io/zh/latest/#web

2021-06-14 20:05:40 2022 7

原创 Git学习手册(收藏)

安装和配置Git 安装首先,我们必须安装 Git 才能使用它!这里分 Linux 和 Windows 来演示:在 Linux 上安装 Gitsudo yum install git在 Windows 上安装 Git直接在https://git-scm.com/downloads里面,下载最新版的 Git,默认安装就可以了。安装完成后,在开始菜单里找到Git->Git Bash,点击后出现一个类似命令行窗口的东西,就说明 Git 安装成功。Git 配置可以保存 G.

2020-07-16 23:57:01 282

原创 精心整理|Python爱好者社区历史文章合集(收藏)

信息量非常全的总结:https://ask.hellobi.com/blog/python_shequ/14009

2020-05-16 13:41:43 358

原创 python高级用法使用手册(收藏)

一、稀有用法1、bfs:set代替list效率高2、set转成tuple可以序列化3、set.intersection(set1, set2 ... etc)https://www.runoob.com/python3/ref-set-intersection.html4、python的排序模块bisecthttps://www.cnblogs.com/skydesign/...

2020-01-22 15:01:03 4070 2

原创 AI模型隐私风险及防护技术

随着AI成为新一代关键技术趋势,围绕着AI的服务也越来越普及。特别是结合了云计算以后,机器学习数据的标注、模型训练及预测等服务纷纷上云,为用户提供了强大的算力和优秀的算法,极大方便了广大开发者与企业用户。

2023-03-25 20:29:33 773 1

转载 Python中raise…from用法

与此同时,在 Python 3.3 中 A异常 的 __suppress_context__ 属性会被设置为 True,这样就抑制了 A异常 的 __context__ 属性,即忽略 __context__ 属性。当在 except 块或者 finally 块中出现异常时(包括使用单独的 raise 重新抛出异常的情况),之前的异常会被附加到新异常的 __context__ 属性上。如果 B 是异常类或者异常实例,那么 B 会被设置为 A 的 __cause__ 属性,表明 A异常 是由 B异常 导致的。

2023-03-12 22:21:23 210

原创 Python的使用技巧:any all的短路

【代码】Python的使用技巧:any all的短路。

2023-03-12 22:16:36 63

转载 Linux 查找文件内容

例子:在当前目录里第一级文件夹中寻找包含指定字符串的 .in 文件。$ grep –i "被查找的字符串" 文件名。$ grep -c "被查找的字符串" 文件名。$ grep –v "被查找的字符串" 文件名。$ grep –e "正则表达式" 文件名。$ grep "被查找的字符串" 文件名。

2023-03-12 22:06:23 40

原创 python代码重构:if-else过多或switch语句

根据输入参数给config对象的不同属性赋值。

2023-03-12 22:05:16 127

转载 find命令高级用法

find命令高级用法 | 守望的个人博客。

2023-03-12 20:31:03 22

原创 Python使用异步线程池实现异步TCP服务器交互

实现客户端与服务端交互,由于效率原因,要发送与接收异步,提高效率。需要多线程,本文用线程池管理。

2023-03-01 22:47:59 440

原创 Python源码剖析3-列表对象PyListObject

对象可以有效地支持插入,添加,删除等操作,在 Python 的列表中,无一例外地存放的都是 的指针。所以实际上,你可以这样看待 Python 中的列表: 。

2022-12-04 19:47:28 606

原创 Python源码剖析2-字符串对象PyStringObject

PyStringObject是变长对象中的不可变对象。当创建了一个PyStringObject对象之后,该对象内部维护的字符串就不能再被改变了。

2022-12-04 14:13:32 581

原创 Python源码剖析1-整数对象PyIntObject

PyIntObject是一个不可变(immutable)对象。Python内部也大量的使用整数对象,我们在自己的代码中也会有大量的创建销毁整型对象的操作,因此单独的维护整形对象并对其申请内存和释放内存是不现实的。

2022-12-04 14:12:52 477

原创 Python-时间差中seconds和total_seconds的区别

在python中经常会用到计算两个时间差,两个日期类型进行相减可以获取到时间差。经常会使用seconds来获取,其实。

2022-09-10 09:38:58 380 2

原创 python-中断time.sleep一种更优雅的办法:event.wait

中断time.sleep一种更优雅的办法:event.wait

2022-09-10 09:27:50 1696 2

原创 python-通过函数名有选择的执行函数

校验参数时候,会根据不同的参数类型选择不同的策略进行判断,再不定义map的形况下,如何根据类型自动选择相应的函数进行校验,并且可扩展。

2022-09-10 07:45:45 311

原创 python 设置linux环境变量

1、临时环境变量linux:export PGPASSWORD = 'postgres'若用python实现,错误的方法:os.system("export PGPASSWORD='postgres'")相当于只是起了一个shell进程,进程内变量可用,进程结束,变量失效。2、全局环境变量os.environ['PGPASSWORD'] = 'postgres'相关用法:import os# 设置环境变量os.environ['WORKON_HOME']="

2022-05-13 21:03:34 3718 3

原创 Python site-packages目录的位置

网站包目录有两种类型,全局目录和每个用户目录。1、运行时会列出全局站点软件包(“dist-packages”)目录sys.path:python -m siteUSER_BASE 和USER_SITE其实就是用户自定义的启用Python脚本和依赖安装包的基础路径。user_site其实就是个人的site-packages默认安装路径了要在Python代码中getsitepackages从站点模块运行更简洁的列表,请执行以下操作:python -c 'import sit...

2022-05-13 20:55:14 5153

原创 Python批量数据处理-下划线与驼峰格式的相互转换

背景:python读取数据(如数据库数据)往往是list形式的,在进行数据处理时(如格式化的kafka、或者json形式),往往会使用如data_dict['xxx']='yyyy'的形式,这样的缺点:1、可扩展性不好 2、硬编码 3、重复性代码多 4、不美观针对以上缺点做了如下工具类:方法:1、定义数据格式类:key的名字与list索引的对应位置2、定义工具类:自动识别数据格式类的变量名称3、动态获取变量key:根据相应的转换规则(驼峰->x下划线 下划线-&gt..

2022-04-23 09:31:57 2873

原创 Git stash及解决Git stash冲突问题

Git stash适应场景:使用git的时候,我们往往使用分支(branch)解决任务切换问题,例如,我们往往会建一个自己的分支去修改和调试代码, 如果别人或者自己发现原有的分支上有个不得不修改的bug,我们往往会把完成一半的代码commit提交到本地仓库,然后切换分支去修改bug,改好之后再切换回来。这样的话往往log上会有大量不必要的记录。其实如果我们不想提交完成一半或者不完善的代码,但是却不得不去修改一个紧急Bug,那么使用git stash就可以将你当前未提交到本地(和服务器)的代码推入到G

2021-12-19 17:50:08 4597

原创 xxx.whl is not a supported wheel on this platform-查看pip支持的安装包版本

我们安装一些python包时候经常遇见如下错误:xxx.whl is not a supported wheel on this platform。出现这个问题,是由于这个whl和系统python版本不匹配导致的。64 pip 20.0及以上版本,老的的查看方法前段时间更新后就不能用了。之前导入pip._internal或者pip._internal.pep425tags就可以。、import pipprint(pip.pep425tags.get_supported())#...

2021-12-19 17:32:40 1091

原创 Excel调用有道词典实现批量翻译

如图所示,我们在B2单元格中写入公式:=FILTERXML(WEBSERVICE("http://fanyi.youdao.com/translate?&i="&A2&"&doctype=xml&version"),"//translation")然后向下填充,即可将A列中的文字翻译成英文。记得将A2换成你自己的。。。原理:FILTERXML函数这里我们使用了Excel中的网络类函数FILTERXML,这是Excel2013版本之后新增的一个

2021-12-05 09:26:52 2807 3

原创 Python进程使用内存后不释放

背景:使用python进行大量的数据操作过程中RSS占用(几个G,Python的GC会频繁地malloc/free),发现RSS内存不释放。排查代码后,没有发现内存泄露的情况,GC也是默认开启的,甚至代码将数据库数据读出来遍历一遍后程序结束,内存一直存在不释放。 使用tracemalloc,objectgraph调试,Python对象的产生和释放并没有啥异常。 Python的对象内存管理是基于引用计数的(refcnt为0直接decref回收),python内存池也没发现大内存驻留,操作系统brk

2021-12-05 09:10:37 4879 1

原创 atop安装和使用

atop是可以视为Linux中top命令的增强版. 它可以将服务器的一些运行信息(cpu,内存,网络,i/o等)以日志的形式写入磁盘, 以便后期在发现的问题的时候, 查看日志对问题节点对应时间点的系统运行参数, 以便更好的定位问题.下载地址:Atoptool.nl选择合适的版本。rpm -ivh atop-2.6.0-1.el7.x86_64.rpm也可以使用命令在线安装:yum install -y atop实时监控, 直接输入atop, 点击回车即可进入界面.ato.

2021-12-05 08:50:20 871 1

原创 SQL的GROUP_CONCAT给值加上单引号后再拼接

可以在拼接的值名称前后添加引号和逗号解决。SELECT GROUP_CONCAT(DISTINCT '''',id,'''') FROM {table_name} 结果:"'id1','id2','id3','id4'"

2021-11-20 21:02:09 1012

原创 linux下面修改目录下所有文件时间

查看文件的时间:sata test.txt更新目录下面所有文件的时间:find ./* -type f -exec touch {} \;更新目录下面所有目录的时间:find ./* -type d -exec touch {} \;修改一个文件的日期时间:touch -d "2020-11-11 11:00:00" test.txt批量修改:find ./* -exec touch -t 202011111100.00 {} \;...

2021-11-20 20:57:34 3006 2

原创 pyc文件多次运行二进制不一致问题

在产品开发中,为了安全性(虽然也不是很安全),通常会将python代码编译成pyc文件,再随产品发布。这时经常会遇见环境、代码都相同的情况下,多次运行的pyc代码二进制不一致问题。1、首先产看pyc文件的时间戳是否一致以十六进制打开pyc文件(notepad++),第一行的8-11位为时间戳。如何在notepad++中以16进制显示内容_Cloudy_cn的专栏-CSDN博客用计算器换算成十进制的时间戳-:再用在线的时间戳转换工具查看时间:时间戳(Unix timesta..

2021-11-20 20:52:27 622

原创 数据库-分库分表优化

1、为什么要拆分数据库?一个数据库的连接数是有上限的,当业务系统变得繁杂时,如果都存储在一个数据库中,那么势必会因为数据库达到瓶颈;此时就需要对数据库中表进行拆分,将其分散到多个数据库中去。数据库拆分原则:就是指根据系统业务实际情况,将原本放在一个数据库中的数据分散放到多个数据库中去,减少单库的负载。2、垂直拆分垂直切分:简单的说就是将数据库中的各个表,依据业务情况将一些表放在一个数据库中,一些表放在另外一个数据库中,比如商城这些的数据库端按照业务垂直拆分:按照业务订单数据库、用户数据库、

2021-11-20 20:03:52 601

原创 Python-itertools - 高效的迭代器的函数

itertools模块实现一系列iterator,这些迭代器受到APL,Haskell和SML的启发。为了适用于Python,它们都被重新写过。无穷迭代器: 迭代器 实参 结果 示例 count() start, [step] start, start+step, start+2*step, ... count(10)-->10...

2021-11-20 18:52:10 612

原创 遍历python中的对象属性

python开发中有时候需要遍历某对象的属性list:class Person(object): """ 职员信息 """ name = 0 age = 1 id = 2 group = 3attr = [a for a in dir(Person) if not a.startswith('__')]for a in attr: print(a, getattr(Person, a))"""age 1group 3id

2021-10-24 09:36:22 7009

原创 nslookup命令解析

1、作用:查询DNS的记录,查看域名解析是否正常,在网络故障的时候用来诊断网络问题。2、命令解析命令格式:nslookup domain[dns-server]示例:nslookup www.163.com第一部分服务器:本机DNS服务器信息。192.168.3.1是我当前计算机的DNS服务器,由于是内网服务器名称无法获取第二部分非权威应答:Non-authoritative answer,除非实际存储DNS Server中获得域名解析回答的,都称为非权威应答。也就.

2021-10-24 09:30:41 4186 1

原创 oracle批量插入,存在则更新,不存在则插入

INSERT … ON DUPLICATE KEY UPDATE … 语句在并发量比较高的时候,可能两个线程都查询某个记录不存在,所以会执行两次插入,然后其中一条必然会因为主键(这里说的主键不是递增主键)冲突而失败。数据库层MySQL中INSERT … ON DUPLICATE KEY UPDATE … 就可以做这个事情,并且是原子性操作。1、单条记录下使用:INSERT INTO t1 (a,b,c) VALUES (1,2,3) ON DUPLICATE KEY UPDATE...

2021-10-13 00:21:09 6169 3

原创 SQL 统计同一字段不同值的个数

已知数据表test如下day result 2018-2-1 胜 2018-2-1 胜 2018-2-1 负 2018-2-2 胜 2018-2-2 负 2018-2-2 负 要求:以 day 字段作为分组,并统计 result 字段中不同值的个数(1)大多数情况下,我们遇到的问题是根据分组结果,统计每个分组的个数,其语法如下,此语法只能统计所有的记录个数,无法根据同一字段的不同值统计SELECT COUNT(*) FRO.

2021-10-13 00:12:21 6740

原创 隧道技术攻击

隧道技术?隧道可按要求建立起一条与其他服务器的通信线路,使用隧道的原因是在不兼容的网络上传输数据,或在不安全网络上提供一个安全路径,确保客户端能与服务器进行安全的通信,届时使用SSL等加密手段进行通信。隧道本身不会去解析HTTP请求。也就是说,请求保持原样中转给之后的服务器。隧道会在通信双发断开连接时结束。通过隧道的传输,可以和远距离的服务器安全通信。特点隧道本身是透明的,客户端不用在意隧道的存在。 只关心数据的传输,不对承载的数据进行解析。 允许数据从一个网络移动到另一个网络。隧

2021-09-25 23:19:45 911

原创 核密度估计-KDE

核密度估计(Kernel Density Estimation)密度评估器是一种利用D维数据集生成D维概率分布估计的算法,GMM使用不同的高斯分布的加权汇总来表示概率分布估计。核密度估计算法将高斯混合理念扩展到了逻辑极限,它通过对每一个点生成高斯分布的混合成分,获得本实质上是无参数的密度评估器。核密度估计的自由参数是核类型和核带宽,前者指定每个点核密度分布的形状,后者指定每个点核的大小。一维数据的密度估计——直方图,是一个简单的密度评估器,直方图将数据分成若干区间,统计落入每个区间内的点的数量

2021-09-23 23:51:20 3417

原创 Cython为py程序加密&提高性能

在实际的工作中,有时候我们需要部署自己的Python应用,但这时候我们并不希望别人能够看到自己的Python源程序;还有项目需要,需要优化已有的Python代码。Python运行速度慢怎么办?通过使用Cython可以提高性能。Cython还可以用于对Python代码进行加密。cython的原理是:把.py文件编译成.c文件,然后把.c文件编译成.so或.pyd文件,这样文件就很难被破解。优点在于Python代码很难被破解,缺点在于,Cython有时可能不支持一小部分代码,完善起来就比较麻烦了。

2021-09-10 21:56:46 1305

转载 数据科学在Web威胁感知中的应用

写的非常棒,推荐给大家

2021-09-08 21:40:55 88

原创 tensorflow_hmm使用Session模块时报错:AttributeError: module ‘tensorflow‘ has no attribute ‘Session‘,已解决

tensorflow_hmm:https://pypi.org/project/tensorflow_hmm/当运行https://github.com/dwiel/tensorflow_hmm中的examples时候,tf_s = tf.Session().run(tf_s_graph)出现了如下的错误:错误的意思是tensortflow模块没有Session属性,后来查阅资料发现,tensorflow2.0版本中的确没有Session这个属性:如果安装的是tenso..

2021-09-08 21:36:15 157

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除