- 博客(13)
- 资源 (10)
- 收藏
- 关注
原创 git的几个有用的命令
初学者的很好网站:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000(1)git init 确定仓库(2)git add 1.txt 添加到仓库git commit -m "first commit" 提交到仓库(3)git status 文件状态(4...
2018-11-29 15:23:11 226
原创 python处理将csv文件1内容修改后写入到csv2文件
我这里的方法或许不是很好,主要做法是使用列表和字典进行转换,感觉很繁琐,但是也是一种方法。如果有大神有更好的方法,请留言。# -*- coding:utf-8 -*-#author:zgdimport pandasimport csv# with open("url_features_3_zgd.csv", 'r') as f:# train_csv = csv.Di...
2018-11-28 14:41:34 4700
原创 python从文件中随机选择一些数据
从序列x中随机选择y条数据作为文本:# -*- coding:utf-8 -*-##随机挑选部分内容# encoding:utf-8import randomfrom random import randintoldf = open('select_amigo.txt', 'r') ###1000行newf = open('select_amigo222.txt', '...
2018-11-28 14:38:27 5965
原创 python读取csv文件,并根据某一列值输出另外一列值
csv.DictReader()读取和加载文件,然后根据一列的值处理另外一列的值。代码很简单,看看就知道啥意思了。# -*- coding:utf-8 -*-#author:zgdimport pandasimport csvwith open("url_features_3_zgd.csv", 'r') as f: train_csv = csv.DictReade...
2018-11-28 09:57:20 11149 2
原创 ubuntu下创建python2虚拟环境
没有截图是不是很烦?准备离开了?很简单,还是看看吧,免得浪费时间!!!其他的很多都是有坑的。别看本文没图,但是很实用哦!请勿直接进入下面的参考链接的文章。直接在本文寻找答案即可!!!免得入坑!参考链接:https://www.aliyun.com/jiaocheng/438708.html https://blog.csdn.net/qingche...
2018-11-27 10:24:29 826
原创 sklearn.model_selection.cross_val_score()进行k折交叉验证
cross_val_score(model_name, X,y, cv=k)作用:验证某个模型在某个训练集上的稳定性,输出k个预测精度。K折交叉验证(k-fold)把初始训练样本分成k份,其中(k-1)份被用作训练集,剩下一份被用作评估集,这样一共可以对分类器做k次训练,并且得到k个训练结果。Python实现方法:逻辑回归k折交叉验证:from sklearn.model_...
2018-11-26 14:17:14 1664
原创 linux命令,打乱一个文本文件的所有行
使用例子:shuf input_file.txt -o output_file.txt参考链接:https://blog.csdn.net/qing101hua/article/details/79487227
2018-11-26 14:02:09 2125
原创 svm使用出现FutureWarning: The default value of gamma will change from 'auto' to 'scale' in version 0.22
G:/workspace/Firmware-url-Detection/url_classfication/trainer_zgd.pyC:\Users\zgd\AppData\Roaming\Python\Python27\site-packages\sklearn\svm\base.py:196: FutureWarning: The default value of gamma will...
2018-11-26 09:56:19 15327 4
原创 consider using the '--user' option or check the permissions错误
win7下使用pip install numpy出现错误consider using the '--user' option or check the permissions纠正方法:pip install --user numpy参考链接:https://github.com/googlesamples/assistant-sdk-python/issues/244 ...
2018-11-23 15:19:49 49739 6
原创 计算数值和字符串的相似度
计算数值和字符串的相似度。包括编辑距离计算相似度和difflib.SequenceMatcher计算相似度看下代码就清楚了,写的很清晰。更多学习可以参考文章:https://www.cnblogs.com/chenpeng9/articles/4605577.html#encoding:utf-8__author__ = 'zgd'from collections import...
2018-11-21 09:54:23 550
原创 python根据url获取下载文件名
有的时候下载链接中并不含有要下载的文件名,有的会下载链家会重定向到其他链接进行下载。这个时候我们无法直接获取要下载对象的文件名。下载我们就通过实际请求的链接来获取文件名。当然这个方法还存在问题,这种只是针对重定向的文件能够获取。针对不是重定向的链接存在局限性。 import urllibimport osdef getFile(url, passName=None): ...
2018-11-19 15:09:20 9704 4
原创 python 获取请求链接下载文件的大小和文件特征
###根据url链接提取下载文件的大小特征和下载文件类型def getRemoteFileSize(url, proxy=None): ''' 通过content-length头获取远程文件大小 ''' opener = urllib2.build_opener() if proxy: if url.lower().startswith(...
2018-11-17 15:47:18 5133
原创 python获取页面所有a标签下href的值
参考下面的链接中的内容:https://blog.csdn.net/suibianshen2012/article/details/61915222# -*- coding:utf-8 -*-#python 2.7#http://tieba.baidu.com/p/2460150866#标签操作from bs4 import BeautifulSoupimport urll...
2018-11-02 10:49:05 57801 4
智能设备漏洞挖掘中突破点.pdf
2020-06-08
二进制文件相似度计算-(综述).pdf
2020-06-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人