Python
敲代码的乔帮主
走在梦想的大道上,跌跌撞撞,时而悲伤,时而难过失落,是什么又让我扬起头继续向前呢?是心中的那一朵彼岸之花,牵使着你我之间的约定,成为我心中那一股永不可灭的骨气,终究是信仰。
展开
-
python利用贝贝和you-get批量下载B站资源
大家都知道B站是一个学习网站,有很多优秀的up分享了很多优秀的“学习资料”,但是往往因为版本问题,当这个资源火了之后就会面临宕掉的风险,因此及时下载收藏是一个必不可少的学习姿势。分别介绍两种方式,都是自己最常使用,且能正常使用的方法介绍给大家。1.普通视频下载(网页版)-贝贝bilibili地址:https://xbeibeix.com/api/bilibili/使用方法:将地址输入,可以直接下载flv和mp4格式2.you-get批量下载贝贝可以满足日常需求,也是非常推荐的一款下载方式原创 2020-06-04 17:42:50 · 2121 阅读 · 0 评论 -
利用python生成一个从0开始的n个数字的列表(也可以是从m到n)
# ==第一种===========================================================================def test1(): l = [] for i in range(1000): l = l + [i]# ==第二种(append )=============================...原创 2019-12-01 16:06:47 · 2831 阅读 · 0 评论 -
pandas新增一列作为id,或者新增有默认值的一列
原始数据:我们想要在text这一列前面加上一列作为id(数字从小到大吧),在后面加上一列作为标签,默认0吧import pandas as pddata = pd.read_csv('test.txt')n = len(data)+1nlist = range(1,n)data['id'] = nlistdata['label'] = 0print(data.head...原创 2019-12-01 15:59:57 · 7787 阅读 · 0 评论 -
numpy数组与list之间的转换
a=([3.234,34,3.777,6.33])a为python的list类型将a转化为numpy的array: np.array(a)array([ 3.234, 34. , 3.777, 6.33 ])将a转化为python的lista.tolist()原创 2019-11-30 16:06:57 · 1368 阅读 · 0 评论 -
python的matplotlib画饼状图
函数:matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None,pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None,radius=None, counterclock=True, wedgeprops=None, ...原创 2019-11-17 15:00:53 · 2352 阅读 · 0 评论 -
Python 字典Dict中fromkeys函数的运用
dict.fromkeys(seq[, value]) 该方法返回一个新字典。seq -- 字典键值列表。 value -- 可选参数, 设置键序列(seq)对应的值,默认为 None。两种用法:第一种:不指定值:x = ('key1', 'key2', 'key3')thisdict = dict.fromkeys(x)print(thisdict)结果...原创 2019-11-17 14:57:46 · 1352 阅读 · 0 评论 -
python中plt.hist参数详解
matplotlib.pyplot.hist( x, bins=10, range=None, normed=False, weights=None, cumulative=False, bottom=None, histtype=u'bar', align=u'mid', orientation=u'vertical', rwidth=No...原创 2019-11-17 14:55:14 · 12955 阅读 · 0 评论 -
Pandas plot 出图
首先import我们需要用到的模块,除了 pandas,我们也需要使用 numpy 生成一些数据,这节里使用的 matplotlib 仅仅是用来 show 图片的, 即plt.show()。import pandas as pdimport numpy as npimport matplotlib.pyplot as plt创建一个Series这是一个线性的数据,我们随机生成1...原创 2019-11-10 14:20:46 · 556 阅读 · 0 评论 -
Pandas 合并 merge
pandas中的merge和concat类似,但主要是用于两组有key column的数据,统一索引的数据. 通常也被用在Database的处理当中.依据一组key合并import pandas as pd#定义资料集并打印出left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'], ...原创 2019-11-10 14:09:30 · 246 阅读 · 0 评论 -
pandas样本分层抽样(可以自己设置每一个类别抽取多少个样本)
import numpyimport pandas as pddata = pd.read_csv('data.csv')numpy.random.seed(seed=2) # 如果使用相同的seed( )值,则每次生成的随即数都相同,# 用groupby进行数据的分组,根据班级# gbr = data.groupby('class')# 获取分组后gbr的数据# gbr.g...原创 2019-11-09 11:55:45 · 13132 阅读 · 1 评论 -
sklearn 中模型保存的两种方法
一、 sklearn中提供了高效的模型持久化模块joblib,将模型保存至硬盘。from sklearn.externals import joblib#lr是一个LogisticRegression模型joblib.dump(lr, 'lr.model')lr = joblib.load('lr.model')二、pickle>>> from sklear...原创 2019-11-09 11:51:50 · 3724 阅读 · 3 评论 -
pandas打乱数据
在机器学习中,拿到一堆训练数据,一般会我们需要先将数据打乱,使数据随机排序,然后在进行切分,需要将数据切分成训练集、交叉验证集和测试集,在监督学习中还要切分出属性集和标签集。第一个实现方法:最简单的方法就是采用pandas中自带的 sample这个方法。假设df是这个DataFramedf.sample(frac=1)这样对可以对df进行shuffle。其中参数frac是要返回的...原创 2019-11-08 23:29:20 · 646 阅读 · 0 评论 -
如何删除pandas中产生的Unnamed:0列
我们在数据处理,往往不小心,pandas会“主动”加上行和列的名称,我现在就遇到了这个问题。这个是pandas中to_csv生成的数据各种拼接之后的最终数据(默认参数,index=True,column=True)Unnamed: 0 ip Unnamed: 0.1 ... 766 767 class0 0 go...原创 2019-11-08 21:08:21 · 11046 阅读 · 1 评论 -
pandas获取csv指定行,列
house_info = pd.read_csv('house_info.csv')1:取行的操作:house_info.loc[3:6]类似于python的切片操作2:取列操作:house_info['price'] 这是读取csv文件时默认的第一行索引3:取两列house_info[['price',tradetypename']] 取多个列也是同理的,注意里面是一个...原创 2019-11-06 17:01:32 · 5601 阅读 · 0 评论 -
Python 列表(List) 的三种遍历(序号和值)方法
# -*- coding: utf-8 -*-if __name__ == '__main__': list = ['html', 'js', 'css', 'python'] # 方法1 print '遍历列表方法1:' for i in list: print ("序号:%s 值:%s" % (list.index(i) + 1, i)...原创 2019-11-06 16:59:38 · 759 阅读 · 0 评论 -
conda中虚拟环境的使用
查看所有虚拟环境conda info --envsconda env list新建一个虚拟环境(以tensorflow为例子)conda create -n tensorflowpython=3.5设置下载通道(使用清华镜像)conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaco...原创 2019-11-01 14:50:12 · 586 阅读 · 0 评论 -
np.c_和np.r_的用法解析
np.c_是按行连接两个矩阵,要求行数不变。np.r_是按列连接两个矩阵,要求列数不变。一、np.c_的使用方法a = np.array([[1, 2, 3],[7,8,9]]) b=np.array([[4,5,6],[1,2,3]]) print('打印a:')print(a)print('打印b:')print(b)c=np.c_[a,b]print('打印c:'...原创 2019-10-27 20:00:05 · 423 阅读 · 0 评论 -
怎么理解np.random.seed()?
先抛出几个问题:1、利用随机数种子,每次生成的随机数相同。这是什么意思?2、随机数种子的参数怎么选择?在别人的代码中经常看到np.random.seed(Argument),这个参数不一样,有的是0,有的是1,当然还有其他数。那这个参数应该怎么选择呢?3.下一次重新执行这个程序的时候,产生的随机数还一样吗?seed还会起作用吗?做个试验:import numpy as np...原创 2019-10-27 19:15:45 · 1298 阅读 · 0 评论 -
pip版本降级到9.0.3
手贱,将pip升级到了最新版本 19.3.1 ,用pip命令安装报一堆错误,所以降级为9.0.3版本。使用命令:python -m pip install pip==9.0.3其中,-m参数的解释:run library module as a script (terminates option list)将库中的python模块用作脚本去运行。...原创 2019-10-25 21:03:26 · 1994 阅读 · 0 评论 -
利用Python自带的csv和sklearn中的train_test_split做分训练集和测试集脚本
需求:我们有csv文件,文件表示问特征+标签或者只有特征的形式,我们想要写一个脚本,以后再将数据分成训练集和测试集的时候,拿过来直接调用即可,泛化功能越强越好。1.读数据到内存中,并且封装到x_list (特征)和 y_list(标签)中,如果是非监督学习的话,放到x_list 中即可2.将数据list 按照一定的比例分成训练集和测试集,并返回给用户脚本文件:import...原创 2019-10-23 16:47:12 · 2847 阅读 · 0 评论 -
python中利用CSV库读写csv文件
csv文件:逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)1.读文件:首先我们先 看一下数据:我们创建了两个csv文件,一个是英文的,一个是带有中文的1.1 针对英文的读文件import csvf=open('data.csv','r')data...原创 2019-10-21 11:24:02 · 1695 阅读 · 0 评论 -
Python中open读写文件操作
Python内置了读写文件的函数open()1.读文件(使用内置的open()函数)f = open('/Users/michael/test.txt', 'r')‘r’ 表示读,我可以可以利用这个方法打开一个文件,如果文件不存在,会抛出一个IOError的错误,并且给出错误码和详细信息告诉你文件不存在。如果文件打开成功,我们接下来就要读文件操作了2.read()一次性 读取全部...原创 2019-10-21 09:43:05 · 1667 阅读 · 0 评论 -
Python利用tldextract模块提取域名中关键信息
tldextract是一个第三方模块,意思就是Top Level Domain extract,即顶级域名提取最近在做恶意域名的学习,需要用到这个工具,所以记录下来import tldextracttld = tldextract.extract('http://www.baidu.com/')print(tld)# result: ExtractResult(subdomain...原创 2019-10-20 17:51:36 · 2293 阅读 · 0 评论 -
python查看某个文件夹下面子文件夹个数和各个子文件夹下面文件个数
需求:我输入第一个方块,就是第一个文件夹地址,我需要查看该文件下面有多少个子文件夹,并且在该子文件夹下面各自存着自己类别的东西,我还想知道每一个子文件夹下面有多少文件?代码展示import osdirnum1=0filenum1=0file_count=0path='D:\苏叶\论文\总结\ccs2018\ccs2018'for lists in os.list...原创 2019-10-08 16:36:31 · 4105 阅读 · 0 评论 -
Python基础中的“坑”
一:list tuple dict set 是可迭代对象,那么字符串是否为可迭代对象?答案:是的,迭代对象的问题from collections import Iterableisinstance('abc', Iterable)Trueisinstance('', Iterable)True 二:Python集合定义?怎么创建一个空集合?答案:格式:集合名 = {元素...原创 2019-09-21 18:06:50 · 488 阅读 · 0 评论 -
python 字符串常用操作方法
python 字符串常用操作方法总结:python 字符串操作常用操作,如字符串的替换、删除、截取、赋值、连接、比较、查找、分割等1、去除空格str.strip():删除字符串两边的指定字符,括号的写入指定字符,默认为空格a=' hello 'b=a.strip()print(b)输出:hellostr.lstrip():删除字符串左边的指定字符,括号的写...原创 2019-09-07 14:23:04 · 768 阅读 · 0 评论 -
Python中四种交换两个变量的值的方法
Python中四种交换两个变量的值的方法方法一:(所有语言都可以通过这种方式进行交换变量) 通过新添加中间变量的方式,交换数值. 下面通过一个demo1函数进行演示: def demo1(a,b): temp = a a = b b = temp print(a,b)方法二:(此方法是Python中特有的方法) 直接将a, b两个变...转载 2019-05-27 20:32:41 · 1819 阅读 · 0 评论