Python学习笔记
shanghai_in_summer
这个作者很懒,什么都没留下…
展开
-
用Python下载网上的的文件
首先确保python已经安装了wget包,若没有安装,在终端执行如下命令:$ pip install wget$ conda install -c conda-forge python-wget假设网上文件的路径及名称为url,则在python中,执行如下命令:import wgeturl = ...filename0 = wget.download(url) # 将文件现...原创 2020-05-02 17:35:39 · 337 阅读 · 0 评论 -
python中的时间
1、将字符串日期转化为datetime.datetime格式的时间:import datetimecur = "2019-05-22"now = datetime.datetime.strptime(cur, "%Y-%m-%d")print(type(now))## 结果:<type 'datetime.datetime'>2、将datetime.dateti...原创 2019-05-24 01:39:43 · 129 阅读 · 0 评论 -
Python中的redis操作
import redisconn = redis.Redis(host = 1, port = 2, password = 3, db = 0) # db为服务器编号pipe = conn.pipeline(transaction = False) # 默认为False,只可以完成批量提交的作用,节省网络延时,改为True后可以实现事务功能pipe.set(key1, value1)p...原创 2019-05-30 23:27:57 · 145 阅读 · 0 评论 -
python包json探索
1、python的json包将字符串格式的json数据解析为字典形式的数据。例:import json s = """{"condition":"AND","rules":[{"id":"cmd","field":"cmd","type":"string","input":"text","operator":"equal","value":"137"},{"condition":"OR...原创 2019-04-27 20:13:10 · 102 阅读 · 0 评论 -
python在程序中调用系统命令
import oscmd = 字符串形式的linux命令error_code = os.system(cmd)若执行成功,则返回0,否则返回错误码.原创 2019-04-27 20:01:41 · 314 阅读 · 0 评论 -
python脚本连接mysql数据库的方法
import pymysql## 登录账号host = "host_name"user = "user_name"password = "password"database = "database_name"port = portconn = pymysql.connect(host, user, passwd, db, port) ## 登录数据库,返回连接cursor ...原创 2019-04-27 19:49:58 · 1027 阅读 · 0 评论 -
Python requests用法总结
requests用于向服务器发送请求。1、r = requests.get(url, stream), 发送GET请求,返回response类对象。 (1)参数: ① url:网址或资源存放处; ② stream:boolean,默认为False,表示访问命令发出后,r.content会立即被下载;当为True时表示暂时推迟r.content的下载。 (2)...原创 2018-10-27 19:35:39 · 265 阅读 · 0 评论 -
在内存中读写数据
1、StringIOfrom io import StringIO## 创建_io.StringIO内存缓冲器对象ff = StringIO()## 往f中写入字符串数据,并返回字符串的长度f.write('hello') # 结果:5f.write(' ') # 结果:1f.write('world!') # 结果:6##提取对象f中的全部内容f.getv...原创 2018-10-24 14:24:07 · 1052 阅读 · 0 评论 -
Python读取写入文件中数据的几种方法
# 一、读取文件中的数据# 1、读取CSV文件(1)import csvtext_data = []with open(save_file_name, 'r') as temp_output_file: reader = csv.reader(temp_output_file) for row in reader: ...原创 2018-10-24 11:50:36 · 2039 阅读 · 0 评论 -
计数器collections.Counter(*args, **kwds)
import collectionsl = [2,3,4,5,6,7,8]words = ['I']*random.choice(l)+['love']*random.choice(l)+['Python']*random.choice(l)+['becase']*random.choice(l)+["it's"]*random.choice(l)+['funny']*random.choi...原创 2018-10-31 13:41:10 · 161 阅读 · 0 评论 -
使用Python解压缩tar文档的方法
1、 tarfile包中的.open(name, mode)方法可以以mode指定的方式打开name压缩文件,并返回一个TarFile类对象。调用TarFile对象的extractall(path)方法可以将tar文档解压到path指定的位置。import tarfiletar = tarfile.open( '*.tar.gz', mode = "r:gz") #"r:gz"表示 ope...原创 2018-10-31 10:52:45 · 3393 阅读 · 0 评论 -
sklearn.feature_extraction.text模块下的CountVectorizer与TfidfVectorizer
1、CountVectorizer设我们有N个文档。 CountVectorizer首先统计这N个文档中除stop_words之外所出现过的词,生成一个词汇表(设词汇表为V,其长度为|V|)。再生成一个N*|V|的数组,设为A,则A[i, j]代表词汇表V中第j个词在第i个文档中出现的次数。from sklearn.feature_extraction.text import Count...转载 2018-10-25 19:04:18 · 2692 阅读 · 1 评论 -
python - 读文件
1、读csv文件(1)signature(签名):pd.read_csv(csv_file, header = n,index_col = 0) 解释:header = n表示以csv_file的第n行为字段名列表, n=-1时,以0,1,2,…,n_cols-1为字段名, index_col = 0表示以 第一列作为行索引。(2)使用csv模块import ...原创 2018-09-20 18:48:47 · 124 阅读 · 0 评论 -
《Scikit-learn 机器学习》第5章 线性回归算法 小结
做线性回归模型,1、增加多项式特征可以克服欠拟合问题,提高模型的效果,2、对特征进行归一化虽然无法提高预测精度,当可以提高计算效率。from sklearn.linear_model import LinearRegressionfrom sklearn.preprocessing import PolynomialFeaturesfrom sklearn.pipeline impor...转载 2018-08-04 17:49:40 · 215 阅读 · 0 评论 -
Python中的“管道(Pipeline)机制”
Python的sklearn.pipeline.Pipeline()函数可以把多个“处理数据的节点”按顺序打包在一起,数据在前一个节点处理之后的结果,转到下一个节点处理。除了最后一个节点外,其他节点都必须实现'fit()'和'transform()'方法, 最后一个节点需要实现fit()方法即可。当训练样本数据送进Pipeline进行处理时, 它会逐个调用节点的fit()和transform()方...原创 2018-08-04 11:36:57 · 22910 阅读 · 0 评论 -
学习曲线
绘制学习曲线学习曲线:以训练数据集样本量(number of training samples)为横坐标,以模型在训练样本和交叉验证样本上的平均得分以及得分区间为纵坐标,绘制出的曲线就是学习曲线。绘制学习曲线步骤:生成在 附近波动的点作为训练样本:将数据集分成训练数据集和交叉验证数据集; 取训练数据集的20%作为训练样本,训练出模型; 计算模型在训练数据集和交叉验证数据集上的得...翻译 2018-07-22 20:18:18 · 2549 阅读 · 2 评论 -
训练数据集和交叉验证数据集的分割方法
(一)K折交叉验证from sklearn.model_selection import KFold ## K折交叉验证 X = np.arange(36).reshape(18,2) kfold = KFold(n_splits = 9) ## kfold为KFolf类的一个对象for a, b in kfold.split(X):...原创 2018-07-30 00:28:53 · 3712 阅读 · 0 评论 -
图形可视化
数据可视化——子图(1)import marplotlib.pyplot as pltfig, axes = plt.subplots(n_rows, n_cols, figsize, sharex, sharey, ... )返回一个二元元组,第一个元素为绘图对象Figure,第二个为n_rows*n_cols型数组,每个元素为绘图子轴;for i in range(n_r...原创 2018-07-25 17:58:13 · 1450 阅读 · 0 评论