数据预处理
tutu96177
这个作者很懒,什么都没留下…
展开
-
数据预处理_数据标准化
处理时序数据或者非图像类数据时候,如果所选用的模型的数据假设是:数据特征分布是高斯分布,则在归一化时候采用 “均值-方差标准化”,标准化后的数据分布呈正太分布,均值为 0, 方差为 1 的正太分布。如果原始数据的分布可以近似为高斯分布,否则标准化的效果会变得很糟糕。在实际部署过程中,训练集和测试集是分开的,如果在训练集中使用了 Sklearn 中的 StandardScaler(),均值方差标...原创 2019-12-09 11:01:48 · 403 阅读 · 0 评论 -
pip 批量下载包到指定目录
pip download -r requirements.txt -d ./temp./temp 是下载包到目标目录requirements.txt 需要下载的包原创 2019-10-21 17:38:56 · 2027 阅读 · 0 评论 -
python 正则表达式取小括号里的字符串
import rep1 = re.compile(r'[(](.*?)[)]', re.S) #最小匹配freezer_kind = re.findall(p1, file_name)原创 2019-08-05 17:29:34 · 7539 阅读 · 0 评论 -
python 操作 csv 编码问题,繁体字体乱码
# -*- coding: utf-8 -*-#import osimport pandas as pddef get_file(): work_dir = './人工可以区分除霜与非除霜_99/' file_list = os.listdir(work_dir) lk = pd.DataFrame() lk['file_name'] = file_lis...原创 2019-08-26 08:27:36 · 2098 阅读 · 0 评论 -
忽略弹出的 warnings_ workalendar(节假日时间处理)_进度条
import warningswarnings.filterwarnings('ignore')from workalendar.asia import China # 节假日计算包def cal_holiday(): cal = China() for i in cal.holidays(2019): # print(i[0]) print(i)cal_holiday()...原创 2019-09-02 13:45:58 · 1505 阅读 · 0 评论