自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 用pytesseract进行OCR识别图片中的文字

首先在Github上下载简体中文训练文件然后通过brew安装tesseract,把训练文件放入相应文件夹再然后通过pip安装pytesseract即可运行示例代码如下:import pytesseractfrom PIL import Imageimage = Image.open('2.jpeg')code = pytesseract.image_to_string(image,...

2019-08-19 01:16:14 554

原创 利用feature-selector进行特征选择

dataset = pd.read_csv(’/content/drive/My Drive/test_lightGBM/EUR_USD_NEWS_SOCIAL_daily_fe.csv’)y = dataset[‘bid_chg_on’].valuesx = dataset.drop(columns=[‘date’,‘bid_chg_on’,‘ask_chg_on’,‘bid_chg_1w’...

2019-08-07 21:53:43 1769

原创 一个机器学习模型的应用架构

dataset文件夹xxx.csv数据文件data_process文件夹xxx.py含处理数据的各函数.configs文件夹xxx.json模型配置文件,比如LSTM.json,记录超参数等models文件夹model.py一个不含实际内容的超类Model类Sequential.py继承Model类的子类Sequential类在__init__初始化的过程...

2019-08-04 02:39:28 1844

原创 LSTM与GRU的扼要理解

LSTM:三个门 - 遗忘门、输入门、输出门门可以理解为mask,用来过滤筛选信息。单次输入、细胞状态、单次输出,均是列向量。即总的输入是一连串的列向量。解释:除去最右边的蓝色tanh,其他每一个激活函数图标,都代表着 f(Wx+b) 即激活一个线性运算。三个门共四个要激活的线性运算,代表着四对可训练的矩阵W和截距b。这四对参数才是LSTM训练过程中真正在训练的东西。由于细胞状态c与隐状态...

2019-08-03 19:23:05 710

原创 在Shell中循环运行Python(传递参数)

在Shell中:for i in {0…100}; do python onepara_SVM.py $i; done如需跳跃:在Shell中进行运算for i in {0…10}; do python onepara_SVM.py $[10*i]; done其中Python程序需要:from sys import argvscript , i = argv(script为文件名xx...

2019-08-03 17:52:52 4309

原创 k-means和knn的区别

k-means是聚类(无监督学习),先定好k个类别,然后随机确定k个坐标(聚类中心),各点离哪个坐标近就算做哪类,然后不停算平均值求出中心,直到稳定,聚类完成。有训练的过程。k-means++使初始的聚类中心坐标相距尽可能远。knn = k nearest neighbor是分类(监督学习),定好k直接把待分类点周边最近的k个点计数,数量多的那类定为待分类点的类别。无训练的过程。...

2019-08-03 17:50:11 3380

原创 Python机器学习库记录

模型训练操作:数据划分:sklearn.model_selection.train_test_split超参自动搜索:sklearn.model_selection.GridSearchCV预测报告生成:sklearn.metrics.classification_report / sklearn.metrics.confusion_matrix解析xml树:import xml.etre...

2019-08-03 17:49:05 213

原创 程序设计思想与方法 笔记

程序设计思想与方法问题求解中的计算思维第一章 计算与计算思维1.3 初识Python查看Mac中Python安装目录: 终端开启Python → import sys → print sys.path添加模块到Python搜索路径: /Library/Python/2.7/site-packages程序的执行方式: 1.直接在bash中 python /Users/liuzf/Desk...

2019-08-03 17:46:42 2440 1

原创 Learn Python The Hard Way 笔记

LPTHW note1.mkdir 建立目录touch 建立空白文件2.cd LPTHW 进入某个路径,将其设为根目录cd … 返回上级目录3.ls 展示当前目录ls -R 展示当前目录中的所有子目录层4.cat xxx.xx 在(Linux,MacOS)终端里展示文件内容open xxx.xx 打开xxx.xx文件注意,若文件名有空格,则用\转义空格:cat L...

2019-08-03 17:42:32 269

原创 20171208【笔记】学习一个Python3爬虫程序

1.获得当前时间字符串:输入:import datetimedatetime.datetime.today().strftime(’%Y-%m-%d %H:%M:%S’)输出字符串:‘2017-12-08 19:55:59’2.标识浏览器身份的User-Agent:webheader = {‘User-Agent’: ‘Mozilla/5.0 (Macintosh; Intel Mac...

2019-08-03 17:39:31 285

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除