自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(144)
  • 资源 (3)
  • 收藏
  • 关注

原创 ocr学习_模型改进

ocr学习_模型改进1.paddleocr如何提升性能思考1.1 初步优化1.2 方向优化1.3 待续1.paddleocr如何提升性能思考目前困境:场景分析:识别用户上传的图片中的文本存在的问题:1、图片倾斜导致ocr识别不准2、图片颠倒,导致识别出来的文本,顺序错乱3、图片尺寸太大,识别效率太慢4、部分图片模糊,导致识别准确率率下降1.1 初步优化1、矫正图像2、缩放图像3、提高图像对比度待续1.2 方向优化paddleocr的方向分类器,在这0度和180度个方向上的识别准

2021-07-19 23:29:52 493 2

原创 OCR(基础学习)

OCR竞赛实践1.基础环境下载2.下载预测模型3.测试预测4. finetueOCR (Optical Character Recognition,光学字符识别)是最早的计算机视觉任务之一。人类使用电子设备(图像采集装置)采集现实场景中打印的字符,然后通过检测字符的形状,用字符识别的方法将其翻译成计算机文字。1.基础环境下载python -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple2.下载预测模型m

2021-07-16 09:00:34 628 1

原创 OCR学习_基础环境配置

OCR学习_基础环境配置1.环境准备1.环境准备1.检查cuda的版本信息,然后到飞浆去配置选择相应的环境,选择对应的paddlepaddle-gpu版本即可。或者在命令行中输入nvidia-smiimport paddle.fluid输入paddle.fluid.install_check.run_check()报错Suggestions: 1. Check if the third-party dynamic library (e.g. CUDA, CUDNN) is

2021-07-11 15:30:57 738

原创 分治算法

算法学习之分治算法1. 简介1.1 主要思想:1.2 适用范围:1.3 基本设计模式2 算法实践2.1 排序算法2.2 最大子序列和2.3 二分查找3 常见使用场景的算法1. 简介1.1 主要思想:将原问题递归的分成若干的子问题,直到满足边界条件停止递归,将子问题解决(同种方法),然后合并子问题,最后,算法层层合并得到答案。即: 分、治、合。1.2 适用范围:分治法所能解决的问题一般具有以下几个特征:1) 该问题的规模缩小到一定的程度就可以容易地解决2) 该问题可以分解为若干个规模较小的

2021-05-23 12:22:45 304

原创 力扣_买卖股票的最佳时机 II

买卖股票的最佳时机 II1.简介2.解题思路2.1 动态规划2.2 贪心算法1.简介给定一个数组 prices ,其中 prices[i] 是一支给定股票第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。示例 1:输入: prices = [7,1,5,3,6,4]输出: 7解释: 在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出

2021-05-17 10:06:18 182

原创 spring构建一个 RESTful Web Service

spring构建一个 RESTful Web Service1.简介2.如何构建1.1 使用spring Initialize开始构建1.2 自己定制构建1.3 使用idea 构建该项目1.4 创建相应的bean和controller1.简介RESTful(Representational state transfer))简化了 web service 的设计,它不再需要 wsdl ,也不再需要 soap 协议,而是通过最简单的 http 协议传输数据 ( 包括 xml 或 json) 。既简化了设计

2021-05-13 23:19:04 265 2

原创 前端vue指令(2)

vue指令1.指令学习1.指令学习1.1v-show的使用根据表达式的真假,切换元素的显示和隐藏。总结1.2 v-if 的使用根据表达式的真假,切换元素的显示和隐藏(操纵dom元素)与v-show的区别,v-if 会将其从dom中去掉。消耗大一点。1.3 v-bind 的使用操作属性(src,title,class等)![在这里插入图片描述](https://img-blog.csdnimg.cn/20201026224635370.png?x-oss-process=i

2020-10-27 21:32:03 129

原创 vue前端学习路线及部分vue指令(1)

vue基础1.vue大的基础2.vue指令1.vue大的基础1.vue的介绍2.建立第一个实例代码<html><head> <meta charset="utf8"> <title>hello vue.js</title> <!-- <script src="resource/vue.js" type="text/javascript" type="utf8"></script&g

2020-10-26 00:07:21 189

原创 前端学习

前端学习1.安装前端开发工具2.安装插件1.安装前端开发工具1 下载vscode链接 https://code.visualstudio.com/Download.根据需求安装对应版本,可选择user installer 和system installer.区别:user版会安装在当前计算机帐户目录,这意味着如果使用另一个帐号登陆计算机将无法使用别人安装的vscode.而system版本可以安装在非用户目录,例如C盘根目录,任何帐户都可以使用.vscode默认提供的user版本,大多数人都是用

2020-10-19 22:29:15 182

原创 基于selenium的网络语料获取

基于selenium的网络语料获取selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法执行javaScript代码的问题。优点就是可以帮我们避开一系列复杂的通信流程,例如在我们之前学习的requests模块,那么requests模块在模拟请求的时候是不是需要把素有的通信流程都分析完成后才能通过请求,然后返回响应。假如目标站点有一系列复杂的通信流程,例如的登...

2020-05-07 11:20:11 247

原创 数据挖掘task3特征工程

数据挖掘task3特征工程1.特征工程1.1 常见的特征工程1.2 代码实战1.特征工程特征工程是对数据进一步分析和对数据进行处理。1.1 常见的特征工程1 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断;2 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布...

2020-03-27 19:33:59 247

原创 数据挖掘_task2数据探索分析

数据挖掘_task2数据探索分析EDA1.前言2.内容介绍2.1 读取数据并查看大体信息2.1.1读取数据2.1.2 查看数据信息2.1.2.1 数据集的概况2.1.2.2 判断数据缺失和异常2.1.2.3 预测值的分布2.1.2.4 特征值的分布2.1.2.5 特征值分析2.1.3 pandas_profiling生成数据报告1.前言EDA目标EDA的价值主要在于熟悉数据集,了解数据...

2020-03-20 21:59:05 668

原创 数据挖掘_task1赛题分析

task1赛题分析1.理解赛题1.1 赛题要求1.2 数据1.2.1 预测指标1.3 读取数据代码1.4 查看一些pandas 自带对数据得统计1.理解赛题赛题:零基础入门数据挖掘 - 二手车交易价格预测1.1 赛题要求比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。来自 Ebay Kleinanzeigen 报废的二手车,数量超过 370,000,包含 20 列变量信息...

2020-03-20 16:10:39 2035

原创 模型预测评估

模型预测评估1.数据处理2.模型预测1.数据处理2.模型预测

2020-03-16 21:54:02 1162

原创 房产预测_数据处理

数据处理1.数据处理1.1 读取数据1.2 处理数据2 保存数据1.数据处理1.1 读取数据查看列信息1.2 处理数据由于的做的是预测房价。为了简单模型,去掉了一些不必要的字段如标题title 核心卖点,配套设施。三个字段。分析数据 downPayment 和Price 成正比可以去掉预测房价所以price 也不能有。我们预测的房子的价格也是房子的每平方的单价,所以...

2020-03-14 11:16:26 656

原创 动手学习深度学习_作业

动手学习深度学习——作业1.分类任务前言1.1 利用VGG模型1.2 使用Resnet1.分类任务Fashion-mnist分类任务:针对Fashion-MNIST数据集,设计、搭建、训练机器学习模型,能够尽可能准确地分辨出测试数据地标签。前言1.1 利用VGG模型import osimport sysimport timeimport torchfrom torch im...

2020-03-02 21:45:25 676

原创 手动学习深度学习_08

手动学习深度学习_081.文本分类1.1 文本情感分类1.2 文本情感分类数据集1.2.1读取数据以及预处理1.3使用循环神经网络进行情感分类1.3.1双向循环神经网络1.3.2 加载预训练的词向量1.3.3 评估训练1.4 使用卷积神经网络进行情感分类1.4.1 使用卷积神经网络1.4.2 时序最大池化层1.4.3 TextCNN 模型2.数据增强2.1图像增广2.2 常用的图像增广方法2.2....

2020-02-25 19:07:15 523

原创 动手学深度学习_7

动手学深度学习_71. word2vec1.1词嵌入基础1.2 Skip-Gram1.2.1 二次采样1.2.2 Skip-Gram 跳字模型1.2.3负采样近似1.2.4 训练2.词嵌入进阶2.1GloVe 全局向量的词嵌入2.2 载入预训练的 GloVe 向量1. word2vec1.1词嵌入基础我们在“循环神经网络的从零开始实现”一节中使用 one-hot 向量表示单词,虽然它们构造起...

2020-02-25 17:12:38 191

原创 动手学深度学习_6

动手学深度学习_61 .梯度下降1.1 介绍1.2 例子1.3 牛顿法1.4 随机梯度下降2.优化算法2.1 MomentumAn ill-conditioned ProblemMaximum Learning RateSupp: PreconditioningMomentum AlgorithmExponential Moving AverageSupp由指数加权移动平均理解动量法Impleme...

2020-02-25 12:57:38 199

原创 动手学深度学习_4

动手学深度学习_41循环神经网络1.1 GRU1.2 LSTM1.3 深层RNN深度循环神经网络1.4 双向RNN双向循环神经网络2 机器翻译3 注意力机制与Seq2seq模型4 Transformer1循环神经网络1.1 GRURNN存在的问题:梯度较容易出现衰减或爆炸(BPTT)Ht=ϕ(XtWxh+Ht−1Whh+bh)H_{t} = ϕ(X_{t}W_{xh} + H_{t-...

2020-02-19 17:24:35 198

原创 动手学深度学习_5

动手学深度学习_51 卷积神经网络1.1 二维互相关运算1.2 二维卷积层1.3 填充和步幅填充步幅1.4 池化池化二维池化层1.5 总结2 卷积神经网络进阶2.1 LeNet 模型2.2 深度卷积神经网络(AlexNet)2.3 VGG2.4 NiN2.5 GoogLeNet2.6 残差网络(ResNet)2.7 稠密连接网络(DenseNet)1 卷积神经网络本文介绍卷积神经网络的...

2020-02-19 17:23:07 234

原创 动手学深度学习_3

动手学深度学习_31.过拟合、欠拟合1.1 过拟合、欠拟合的概念1.2. 权重衰减1.3. 丢弃法1.过拟合、欠拟合1.1 过拟合、欠拟合的概念训练误差和泛化误差在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,...

2020-02-19 16:25:04 122

原创 pytorch手动学深度学习

pytorch手动学深度学习_打卡Task01:线性回归;Softmax与分类模型、多层感知机(: task1_动手学深度学习_1.Task02:文本预处理;语言模型;循环神经网络基础: task1_动手学深度学习_2....

2020-02-14 21:19:24 205

原创 动手学深度学习_2

动手学深度学习_21.文本预处理1.1读入文本1.2 分词1.3 建立字典1.4 词索引相互转换2.语言模型2.1语言模型2.2 n元语法2.3 时序采样2.3.1 随机采样相邻采样3.循环神经网络3.1 循环神经网络的构造3.2 实现循环神经网络1.文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:1.1读入文本...

2020-02-14 18:58:40 441

原创 动手学深度学习_1

pytorch动手学深度学习_11.线性回归1.1线性回归1.1.1 数据集1.1.2 模型1.1.3 损失函数1.1.4 优化函数 - 随机梯度下降1.2 代码实现1.2.1 线性回归从零开始版1.2.2 线性回归pytorch版2.softmax与分类模型2.1 softmax的基本概念2.2 交叉熵损失函数2.3代码2.3.1 softmax分类从零开始版2.3.2 softmax分类pyt...

2020-02-13 19:03:30 587

原创 打造代理ip池

打造代理ip池1.介绍2.分析西刺代理ip网站3.获取ip4. 验证代理ip可用性5.代码6. 结果1.介绍有时候需要爬取某个网站的大量信息时,可能由于爬的次数太多导致我们的ip被对方的服务器暂时屏蔽。2.分析西刺代理ip网站3.获取ipfrom bs4 import BeautifulSoupimport requestsfrom urllib import request,e...

2020-01-02 20:02:42 278

原创 爬取小说

爬取小说1.分析网址结构2.代码实现3.结果显示1.分析网址结构由上可知小说的网址。然后分析章节的地址。分析文本具体位置2.代码实现# 用于获取网页的htmlfrom urllib import request# 用于解析htmlfrom bs4 import BeautifulSoupimport re# 得到网页的htmldef getHtml(url): ...

2020-01-01 13:26:09 202

原创 北京市房价预测---数据收集

蓝房网爬虫bs4+requests+北京1.查看网址的结构2.soup.select()方法的常用方法3.爬虫代码4.爬取结果1.查看网址的结构由下图可知楼盘信息的url。明显可知后缀为search-y{}。收集的信息为楼盘名、地址、开盘时间、价格、销售状态。2.soup.select()方法的常用方法1、class对于html内的内容,可以通过class来进行定位,一般形式为:...

2019-12-29 13:51:14 739 1

原创 tensorflow 手写体识别的两种实现

手写体识别1. 利用神经网络2.利用cnn神经网络大概的几个步骤1.获取数据,确定输入的形式2.定义网络结构,包括权重和偏置的初始化3.定义目标函数(或者损失函数)4.定义优化函数(如随机梯度下降,Adam等)5.会话(Session)Session对象负责着图中所有Op的执行6 训练测试数据7.测试集上获取相应的指标的大小(本文是准确率)8.保存模型1. 利用神经网络i...

2019-10-07 23:44:02 742

原创 剑指offer(2)

剑指offer2斐波拉契数列矩阵覆盖跳台阶变态跳台阶旋转数组的最小数字矩阵中的路径斐波拉契数列题目描述大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项(从0开始,第0项为0)。n<=39思路递归,或者,使用变量储存前面两个值的斐波那契值。public class Solution { public int Fibonacci(int n) {...

2019-09-08 22:52:53 243

原创 剑指offer(1)

剑指offer1数组中重复的数字二维数组中的查找替换空格从尾到头打印链表重建2叉树二叉树的下一个结点用两个栈实现队列数组中重复的数字题目描述在一个长度为 n 的数组里的所有数字都在 0 到 n-1 的范围内。数组中某些数字是重复的,但不知道有几个数字是重复的,也不知道每个数字重复几次。请找出数组中任意一个重复的数字。Input:{2, 3, 1, 0, 2, 5}Output:2解...

2019-09-07 21:41:01 101

原创 力扣动态规划

力扣动态规划1. 斐波那契数列70. 爬楼梯1要求2 思路198. 打家劫舍1要求2.思路2131 要求2.思路矩阵路径64. 最小路径和1 要求2.思路62. 不同路径1要求1. 斐波那契数列70. 爬楼梯1要求假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?注意:给定 n 是一个正整数。示例 1:输入: 2输...

2019-09-06 10:48:19 1283

原创 力扣搜索

力扣搜索BFS 广度优先搜索101. 对称二叉树1.要求2.思路279 完全平方数1 要求2 思路DFS 深度优先搜索backtracking 回溯BFS 广度优先搜索广度优先搜索:广度优先搜索一层一层地进行遍历,每层遍历都以上一层遍历的结果作为起点,遍历一个距离能访问到的所有节点。需要注意的是,遍历过的节点不能再次被遍历。在程序实现 BFS 时需要考虑以下问题:队列:用来存储每一轮遍历得...

2019-09-06 09:05:19 395

原创 力扣分治

力扣分治241. 为运算表达式设计优先级1.要求2.思路95. 不同的二叉搜索树 II1.要求2 思路241. 为运算表达式设计优先级1.要求给定一个含有数字和运算符的字符串,为表达式添加括号,改变其运算优先级以求出不同的结果。你需要给出所有可能的组合的结果。有效的运算符号包含 +, - 以及 * 。示例 1:输入: “2-1-1”输出: [0, 2]解释:((2-1)-1) = ...

2019-09-04 14:44:17 239

原创 力扣二分查找

力扣二分查找704 二分查找1.要求2.思路69 x 的平方根1.要求744 寻找比目标字母大的最小字母1.要求2.思路540有序数组中的单一元素1.要求2.思路153. 寻找旋转排序数组中的最小值1.要求2.思路704 二分查找1.要求给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标...

2019-09-03 20:56:27 506

原创 力扣贪心算法

力扣贪心算法455. 分发饼干1.要求2.思路435. 无重叠区间1.要求2 思路455. 分发饼干1.要求假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。对每个孩子 i ,都有一个胃口值 gi ,这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干 j ,都有一个尺寸 sj 。如果 sj >= gi ,我们可以将这个饼干 j 分配给孩子 i ,这...

2019-09-03 16:45:53 957

原创 力扣排序算法

力扣排序算法Kth Element 问题堆215. 数组中的第K个最大元素1.要求2. 思路Kth Element 问题用于求解 Kth Element 问题,也就是第 K 个元素的问题快速排序的 partition() 进行实现。需要先打乱数组,否则最坏情况下时间复杂度为 O(N2)堆用于求解 TopK Elements 问题,也就是 K 个最小元素的问题。可以维护一个大小为 K 的最...

2019-09-02 16:40:23 1045

原创 力扣---指针题

双指针167. 两数之和 II - 输入有序数组1.要求2.思路633. 平方数之和1.要求2.思路345. 反转字符串中的元音字母1.要求2.思路680. 验证回文字符串 Ⅱ1.要求2.思路88. 合并两个有序数组1.要求2.思路167. 两数之和 II - 输入有序数组1.要求给定一个已按照升序排列 的有序数组,找到两个数使得它们相加之和等于目标数。函数应该返回这两个下标值 index...

2019-09-02 09:59:13 585

原创 自然语言处理中的语言模型预训练方法--ELMO

自然语言处理中的语言模型预训练方法--ELMO1.引言2. ELMO3. ELMO 方法4 ELMO使用5. 总结1.引言在介绍论文之前,我将先简单介绍一些相关背景知识。首先是语言模型(Language Model),语言模型简单来说就是一串词序列的概率分布。具体来说,语言模型的作用是为一个长度为m的文本确定一个概率分布P,表示这段文本存在的可能性。在实践中,如果文本的长度较长,P(wi | ...

2019-06-22 19:00:15 2653 1

原创 从维基百科抽取json数据到文本的代码

从维基百科抽取json数据的代码目的1.下载json的数据2.写入目的为了获取语料中的中文数据。1.下载json的数据2.写入如果一次性写入太大,可能写入不了,因此采用逐行写入import pickleimport jsonfile=open("translation2019zh_train.json",'r',encoding="UTF-8")line=file.readl...

2019-06-17 10:26:07 1227

储久良-web课程PPT.zip

ppt

2021-02-24

jdk1.8-winx64.rar

这是jdk1.8 版本64 位。欢迎下载,谢谢。如有问题请咨询。

2019-06-28

越南单语语语料6万

新闻网站上爬取的越南语料,越南单语语语料6万下载。欢迎下载

2019-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除