自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

最后的坚持

生活中需要坚持一些原则和信念

  • 博客(42)
  • 资源 (1)
  • 论坛 (1)
  • 收藏
  • 关注

原创 OpenCV 3.0 入门之图片的读写与显示

再一次回到了图像处理,OpenCV 已经如此的强大了。慢慢学习,然后从入门到放弃… Life is short, show me the code… 读取图像文件 imread,图像显示 imshow,写图像文件imwrite 如此统一简洁的函数,好用好记。#include<opencv2\highgui.hpp>#include<opencv2\core.hpp&g...

2018-06-07 21:28:02 749

翻译 怎样使用已有的工具训练Tesseract 3.03–3.05来识别新的语言

本文是Tesseract训练教程的翻译,有不妥的地方请大家指出,欢迎讨论原教程页面 Tesseract简介Tesseract 3.0x 是一个具备识别新的语言能力的软件,这种能力完全可以通过训练的方式 获得。本教程描述了整个训练过程,提供了一些适用于各种语言的指导原则,以及最后可以取得的 结果。在你开始训练的工作前,请在traineddata 上确认是否3.04 版本已经提供了你所需要的语言的数

2017-12-16 10:52:56 3180

原创 OCR 开源软件 Tesseract 的下载和入门使用

资源下载tesseract-ocr-setup-3.05.01.exe 注: 安装的时候选好要识别的语言tesseract-4.0-with-LSTM#400-alpha-for-windowsWindows中运行tesseract1.tesseract 是一个命令行OCR程序,打开一个终端(组合键Win +R),输入:tesseract imagename outputbase [-l lang

2017-12-09 18:30:04 4938

原创 大小端 程序验证

原理大小端来自 Big Endian 和 Little Endian的直译,他们描述计算机是怎么来存储字节的。 由于计算机中存在着大于1个字节的数据类型,例如整型在C++中一般用4字节的空间来 表示,这就存在着这4个字节在空间上怎么按字节存放一个整数的问题。 方案有以下两种,如图1所示: 1. 大端存放情况下,对于数据0XABCD,先存放高位字节AB,再存放低位字节CD。由于 数

2017-12-02 17:44:38 809

原创 python 面向对象编程

类的声明与使用#声明class colleague(object): pass#创建对象lisi = colleague()构造函数与类方法class colleague(object): def __init__(self,name,age,sex): ''' self 永远是第一个参数,也是必须的 self 表示实例本身,调用时不需要传入 _

2017-07-31 22:51:51 217

原创 python 函数式编程

1.高阶函数 Higher-order function 能将函数作为自己参数的函数 成为高阶函数2.map/reduce将func作用在 iterables 中每一个元素上,将结果用一个Iterator返回.map(func, *iterables) --> map object格式化姓名,第一个字母大写,后面的都小写def normalize(name): if len(nam

2017-07-31 22:44:31 720

原创 去掉Sublime text 3中的框框

出现了下面这种框框一般是在ST3 中安装了Pylinter这种代码检查插件 去掉框框只需要隐藏这个插件即可:ctrl+shift+p —>pcd—->Package Control:Disable Package—->Pylinter 这样就能取消代码检查的功能,重启ST3,保存代码框框就不会有了。

2017-07-24 21:01:23 3169 1

原创 在Win7 32位系统中 将Sublime Text3配置成Python3.x 编辑器

1.下载Python3.5 注意下载windows版本2.下载Sublime Text 3 注意windows版本3. 配置过程3.1 为安装插件做准备 1. 打开控制台 viwe -->Show console 2. 打开https://packagecontrol.io/installation#st3 将其中的配置代码复制到控制台中,然后回车,即可安装插件管理平台,如下图: 3.2

2017-07-13 20:15:42 1041

原创 文档特征提取

只是想说,nltk 提供的分类器也能使用数值型的特征权重,可以参考书245

2017-04-30 23:41:46 361

原创 写给自己

我不知道自己能走多远,是否能到达,只是不敢想象目的地到底有多美。 为此,我选择坚持,慢慢地成长, 或许路边的一朵小红花足以让我开心好久,一路的风景也是收获啊!听到的,我会忘记; 看得到, 我会记住; 只有我做到了,我才会真正理解。

2017-04-23 22:04:30 149

原创 python 合并两个字典

合并字典sentiment_dict 和 pos_dict 为 all_dict 方法一:最 pythonic 的方法all_dict = {**sentiment_dict ,** pos_dict}方法二:all_dict = {k: v for d in [sentiment_dict , pos_dict] for k, v in d.items()}方法三:最基础的方法all_dict

2017-04-10 16:53:35 485

原创 情感分析资源收集

代词 http://xh.5156edu.com/page/z2190m2907j18579.html 语气词 http://baike.baidu.com/item/语气词?fr=aladdin 连词 http://xh.5156edu.com/page/z7501m8716j18595.html 能愿动词 http://baike.baidu.com/link?url=ijNr

2017-04-01 15:43:17 473

原创 win64 安装 python + NLTK(附 python MemoryError 解决方法)

如果使用scikit模块进行自然语言处理的话,python最好安装32位的,这可以跟后面使用的 模块配套。 更为重要的是,一旦你的数据量比较大的时候,可能出现系统内存不够MemoryError 的情况,这个时候你就 需要使用64位系统,就像我现在做的工作一样。类似的问题:Python MemoryError when doing fitting with Scikit-learn1. pip

2017-03-20 21:09:29 3720

原创 No module named 'scipy'问题 与 python中 scipy模块的安装

安装环境win32 + python 3.5安装过程先要安装numpy 模块才能安装 scipy,这个你在pip install scipy 的时候,会提示你的,于是先安装numpy: pip install numpy 然后在官网上下载scipy安装包(注意windows版本)目前这个软件(.exe)是scipy -0.16.1版本的,支持python3.4 版本,如果你的python版本不是3.

2017-03-15 16:41:42 43884

原创 python 处理movie-review-data遇到的UnicodeDecodeError 编码问题

问题描述:下载了Bo Pang的主客观数据集,在使用py3 读取quote文件时,产生了错误,如下:UnicodeDecodeError: 'gbk' codec can't decode byte 0x96 in position 4990: illegal multibyte sequence问题分析:显然是解码的问题,也就是使用 gbk 编码无法解码该文本位置为4990处的 字节内容。那就是

2017-03-13 21:21:36 562

原创 leetcode 第28题 实现函数strStr

leetcode 第28题 实现函数strStr 在主串中查找子串首次出现的位置我的 思路 是从主串第一个位置开始与子串匹配,如果当前字母不匹配,那么 主串 从 上次开始匹配的下一个位置 开始与子串的第一个字符开始匹配(这种方法存在回溯,也就是没有利用上次匹配的结果导致下次还是从头开始匹配。还有一种无回溯的字符串模式匹配KMP算法,效率会比这个高很多 ,时间复杂度为O(n+m),下次给出代码)

2016-08-10 16:37:39 689

原创 leetcode 第14题 最长前缀

14 最长前缀 我的 思路 是 先从前面两个串中找到一个待修正的共同前缀,然后再剩余的串中来调整该前缀,这样的时间复杂度为o(n)class Solution {public: string longestCommonPrefix(vector<string>& strs) { if(strs.size() == 0) return string(""); if(s

2016-08-09 21:50:44 379

原创 valid parentheses leetcode 第20题

valid parentheses leetcode 第20题 我的思路是用栈来检查括号的匹配。class Solution {public: bool isValid(string str) { int len = str.length(); if( len < 2) return false; if(str[0] == '}' || str[

2016-08-09 17:25:14 344

原创 Markdown 语法入门

Markdown 语法详解

2016-08-08 22:15:27 392

原创 Win7 VC++6.0打开文件崩溃 FileTool.dll

每次装VC++6.0都会各种奇怪的问题,这次一定要把遇到的问题都记下来,希望下次能一次性全部搞定,也希望不要再用VC++6.0了(有的时候这不是由自己能控制的,有的是培训用,有的是公司的项目之前用的是VC开发的,等等这些情况还是要用到VC++6.0)。关于打开文件崩溃的文章已经很多了,例如很好的:Win7下VC++6.0打开文件报错导致其崩溃的解决办法,这里只是强调一下下载的文件要放到自己安装

2016-07-13 15:32:52 7037

原创 VC安装提示 couldn't find Acme setup

系统环境为Win7 32位,这个问题的资料已经相当丰富了,只是最先给出解决方法的博主的命令行的格式让人头痛,不知道到底有没有空格。为了给出准确的命令,我把成功安装的命令截图如下:命令行的参数的详细解释请看上面的博主的内容,除了这个正确的命令行参数外,我还把安装文件拷贝到了参数 /S 后面这个路径里,这里也就是把VC安装文件拷贝到路径 J:\VC_install 了。如果安装过程中提示msb

2016-07-11 11:46:36 1610

原创 WIN Server 2012 添加角色失败

问题背景就不介绍了,反正就是添加应用服务器角色的时候一直失败。后来在搜狗上搜到了一个可行的解决方案。本来要给出解决方案的参考网址的,不小心关了浏览器,历史关后清空了,后来找了半天也没有找到。算了,反正这个方案的步骤我都还清晰地记得,毕竟亲自操作了一遍。1.在CMD命名栏中输入gpedit.msc      2.按下图中的标记顺序操作,最后点击策略设置3.将已禁用改为已启

2016-05-24 22:33:31 11464

原创 学习方法反思

这里谈的应该是我的自学方法吧!在看到刘未鹏学长的博客前,我很少想这个问题。        我的学习方式大体上应该是这个样子:或者是兴趣使然或者是导师要求的任务,我会认真地看一些资料和相关书籍。看资料当然是一件很枯燥的事,但是我很乐意去看,因为我知道要想真正弄懂你所做的事,一些本质和关键性的信息就在那些枯燥的文档里。我是一个发现事物本质都有快感的人,那样让人对一件事有一个清晰透彻的认识。但是,我

2016-05-23 11:35:09 477

原创 string in C++98 的用法总结

写在前面string对象是表示字符串的对象,支持单字符操作,还有一些很好的函数,方便了编程。为了很好地使用这个类,这里做一下用法总结。string类是basic_string类模板的一个实例,它的字符类型是char。string对象支持单字节字符操作,不支持多字符编码或变长编码字符的处理。用法总结(1)构造函数 default (1) string(); co

2016-05-20 21:19:50 854

原创 File Fragmentation Uva 10132

思路:最长的碎片和最短的碎片的组合中肯定有答案。所以先求长度,然后组合他们,最后检测组合结果字符串是否确保输入的碎片字符串都在其开始或结尾处。总结:代码编写边注释,当你注释写不好的时候,说明你的思路也不是很清晰,请停下来思考,理清思路。下面这段代码是我注释得最详细的,因为我体会到,当自己写的程序不能AC的时候,搜搜看看别人没有注释的代码会更加让自己烦躁。#include#include

2016-05-06 09:57:23 539

原创 3n+1_problem_Uva

这道题,其实说难也难,说简单也简单,关键在其测试数据。如果测试数据很苛刻,就很难了(参看博客UVa Problem 100 The 3n+1 problem (3n+1 问题))。这里,我要写两点想法:第一,题目中说求数字i,j之间的最大循环节长度,但是样例输入却都是按min,max的顺序给出,这让我们产生了一种错觉:输入就是按较小数、较大数输入的,这也是我多次TL的原因。记住:当题目要求模棱

2016-04-30 22:49:03 1399

原创 10252_Common_permutaion

这道题仔细读来不是很难,对于我这种选手来说。一直WA的原因竟然是输入的问题:OJ的测试的一个测试用例是一次读取两个字符串,我却用读取一个字符串来判断文件结束,就这样一直WA。这说明经验真的很重要,要是比赛中出现这种情况真的让人抓狂。排列是无关字符在原来字符串中的位置的。#include#includevoid CommonString(const char* strFt,const cha

2016-04-26 23:33:50 262

原创 Contest_Scoreboard 10258 Uva_OnlineJudge

这道题关键在排序,但是还可以注意一下数字和字母的混合输入的处理。另外,这道题也是一个使用结构编程的例子。解题过程中多用函数,这样不仅结构清晰,而且当程序出BUG时容易调试。#include#include#includetypedef struct{ int nNo;/*队名*/ int nQstSlvNum;/*解题数*/ int nSumTime; int nQstWrgTm

2016-04-20 21:47:36 224

原创 The Trip programming_Challengs Uva_OnlineJudge

一种思路:交易额中肯定包含少交的人补交的钱。注意到,0.01----0.01*(n-1)这部分在求平均的时候被抹掉了,所以,还要讨论这个部分。这个部分遵循的原则就是,多交了钱的每个人先承担抹掉的0.01,因为这样的话就可以减少交易次数,交易额也就可能最小了。如果多交了钱的人数*0.01 == 原始总数 - 平均*n,那么少交的人就不用再补交了。否则就要补交(原始总数 - 平均*n -多交了

2016-04-11 21:02:17 235

原创 程序关联文件 获取双击文件路径 MFC/VC

头脑发热突然想弄一个双击文件打开程序,才发现注册表编程有必要学习一下。故分为(一)解决问题(二)补充知识(三)总结。这次完成(一),剩下的接着补充吧!(一)解决问题问题:手动修改注册表来关联特定文件类型,任意MFC/VC/WIN32 应用程序(特别是非文档程序)获取双击文件名问题问题描述:我想用自己写的对话框程序打开程序本身存档的文件,当然了,是通过双击程序存档

2016-03-31 20:09:12 2479

原创 win32程序读写64位oracle数据库中的中文乱码问题

如果你的oracle里读写中文是乱码的话,多半是字符集的问题解决步骤(最好是在项目部署前查看确认和修改):1.在editor里执行命令 SELECT * FROM V$NLS_PARAMETERS,从输出结果里组合NLS_LANG的值,形式如下: [NLS_LANGUAGE]_[NLS_TERRITORY].[NLS_CHARACTERSET]2.在电脑系统里设置环

2016-03-26 11:12:00 1104

原创 读《程序员自我修养》 总结

技术上尽早编码统一命名习惯不要提前优化清楚地思考,清除地表达:隔离辅助代码,让程序变得易读;抽象部分逻辑,让程序简单明了看看开源项目Apache HTTP Server 或者 FreeBSD,想想这些项目有些老了,但是它们为什么并不像遗留项目??!!    Bug跟踪系统和版本控制系统中的记录:Bug应该已经包含对于问题的细致观察,如有必要,补充

2016-03-21 17:12:06 975

原创 ODBC32 Oracle TNS 乱码

在windows server 2012 R2 中ODBC有32和64位的,估计系统默认是使用64位的,反正在cmd中ODBC32.exe弹出来的是Oracle64位的。在做平台迁移的时候(基于32的旧版本在64位的系统中跑),在连接数据库的时候出错了,原来配置的是64ODBC,故想是不是因为ODBC64的原因,接下来删掉64的配置,去配置ODBC32,但是TNS出现了乱码!在网上搜了一下,要配置

2016-03-20 21:33:02 1672

原创 Toad Oracle No valid Oracle clients found

toad和Oracle安装问题No valid Oracle Client found. Please note that Toad only supports 32 bit Oracle Client installations."No valid Oracle clients found. You need at least one 32-bit clien

2016-03-20 11:09:03 9469

原创 梧桐树

游走在,食堂和实验室,以及长满梧桐树的,连起来不知走过多远的紫荆路。看不清三米之外的脸庞,是否可以想象成你的模样。伤痕累累的主干,才让你们一排排整齐地矗立在,独自绕过你身旁的人的面前、远方。可你还是把新叶长在离我最远的梢头,微风徐来,怎让惆怅擦过我的耳旁。

2016-03-16 19:45:40 657

原创 MFC CArchive Serialize 序列化类 设计和使用

序列化的出发点在于,一个对象的当前状态应该可以永久地存储起来,这些当前状态主要用它的成员变量来表示。然后,这个对象可以通过读取文件或者反串行化重新构造出来。序列化包含了处理所有对象指针细节以及在序列化对象过程中使用的对象的循环引用。序列化的一个关键点在于一个对象负责自己状态的读写,因此,一个可序列化的类必须实现基本的序列化操作。就像在序列化系列文章中看到的,在一个类中加上序列化功能的过程是不复杂的

2016-03-15 21:43:33 7155 1

原创 HOG+SVM vc6.0 + openCv配置

1.http://blog.csdn.net/liulina603/article/details/82895402.http://blog.csdn.net/loadstar_kun3.SVM源码分析与实验http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/ml/introduction_to_svm/introduct

2016-03-15 21:41:23 380

原创 Windows7 C盘 不能新建文件 修改权限 更改用户

今天碰到不能在C盘新建文件的问题,有点烦人,估计到可能是权限的问题,但是看登录的是admin用户,默认是管理员了,当时蒙了,后来才知道其实Windows7真正有最大权限的用户是Administrator!   下面就开始注销admin,登录Administrator!但是注销admin后发现还是只有admin一个用户可以登录!慢慢摸索,查资料发现是Administrator这个账号被禁用了

2016-03-14 21:28:44 6641

原创 ubuntu 软件源 基础开发软件 设置

我是个新手,探索着安装完ubuntu14(这个系统可以在中国ubuntu网站http://www.ubuntu.org.cn/download中免费下载)是为了做一个网络实验,但是安装完系统后发现,实现所需要的iperf用命令sudo apt-get installiperf始终下载不了(提示未发现软件源),后来我就用浏览器下载这个软件,可是没想到,进行到./configure就出问题了(提示有很

2016-03-04 15:20:29 432

原创 MFC 对话框伸缩 初始收缩

看完孙鑫老师的视频,就能很轻松地实现对话框的伸缩这个功能,但是他演示的是点击按钮后实现伸缩功能。就像他演示的那个画图工具一样,这里我想要的是对话框初始显示的时候就是收缩后的样子。        这种效果可以这样来实现:1.由于对话框在显示之前会调用OnInitDialog()这个函数,我们就在这个函数中获得初始化时对话框的大小rectOrig,和separator的rectSmall2

2016-03-03 22:51:37 2379

OpenCv使用手册---英文版

英文版的Opencv使用手册,含c++/python,较全

2014-04-10

加载位图出了问题

发表于 2012-04-22 最后回复 2014-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除