项目经验
谷震平
这个作者很懒,什么都没留下…
展开
-
项目篇----为残障人群设计的体感控制系统
前言 2014年,用了1个半月做了一套控制系统,系统为残障人群设计的。系统通过体感信号控制家电设备的电源开关,情景设计的大众化,多种场合都可使用。只是训练下自己的能力,貌似不太适合商业应用。1 项目团队 团队共有4个人,除了我,还有霍某某、周某某、班某某,分别负责了不同部分。我是项目负责人,参与了很多环节的设计。要感谢团队的协作,否则无法总结那次的成功。2 项目原创 2015-01-29 20:45:44 · 1395 阅读 · 1 评论 -
爬虫之刃----总览之心里鸡汤(系列一)
问题背景在百姓网挖坑中,累啊。我的老大告诉我,那谁谁需要58/赶集的数据。我当时的第一反应是找个黑帽去脱库…擦嘞。老大面对我:“嗯哼,赶集的,你上吧!有问题找xx协助一下。”我就只能“哦”了一下…..下面填坑。这个系列的价值我是这样想的:把这个当故事看会好点。但是,文笔不行,挖坑不造…这是个六年级会点lol的小学渣的随笔。但是,这个东西是存在的,你看或不看,它都在这原创 2016-07-31 23:16:59 · 1683 阅读 · 0 评论 -
文本挖掘----基于OCR的文档关键字提取
前言做了一段时间的OCR,把大量的图片、PDF处理成了文本。请注意:这些文本在互联网上属于稀有资源。这些文本以前都放在一个盒子里,如今,用OCR做钥匙打开盒子。取出东西,是好是坏也没人知道。但是,总得取出来看看。所以,Text Mining就有了用处。我们把这些稀缺数据拿来挖一挖。万一挖到宝了,可就发了。。。数据可视化后,你将得到这样的结果: 别高兴,我讲给你列出一堆坑。。。。在自己的微信公众号上原创 2016-04-16 22:41:21 · 11034 阅读 · 0 评论 -
OCR----Python调用Tesseract引擎(Ubuntu下)
前言 最近再搞OCR的,用于识别日文报刊,是公司的一个日本项目,做的我是苦不堪言。最近把自己的工作内容写出来,也会做一个系列和专栏,欢迎关注! 想搞好这个OCR,需要读论文。好在只需要读4篇,都是Tesseract的作者Ray Smith写的。Tesseract目前被Google维护并开源,以后的前景应该会非常好。原创 2016-03-30 17:51:47 · 13044 阅读 · 4 评论 -
跨平台APP----对Native/Hybrid/Web APP三种开发模式的分析(系列一)
前言:跨平台APP开发是以后的一个趋势,将会有更多的工具出现。原生开发人员无论是薪资还是人数都将出现一定的下降。--------谷震平 【以下内容均为原创,请尊重原创!】 一 Native/Hybrid/Web App开发 Native原生开发,目前较为成熟,各大公司均采用此方式。但是其人工成本较高,同一个项目,至少需要Android端、...原创 2016-01-11 14:31:31 · 19279 阅读 · 0 评论 -
OCR----Tesseract引擎核心类TessBaseAPI的操作
前言写了两篇博文介绍了:Python调用Tesseract引擎(Ubuntu下) Tesseract 3.x 架构及原理解析 这一篇将更加深入OCR的世界!不得不把一些和本专栏(后面会整理出一个系列)相关的参考资料列出来,帮助大家建立知识体系。1 Tesseract的环境安装 –> 谷震平的传送门 2 Tesseract的使用方法:主要是命令行的使用 –> 传送门 3 Tesseract的原创 2016-03-31 22:12:57 · 15634 阅读 · 6 评论 -
跨平台APP----对Cordova,APPCan,DCloud,APICloud四大平台的分析(系列二)
前言:移动开发是未来一个很重要的IT领域,而跨平台开发将是这一领域最重要的事情。 ----谷震平 一 兵器谱 在国外,最大的是Cordova(PhoneGap,2011年广泛流行),在2012年12月开源。在国内,按时间顺序,有: 2012年,AppCan 2013年,DCloud 2014年9月,APICloud 二 Cordova...原创 2016-01-11 15:11:33 · 29204 阅读 · 4 评论 -
Python篇----多线程1TB数据生成脚本
0 前言Sorry,我骗了你!!!“多线程”,在Python中就是鸡肋,我只是想得到很多份1TB数据文件而已。“1TB数据”,这个大小是可以改的,生成1G,1M的数据随便都行。数据,目前只是随机数。这种随机数是伪随机数,有一个规律的,网上有解释,可以自行百度。“脚本”,这真的是个Python脚本。。。。。提示:我在小学弟的电脑上开了8个线程去跑,结果,他的CPU快到100摄原创 2016-01-30 11:40:14 · 2573 阅读 · 0 评论 -
OCR----Tesseract 3.x架构及原理解析
Tesseract的历史Tesseract是一个开源的OCR引擎,惠普公司的布里斯托尔实验室在1984-1994年开发完成。起初作为惠普的平板扫描仪的文字识别引擎。Tesseract在1995年UNLV OCR字符识别准确性测试中拔得头筹,受到广泛关注。后来HP放弃了OCR市场。在1994年以后,Tesseract的开发就停止了。在2005年,HP将Tesseract贡献给开源社区。美国内华达州信息原创 2016-03-30 22:20:18 · 40392 阅读 · 11 评论 -
HTML5 APP----DCloud产品分析及介绍
0 前言 目前,使用HTML5开发web app或者Hybrid App已经非常常见,大公司(大众点评、天猫)、小公司(创业团队)也在用。但是,学习资料还是比较空缺的。这个指南是笔者个人总结,难免有误,欢迎指正! 目前,做HTML5的App工具和平台也有很多,我从这4个平台挑选了一个。之前写过3个系列的短文,分析了我为什么选择DCloud这个平台。详情戳下面:原创 2016-02-03 11:11:10 · 8642 阅读 · 15 评论 -
Python篇----提供pip和virtualenv的Uranium之介绍(翻译篇)
原文链接:Uranium: a Python Build System http://uranium.readthedocs.org/en/latest/index.html0 前言 国内关于Uranium的资料还是比较少的,所以特别翻译一下。同时也是因为有个开源项目Cura(Ultimaker开发的3D切片软件)用到了这个框架,所以我也要研究一番。不知道这篇blog的有效翻译 2016-02-27 18:24:06 · 2091 阅读 · 2 评论 -
跨平台APP----使用DCloud公司产品跨平台开发(系列三)
前言:随着跨平台开发越来越流行,像DCloud这种平台还会越来越多。 --------谷震平一 概述 我(个人观点)已经分析了Hybrid开发模式的优缺点,也分析了使用该模式的平台的优缺点。所以,选择了DCloud这样的平台。为什么???每个人有每个人的选择。我只能告诉你,DCloud适合我这个程序员。 学习路线:原创 2016-01-11 15:55:08 · 10167 阅读 · 0 评论 -
Python篇----命令行调用、输出log日志并打包的脚本
一 前言这个脚本不够健壮,只是我个人使用,处理一些大数据的业务。分享给大家,不要乱玩,会玩坏的。。。大家看看思路就好了。该脚本将输出今天的log文件内容。如果log文件是今日新建的,日志内容将会放在里面。如果不是,就会将存储位置下的.log文件打成 .tar.gz 包。同时以当日时间作为log文件的名称(前缀程序会给你补上),再放入log日志内容,最后存储在用户输入的路径下。原创 2016-01-11 17:00:32 · 10916 阅读 · 0 评论 -
Git----基本使用详解及进阶教程
0 前言 整理一下,自己平时用,也分享给大家。里面引到的一些blog,也不错,特别是ProGit这本书,很重要,再详细的内容,可去书中查找。 本blog适合github和git@osc,无论你用哪个平台,这里的东西都可以用到。 我在Mac操作的,Windows平台几乎没有差别。如有,可在留在评论下方。谢谢分享!==============原创 2016-02-04 11:50:38 · 1888 阅读 · 0 评论