谷震平
码龄13年
求更新 关注
提问 私信
  • 博客:708,930
    708,930
    总访问量
  • 58
    原创
  • 484
    粉丝
  • 47
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2012-10-21
博客简介:

谷震平的专栏

博客描述:
我正在星球和朋友们讨论有趣的话题,你⼀起来吧? https://t.zsxq.com/AynemMF
查看详细资料
个人成就
  • 获得283次点赞
  • 内容获得126次评论
  • 获得834次收藏
  • 代码片获得458次分享
  • 博客总排名2,338,703名
创作历程
  • 3篇
    2019年
  • 1篇
    2018年
  • 7篇
    2017年
  • 23篇
    2016年
  • 26篇
    2015年
成就勋章
TA的专栏
  • HTML5跨平台APP开发
    5篇
  • 机器学习
    5篇
  • 智能算法
    3篇
  • 资源收集
    7篇
  • 项目经验
    14篇
  • 幡然悔悟
    2篇
  • Python
    11篇
  • OOP
    3篇
  • 理论阐释
    2篇
  • MongoDB
    1篇
  • HTML5
    6篇
  • Apache
    1篇
  • 跨平台APP
    4篇
  • Git使用
    1篇
  • 3D打印
  • OCR
    3篇
  • 文本挖掘
    1篇
  • Flask系列
    1篇
  • 站长系列
    1篇
  • 全沾
    1篇
  • 爬虫系列
    4篇
  • Hadoop集群
    4篇
  • 大数据开发
    4篇
  • 认知区块链
    2篇
  • Redash
    1篇

TA关注的专栏 1

TA关注的收藏夹 0

TA关注的社区 1

TA参与的活动 0

创作活动更多

王者杯·14天创作挑战营·第2期

这是一个以写作博客为目的的创作活动,旨在鼓励码龄大于4年的博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。 注: 1、参赛者可以进入活动群进行交流、分享创作心得,互相鼓励与支持(开卷),答疑及活动群请见https://bbs.csdn.net/topics/619735097 2、文章质量分查询:https://www.csdn.net/qc 我们诚挚邀请你们参加为期14天的创作挑战赛!

79人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

大数据工具测评:Clickhouse vs TiDB vs Palo

前言关注OLAP领域1年多了,目前还是处于混战阶段,各类工具、技术层出不穷。之前做过clickhouse、tidb、palo的测试,从九个角度对比了这三款经典的OLAP工具: 数据导入 sql查询性能 QPS 资源使用 安装部署 社区活跃度 SQL 功能对比 更新机制 其他 一一说来,TiDB具有很多优势...
原创
发布博客 2019.09.03 ·
12148 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

技术篇:关于EKT的一些设计

前言笔者做了一段时间的区块链底层开发,深知架构设计的重要性。对于高手来说,没有的轮子是可以自己造的,造个大规模消息/任务队列都只是想不想写的事情。但在企业中开发,追求的是稳定、性能、成本等等,所以通常希望使用开源组件,二次开发。解析过EKT项目,鉴于自己还不是高手,把自己认为有用的点都总结下。希望对来往的看官老爷有用。懂分享的人,一定会快乐!账户设计和ETH类似,用了账户模型,结合Mer...
原创
发布博客 2019.03.22 ·
1654 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Redash 二次开发入门

前言在Redash二次开发上做了不少工作,修改bug,定制样式,定制功能,增加数据源等等。聊聊自己的二次开发经验。懂分享的人,一定会快乐!环境准备Redash依赖的外部环境比较多,特别是Python相关的包,大多数时候一次装不成功,需要单独装或者更新安装其他系统依赖库,祝大家一次成功!环境准备可以参考另一篇blog,没用全说,其余的自己动动脑筋比较好。附传送门:Redash开发指南系...
原创
发布博客 2019.02.20 ·
14811 阅读 ·
3 点赞 ·
0 评论 ·
20 收藏

识别一条链的品种(科普篇)

一 前言大多数人都具备分类知识,知道猫有几种,狗有几种。但是,在区块链领域,联盟链、应用链、私有链、公共链等同时出现,就傻傻分不清楚。听说搞生物分类学的,懂鸟的不懂昆虫,懂蝴蝶的搞不定灰蝶。好在,区块链还没有那么多品种。这个问题,一篇文章能说明白。现通行的生物的科学分类法:自然分类。自然分类法,有7个级别:界-门-纲-目-科-属-种。笔者无法科学证明分类的正确性,尽量客观吧,不喜勿...
原创
发布博客 2018.07.27 ·
780 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

高阶Python----常用的数据结构与算法

前言高阶Python系列文章是笔者想要突破自己目前的技术生涯瓶颈而作,不具有普适性。本文主要是介绍Python在数据结构和算法中常用的函数。这也是数据分析领域必备知识点。也不是特地为了某些读者而作,想着提高自己的同时,能方便他人就更好了。懂分享的人,一定会快乐!常用的四个模块应该是:collections,heapq,operator,itertools。其中,collections是日常工作中的重
原创
发布博客 2017.02.12 ·
6352 阅读 ·
2 点赞 ·
0 评论 ·
16 收藏

大数据开发----Hive(入门篇)

前言本篇介绍Hive的一些常用知识。要说和网上其他manual的区别,那就是这是笔者写的一套成体系的文档,不是随心所欲而作。本文所用的环境为:CentOS 6.5 64位Hive 2.1.1Java 1.8Hive Architecture引自官网,务必仔细阅读: Figure 1 also shows how a typical query flows through the syst
原创
发布博客 2017.02.02 ·
4875 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

大数据开发----Fabric(入门篇)

一 前言本篇介绍Fabric的一些常用知识。要说和网上其他manual的区别,那就是这是笔者写的一套成体系的文档,不是随心所欲而作。二 安装Fabric现在支持Python2和Python3,安装:pip install fabricpip install fabric3输入fab命令:三 使用在终端(Terminal)执行fab命令执行配置文件。默认的配置文件为:fabfile.py,也可以
原创
发布博客 2017.02.02 ·
2964 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop----集群运维(持续更新...)

前言本篇介绍Hadoop的一些常用知识。要说和网上其他manual的区别,那就是这是笔者写的一套成体系的文档,不是随心所欲而作。常用HDFS命令hadoop fs -ls URIhadoop fs -du -h URIhadoop fs -cat URI [文件较大,hadoop fs -cat xxxx | head]hadoop fs -put URIhadoop fs -get UR
原创
发布博客 2017.02.02 ·
4364 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

Hadoop----集群搭建指南(下卷)

前言什么是Hadoop? Apache Hadoop is a framework for running applications on large cluster built of commodity hardware. The Hadoop framework transparently provides applications both reliability and data mot
原创
发布博客 2017.02.02 ·
1546 阅读 ·
3 点赞 ·
0 评论 ·
13 收藏

Hadoop----集群搭建指南(中卷)

前言本文的搭建基于上卷的配置,环境不再一一赘述。网络配置好的5台节点均可相互ping通,对于节点hadoop1(192.168.20.2)可以ping同其余四台hadoop2(192.168.20.3)、hadoop3(192.168.20.4)、hadoop4(192.168.20.5)、hadoop5(192.168.20.6)。其余节点同理。本文继续进行集群的搭建—-SSH配置。禁止root账
原创
发布博客 2017.02.02 ·
1068 阅读 ·
4 点赞 ·
0 评论 ·
26 收藏

Hadoop----集群搭建指南(上卷)

前言阅读本文,需要具备Linux、计算机网络的基础知识。所以在文中出现的相关基础知识,均以链接的形式给出,务必理解该链接的内容后,继续阅读本指南。集群搭建的环境多种多样,本文采用VitualBox安装5台虚拟机构建集群。具体环境:CentOS 6.5 64位VirtualBox 5.1.10 Mac版本机macOS Sierra 10.12.1 i7 8G内存单台装机先下载CentOS的is
原创
发布博客 2017.02.02 ·
1671 阅读 ·
4 点赞 ·
0 评论 ·
47 收藏

数据之美----雪球网股票组合分析

简介因为工作需要,爬了几个大型的网站,练就一身爬取数据和分析数据的功夫。所以,在无聊的时候写了个爬取系统。主要功能是爬取雪球组合的数据,并进行分析,得出一些有价值有潜力的股票代码。实盘到没有测试,随便估计了一下,至少跟盘不会出现亏损。先普及一下组合的概念:由雪球、微博等平台的投资主理人管理的股票持仓池。技术架构特点:简单可依赖多服务器多核心异步架构实时爬取机器学习、数理统计经典方法分析6000
原创
发布博客 2016.10.13 ·
7615 阅读 ·
2 点赞 ·
2 评论 ·
15 收藏

爬虫之刃----赶集网招聘类爬取案例详解(系列四)

前言本篇承袭之前的系列文章,开始动真格。以赶集网招聘类信息爬取为例,详细解说爬虫程序构建过程。准备工作:阅读之前的系列一、系列二、系列三,有一定递进关系登陆赶集网,了解下“地形”OK,let’s go!构建URL库每个网站的URL都会有一定规律,或强或弱。赶集网的URL规律就非常明显。郑重说明:对于目标站点,必须熟悉。这一步对于不同的网站有不同的方法。而赶集的话,是我通过仔细观察得到url规律
原创
发布博客 2016.10.01 ·
9946 阅读 ·
1 点赞 ·
5 评论 ·
18 收藏

爬虫之刃----简化爬虫程序之滚轮子实战(系列三)

前言这是一些准备工作:了解整个系列的安排了解系列二中的爬虫架构If you have done, that’s cool ! 这篇主要是:介绍需要的技术栈,需要补的东西请戳官方文档。官贴是专业的!推荐个人使用的一些库和轮子OK!Let’s get a new start!技术栈合集1. Requests和lxml(主要是tree函数)。Reque
原创
发布博客 2016.07.31 ·
4346 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

爬虫之刃----总览之心里鸡汤(系列一)

问题背景在百姓网挖坑中,累啊。我的老大告诉我,那谁谁需要58/赶集的数据。我当时的第一反应是找个黑帽去脱库…擦嘞。老大面对我:“嗯哼,赶集的,你上吧!有问题找xx协助一下。”我就只能“哦”了一下…..下面填坑。这个系列的价值我是这样想的:把这个当故事看会好点。但是,文笔不行,挖坑不造…这是个六年级会点lol的小学渣的随笔。但是,这个东西是存在的,你看或不看,它都在这
原创
发布博客 2016.07.31 ·
1711 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

全沾工程师----如何一个人写完web、Android、iOS、接口、CMS

前言看了文章标题,你也行吓一跳,心想这人有那么牛逼嘛。就当笔者浮夸吧,不想争辩了。这是一个神奇的时代,我这一代IT人有太多的工具。虽然我懒(其实程序员都懒),但是,我选择的技术和工具仍然具有相当大的自定义空间。这不是一篇啥好文章,但是,这篇文章可以给那些有需求全沾的人一点点建议。沉淀了2个月,又要跳出来哗众取宠,呵呵哒。全沾工程师IT领域的全栈工程师,金光闪闪。善学
原创
发布博客 2016.06.17 ·
7260 阅读 ·
16 点赞 ·
0 评论 ·
51 收藏

站长篇----远程连接数据库失败的解决方法

前言远程连接数据出错,报:host “XXXXXXXXXXXX” is not allowed to connect to this MySql serverunable to authentic SSH tunnel: Invalid username or password这三个错误一个来自常规连接(general),两个来自ssh连接。ssh连接出现的错误,我试着修改过ubuntu的
原创
发布博客 2016.06.14 ·
4862 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

OCR----你不得不知的Tesseract六大重要核心

Abstract整理了很多OCR的资料,这篇主要是对Tesseract重要的知识进行总结罗列。本次总结,基于2007年Smith所写的Paper—-《An Overview of the Tesseract OCR Engine》,所以算是论文导读吧。PS:Smith是一个专注OCR领域30年的男人~~太可怕了!这篇文章的重点是在文本行的查找,特征/分类的方法,以及自适应分类器。此外,文章中介绍了T
原创
发布博客 2016.05.16 ·
24952 阅读 ·
10 点赞 ·
4 评论 ·
19 收藏

我笑了...pytesseract是这么简单的model

概要Python语言中,pytesseract是用于验证码、字符识别的常用model。研究OCR期间,接触到这个模块。深究其源码,才明白,这个库是如此简单。安装: 首先安装依赖:PIL、Image、tesseract-ocr,然后: pip install pytesseractpytesseract在官网上说了自己是个wrapper,真正干活的是tesseract-ocr,即tesser...
原创
发布博客 2016.04.27 ·
4476 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

Flask系列----快速入门实战解析(上篇)

Flask入门Flask并不是那种啥也不懂的小白就能随意入门的,需要些基础知识。例如:Python基础网络基础Jinja2模板引擎和Werkzeug WSGI套件工具的使用(PyCharm) 所以,小白请谦虚,请Google不会的专业名称!我就是这样过来的……Flask概述摘要:Flask是一个微型框架,核心很小。但是,借助于Python的扩展性,Flask的功能很强大。Flask有两个重
原创
发布博客 2016.04.25 ·
4682 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏
加载更多