自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 通过正则表达式解析HTML入门指南

一个完整的HTML网页通常是由很多标签组成的,通过正则表达式我们可以筛选出我们想要的内容。一般我们利用正则表达式来获取标签中的内容或者属性值,获取到内容和属性值之后,我们还可以利用正则表达式进一步获取想要的内容。python中使用正则表达式解析HTML的步骤:首先需要引入re模块根据所要获取的内容或者属性值定义一个正则表达式利用re库提供的方法获取满足所定义的正则表达式的内容或属性值下面是

2017-11-15 11:11:49 2086 1

转载 BeautifulSoup 入门指南

BeautifulSoup官方文档如下介绍: Beautiful Soup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库。它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。Beautiful Soup 会帮你节省数小时甚至数天的工作时间。安装 以下都是在 python2.7 中进行测试的 可以直接使用 pip 安装:$ pip install be

2017-11-13 19:37:06 497

转载 为什么不去阅读顶级会议?

看了版上很多贴子,发现很多版友都在问“热门研究方向”、“最新方法”等。有同学建议国内某教授的教材、或者CNKI、或者某些SCI期刊。每当看到这种问题,我都有点纳闷,为什么不去读顶级会议上的论文?我无意否认以上文献的价值,但是在机器学习、计算机视觉和人工智能领域,顶级会议才是王道。国内教材和CNKI上的基本是N年前老掉牙的东西。有人会质疑这些会议都只是EI。是的,这的确非常特殊:在许多其它领域,会议都

2017-10-08 22:13:19 424

原创 关于前端中类似maven的工具

关于前端中类似maven的工具yeoman相当于一个脚手架,主要用来生成一个标准的目录结构bower相当于java中maven对依赖版本管理grunt相当于一个项目构建工具这三个一般合起来用,合起来用的时候相当于java中的maven

2017-01-17 20:32:13 2930

原创 关于restful,rpc概念的区别

1,restful(restful是一种设计风格)一种软件架构风格,设计风格而不是标准,只是提供了一组设计原则和约束条件。它主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。2,rpc(一种标准,屏蔽通信细节,直接调用)简单的说,RPC就是从一台机器(客户端)上通过参数传递的方式调用另 一台机器(服务器)上的一个函数或方法(可以统称为服务)并得

2016-12-24 16:29:34 6403

原创 Linux Shell编程入门

Linux Shell编程学习网站

2016-09-17 16:04:35 216

原创 Linux Shell编程中的特殊变量

大家都知道普通的bash命令后边可以跟任意的参数(例如在启动hbase的客户端的时候,我们在hbase的bin目录下使用./hbase shell进入到hbase的客户端),那我们自己编写的脚本是否也支持传递参数呢?答案当然是肯定的,但是怎么编写这样的shell程序呢?这就需要使用到位置参数。位置参数($数字):eg: name=$1中$1为系统提供的位置参数,$0代表程序的名称,[$1/$2/

2016-09-17 15:54:56 335

转载 SecondaryNameNode的用途

在启动Hadoop时,NameNode节点上会默认启动一个SecondaryNameNode进程,使用JPS命令可以查看到。SecondaryNameNode光从字面上理解,很容易让人认为是NameNode的热备进程。其实不是,SecondaryNameNode是HDFS架构中的一个组成部分。它并不是元数据节点出现问题时的备用节点,它和元数据节点负责不同的事情。1、SecondaryNam

2016-09-16 22:13:55 3753

原创 Markdown入门

认识 MarkdownMarkdown 是一种用来写作的轻量级「标记语言」,它用简洁的语法代替排版,而不像一般我们用的字处理软件 Word 或 Pages 有大量的排版、字体设置。它使我们专心于码字,用「标记」语法,来代替常见的排版格式。例如此文从内容到格式,甚至插图,键盘就可以通通搞定了。目前来看,支持 Markdown 语法的编辑器有很多,包括很多网站(例如简书)也支持了 Markdown 的文

2016-09-16 21:37:06 184

原创 Hadoop生态圈概要

ZooKeeperZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。ZooKeeper不仅仅是在Hadoop生态圈中使用,也在其他地方使用,例如阿里的Dubbo。只要是需要分布式应用程序协调服务的地

2016-09-16 19:41:09 1109

原创 简单的日志分析流程

简单的日志分析流程使用Flume采集数据到HDFS上对数据进行清洗(可以使用MapReduce程序来清洗)在Hive上创建相应的表加载清洗后的数据,然后使用Hive对清洗后的数据进行多维分析把Hive分析得出的结果通过Sqoop导出到Mysql中提供视图工具供用户使用(可以自己写Web程序来访问Mysql)备注:这边的日志分析最好通过写shell程序结合定时器crontab来完成。不可能

2016-09-16 12:50:15 1423

原创 iframe高度宽度自适应

<!DOCTYPE html><html><head> <title>iframe宽度高度自适应</title></head><body id="body" height="100%"><script type="text/javascript"> //设置body高度为浏览器高度,当然也可以不设置 document.getElementsByTagName(

2016-09-08 10:51:19 13966 2

转载 Tomcat的启动到底需要JDK还是JRE呢?答案是:只要有其中一个就可以

【问题】Tomcat的启动到底需要JDK还是JRE呢?【环境】电脑上装有JDK和JRE,还有解压缩的Tomcat【尝试】1.当环境变量中没有JAVA_HOME和JRE_HOME,但是Path中有JDK的bin目录,也就是说cmd下java和javac命令都可以执行,此时进入Tomcat的bin目录下执行startup.bat会提示无JRE_HOME或JAVA

2015-10-27 00:28:37 11891

原创 JSP的三种注释方法

JSP的三种注释方法

2015-10-09 14:09:07 5504

原创 关于C#接口的使用

关于c#接口使用的小例子

2015-05-25 20:49:54 311

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除