大数据
Ghost_02
在下是一名苦逼的泥瓦工
展开
-
hadoop初探
hadoop的两大组件hdfs和mapreduce hdfs下又有 namenode和datanade还有个snn(第二) snn是为了将nn的日志和映像文件合并执行。(辅助nn) mapreduce的有jobtracker和tasktracker jt的作用是用户提交作业的入口,实现集群资源的管理和作业管理 tt负责运行作业。 任务:map,reduce。原创 2017-07-22 14:25:47 · 574 阅读 · 0 评论 -
爬虫基础-- 正则基础
re模块是python 中专门处理正则相关的模块 下面专门介绍一下正则表达式。 相关的正则测试网站推荐一个。 http://tool.oschina.net/regex/ re.match re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 re.match(patter原创 2017-10-22 14:08:28 · 315 阅读 · 0 评论