- 博客(3)
- 资源 (1)
- 收藏
- 关注
转载 爬虫之爬取网页表格数据(一)
使用Pyquery 爬取数据存为csv文件 爬取网页:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html 环境:windows+Anaconda 代码如下: import requests from pyquery import PyQuery as pq def get_page(url): """发起请求 获得源码""" ...
2020-04-18 20:54:25 2912
转载 MapReduce原理
概念 MapReduce是一个基于集群的计算平台,是一个简化分布式编程的计算框架,是一个将分布式计算抽象为Map和Reduce两个阶段的编程模型。 执行流程 由图我们可以看到, MapReduce存在以下4个独立的实体。 JobClient:运行于client node,负责将MapReduce程序打成Jar包存储到HDFS,并把Jar包的路径提交到Jobtracker,由Jobtracker进...
2020-04-02 18:43:51 127
转载 Java初始化数组(Array)的方法
格式:int[] a1(常用) 或者 int a1[] 初始化: 方法一:int[] a1 = {1,3,5,7,9} 方法二:int[] a1 = new int [5]
2020-04-01 17:06:22 300
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人