- 博客(3)
- 收藏
- 关注
原创 Python 爬虫笔记之多线程的爬虫
比如主进程开启了3个子进程,分别为A,B,C。一共姚爬取10页数据,A爬取第1页,B爬取第2页,C爬取第3页。这都是在同一个时刻内完成的,因此效率得到了倍数级的提升。意义:即在同一个时间内,把同一份工作分给多个子进程去做,从而把任务化小,提高爬虫的效率。这段代码中,会在1秒钟运行10个进程,这是进程通信之间的伪代码。Python 爬虫笔记之多线程之间的爬虫。
2024-04-16 22:38:08 548
原创 Java API 开发Hbase 关于连接,创表,添加数据,扫描数据的操作(一)
通过Java API的方式对hbase进行简单的创表、插入数据、查表、查数据等操作一、1.1 通过Java API 方式开发hbase,需要构建一个Maven工程,所用到的依赖也是比较简单的,如下:本次开发所用到的依赖包。1.2 因为对hbase的连接是采用.xml文件的方式进行连接,所以要从Linux中将core-site.xml和hbase-stie.xml两个文件复制到main文件夹下的resources文件当中,如下图: //初始化Configuration对象 Confi
2022-04-15 20:48:18 4117
原创 Java学习记录——枚举类之自定义枚举类
Java学习记录——枚举类之自定义枚举类一、什么是枚举类?所谓的枚举类,就是有限个类的对象。比如说定义了一个星期类,而星期是有限的,只有一至七;再比如说,定义了一个季节类,春夏秋冬是有限的季节类的对象。这就是枚举类。说白了,就是一个一个数出来,有点类似于遍历,但与遍历的概念不等同。...
2022-02-17 23:19:01 1557
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人