- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 Hadoop Partitioner的应用
Partitioner组件可以让Map对Key进行分区,从而可以根据不同的key分发到不同的Reduce中去处理,其目的就是将key均匀分布在ReduceTask上。读取数据,没什么特别的,按行读取,作为(key,value)中的key,vaule为null。注:数据来源为Python中Faker库的的伪数据。reduce汇总也没什么特别的。
2022-10-16 00:25:20 325 1
原创 爬虫小实战(selenium) 数据小分析(pywebio、pyecharts)python分析写在网页 爬取2021年世界500强企业
爬取数据 通过selenium爬取2021年世界500强企业数据 import time import requests import csv from selenium import webdriver # 目标网址,构造头部信息 url = 'https://www.fortunechina.com/fortune500/c/2021-08/02/content_394571.htm' headers = { 'Accept': 'text/html,application/xhtml.
2022-01-16 19:00:37 1829 2
空空如也
QtDesinger QtabWidget文字显示方向 tab
2021-08-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人