Der Kaiser-CSDN博客

首先要安装好Python环境，以前Scrapy只能应用于Python2，现在Python3也能了Python3下载安装好后配置好环境变量path后@安装方法首先安装wheelpip install wheel1安装完成后验证是否成功wheel1安装成功是这样然后去网站http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml下载Scrapy库，进到网站=>搜索’Scrapy’=>下载把下载的.whl文件放在一个容易寻找的地址（我放在了

2021-04-21 22:01:58 53

原创 scrapy爬虫流程及小项目实例

文档：Scrapy爬虫流程及项目实例.note链接：点此查看

2021-04-21 08:43:40 266

原创 HQL四种排序

order bysort bydistribute bycluster by每个MapReduce内部排序（Sort By）Sort By：每个Reducer内部进行排序，对全局结果集来说不是排序。1．设置reduce个数hive (default)> set mapreduce.job.reduces=3;2．查看设置reduce个数hive (default)> set mapreduce.job.reduces;3．根据部门编号降序查看员工信息hive (defau

2021-04-21 00:42:10 895

原创 SQL join

2021-04-21 00:39:24 33

原创 SQL调优的几种方式

SQL1、脚本创建和删除数据库（和手动一样的效果）pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下（示例）：import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings('ignore')import

2021-04-21 00:21:49 200

xjc_xxy的博客

原创 kafka面试题

原创 spark调优

原创 hive面试题

原创杭州公司大数据面试题汇总

原创虚拟机上部署OOTB环境

原创资源调度框架YARN

原创分布式文件系统HDFS(hadoop distribute file system)

原创分布式处理框架MapReduce

原创数据仓库Hive

原创 Sqoop总结

原创 sparksql小实战

原创 Spark RDD高级特性

原创 SQL杂记

原创 SSM商城系统

原创使用注解开发SpringMVC

原创第一个SpringMVC项目

原创 Spring+IOC思想

原创 HelloSpring

原创 Mybatis分页

原创 resultMap的使用

原创 MyBatis项目配置解析

原创第一个Mybatis项目+增删查改实现

原创 java杂记4

原创 java杂记3

原创 java杂记2

原创 JAVA杂记1

原创手写HQL11题

原创安装Scrapy

原创 scrapy爬虫流程及小项目实例

原创 HQL四种排序

原创 SQL join

原创 SQL调优的几种方式

空空如也

空空如也