自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 MapReduce——赵俊杰

Map类import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;import java.io.IOException;/**LongWritable 偏移量 long,表示改行在文件中的位置,而不是行号* Text map阶段的..

2022-05-08 23:20:34 114

原创 数据库复习----赵俊杰

三个数据类型:字符串:varchar,char日期:data,time数值:int,float,double增删改查:增:insert into aaa(name,age)values("zhaojie",12);删:delete from aaa where name = "zhaojie";改:update aaa age = 19 where name = "zhaojie";查:select * from aaa;//查询全表select * from aaa w

2022-05-08 23:17:42 185

原创 python四种统计图————赵俊杰

线形图import matplotlib.pyplot as mplimport numpy as np#定义数据ypoints=np.array([1,3,9,25,12,32,5,1])#数据插入到图表# mpl.plot(ypoints,'o:g')# mpl.plot(ypoints,marker='o',linestyle=':',color='g')mpl.plot(ypoints,marker='o',ls=':',c='r')mpl.plot(ypoints,mar.

2022-05-08 22:56:24 1125

原创 hadoop mapper

import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper; import java.io.IOException; public class WordCountMap extends Mapper<LongWritable,Text, .

2022-05-01 20:05:39 158

原创 sql查询优化

CREATE TABLE IF NOT EXISTS t(id INT,num INT DEFAULT 0,NAME VARCHAR(20)); CREATE INDEX ix_num ON t(num); DELIMITER $CREATE PROCEDURE t()BEGIN#定义一个循环变量DECLARE i INT DEFAULT 0;DECLARE d INT DEFAULT 0;WHILE(i < 1000) DO BEGIN SELECT i; SET i.

2022-05-01 20:03:48 248

原创 python pandas和数据清理

pandasimport pandas as pdprint(pd.__version__)#定义字典mydataset = { 'sites' : ["Google","Runoob","WiKi"], 'number' : [1,2,3]}#将字典转换为dataframe,才能处理mydf=pd.DataFrame(mydataset)print(mydf)a = [1,2,3]mysr = pd.Series(a,name="aha")print(mys

2022-05-01 20:02:11 126

原创 sql优化查询

1.避免丶情况 !=,<>, is null,is not null,in,not in;例如a语句SELECT COUNT(*) FROM emp WHERE age IN(SELECT age FROM emp WHERE id > 100);b语句SELECT COUNT(*) FROM emp WHERE EXISTS(SELECT age FROM emp WHERE id > 100);使用in时不能使用索引2.合理使用exists , not exi

2022-04-24 23:32:30 58

原创 python----numpy数组

import numpy as npa = np.dtype(np.int32)print(a)# 数据类型对象b = np.dtype(np.float32)# b = np.array([1, 2, 3])# b = np.dtype('i4')# 创建数组,指定数据类型c = np.array([1, 2, 3], dtype=b)print(c)# 定义数据类型dt = np.dtype([('age', np.int8)])# 用dt数据类型创建数组e = np.ar.

2022-04-24 23:29:29 420

原创 java操作hdfs

1.先配置windows的环境变量2.创建工程3.导入lib配置包4.输入Java语句import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.OutputStream;import java.net.

2022-04-24 23:27:18 84

原创 python爬虫周学习总结___xpath

xpath安装:pip install lxml使用:1.导入from lxml import etree2.from lxml import etreewb_data = """ <div> <ul> <li class="item-0"><a href="link1.html">first item</li> &l

2022-04-10 19:52:09 126

原创 hbase周学习总结__范式(作业)

第一范式(1NF): 数据表的每一列都要保持它的原子特性,也就是列不能再被分割。第二范式(2NF):属性必须完全依赖于主键,消除部分依赖。第三范式(3NF):消除传递依赖。USE test;CREATE TABLE IF NOT EXISTS username(username VARCHAR(20) PRIMARY KEY,PASSWORD VARCHAR(20),DATE DATE,birth DATE);CREATE TABLE IF NOT EXISTS 浏览收藏(u

2022-04-10 19:48:04 1088

原创 hadoop周学习总结_hadoop安装(作业)

1.准备Linux环境 1.1 开启网络,ifconfig指令查看ip 1.2 修改主机名为自己名字(hadoop) vim /etc/sysconfig/network NETWORKING=yes HOSTNAME=hadoop 1.3修改主机名和IP的映射关系 vim /etc/hosts 192.168.182.128 hadoop 1.4关...

2022-04-10 19:40:24 266

原创 Linux周学习————赵俊杰

权限语法:#chmod 选项 权限模式 文档2.数字形式2. Linux自有服务设置主机名:1.临时设置主机名,需要切换用户使之生效#hostname 设置的主机名3.ssh服务作用:远程连接协议,远程文件传输协议协议使用的端口号:默认22...

2022-04-03 18:39:08 589

原创 python爬虫周学习___赵俊杰

Scrapy安装与使用打开命令提示符下载安装Scrapy所必须的环境:优先下载python下载更新文件:python -m pip install --upgrade pip然后下载:pip install wheelpip install lxmlpip install twistedpip install pywin32pip install scrapy下载之后输入:pip list查询是否下载成功创建项目:scrapy start project TXmov

2022-04-03 17:22:43 781

原创 hbase周学习——赵俊杰

事务,触发器,储存过程 1.MySQL事务MySQL事务处理的两种方法1。用GEGIN,ROLLBACK,COMMIT实现BEGIN 开始一个事务ROLLBACK 事务回滚COMMIT 事务确定2.直接用SET改变MySQL的自动提交模式SET AUTOCOMMIT = 0 禁止自动提交SET AUTOCOMMIT = 1 开启自动提交2.储存过程储存过程条件语句#创建存储过程DELIMITER $CREATE PROCEDURE aaa()BEGI...

2022-04-03 16:38:43 2427

原创 爬虫周学习总结__赵俊杰

爬贴吧from urllib import requestimport re#定义urlpage=100url='http://tieba.baidu.com/f?kw=%E6%AE%B5%E5%AD%90&ie=utf-8&pn='+str(page)try: #定义请求头 headers={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML,

2022-03-20 19:07:28 114

原创 sql学习周总结——赵俊杰

1.索引:一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,在生产环境中,我们遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,因此对查询语句的优化显然是重中之重。说起加速查询,就不得不提到索引了2.为什么要有索引:索引在MySQL中也叫做“键”,是存储引擎用于快速找到记录的一种数据结构。索引对于良好的性能 非常关键,尤其是当表中的数据量越来越大时,索引对于性能的影响愈发重要。 索引优化应该是对查询性能优化最有效的手段了。索引能够轻易将查询性能提高好几个数量级。

2022-03-20 17:45:11 245

原创 周学习总结----shell_赵俊杰

代码规范#!/bin/bash 指定告知系统当前这个脚本要使用shell解释器文件命名规范:文件名.sh使用流程:1.创建一个文件,进入编辑#vim aaa.sh2.使用i进入开始编辑#!/bin/bashecho 'hello world'3.编辑完成后,使用esc键退出编辑,在使用shift键加两次z保存编辑内容4.查询编辑内容# chmod +x aaa.sh# ./aaa.shshell进阶一.变量1.变量的定义和使用变量:先定量后

2022-03-20 17:41:35 275

原创 爬虫基础_赵俊杰

一.爬虫入门程序from urlllib import#构造一个请求req = request.Request("网址“)#打开网页resp = request.urlopen(req)#读取网页print(resp.read())二;爬虫程序添加data,header,然后post请求url="网址"#请求头...

2022-03-13 20:53:05 1169

原创 SQL基础语法_赵俊杰

一.建库建表语法,字段数据类型1.建库CHRATE DATABASE IF NOT EXISTS 库名 DEFAULT CHARSET utf8;use 库名;IF NOT EXISTS:当表不存在的时候执行建库建表2.建表CREATE TABLE aaa(id INT PRIMARY KEY NOT NULL AUTO_INCREMENT,NAME VARCHAR(20) NOT NULL,birthday DATE,xingbie VARCHAR(20) NOT NU

2022-03-13 20:27:10 1253

转载 Linux指令——赵俊杰

基础指令一.ls指令用法1:#ls含义:列出当前工作目录下的所有文件/文件夹的名称用法2:#ls 路径含义:列出指定路径下的所有文件/文件夹的名称用法3:#ls 选项 路径含义:在列出指定路径下的文件/文件夹的名称,并以指定的格式进行显示常见的语法有:#ls -l 路径#ls -la 路径 用法4:ls -lh 路径含义:列出指定路径下的所有文件/文件夹的名称,以列表的形式并且在显示文档大小的时候以可读...

2022-03-10 21:41:02 81

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除