自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 scala(3)面向对象编程之类

定义一个简单的类:package com.doit.scc// 定义类,包含field以及方法class HelloWorld { private var name = "leo" def sayHello(){print("Hello" + name)} def getName = name}/*函数:类外边定义的def方法:类内定义的def注意:如果定义的def后...

2019-10-20 17:53:20 203

原创 scala(4)面向对象编程之对象、继承

package com.doit.scc1object Person { // object,相当于class的单个实例,通常在里面放一些静态的field或者method // 第一次调用object的方法时,就会执行object的constructor,也就是object内部不在method中的代码;但是object不能定义接受参数的constructor // 注意,objec...

2019-10-20 17:48:58 194

原创 scala(2)

过程在Scala中,定义函数时,如果函数体直接包裹在了花括号里面,而没有使用=连接,则函数的返回值类型就是Unit。这样的函数就被称之为过程。过程通常用于不需要返回值的函数。scala> def sayHello(name:String) = "Hello," + namesayHello: (name: String)Stringscala> sayHello("ynn")...

2019-10-15 19:39:49 185

原创 获取中国大学排名前400名

在终端显示前400名大学import requestsfrom bs4 import BeautifulSoupimport bs4import redef getHTMLtext(url): try: r = requests.get(url,timeout = 30) r.raise_for_status #查看响应是否是200 ...

2019-10-09 21:00:45 267

原创 获取淘宝信息(商品、价格等)存入csv文件

参考博客:(https://blog.csdn.net/qq_26373925/article/details/101185979)import reimport csvimport requestsimport timeclass shopping_list(): def __init__(self,searchkey,pageTotal): self.sea...

2019-10-06 00:28:29 3322

原创 Hive(3)

日期函数截取字符串:substr()日期函数:获取当前日期:current_date获取当前日期时间:current_timestamp获取当前时间戳:unix_timestamp()将当前的时间转换为想要的格式:from_unixtime()json函数解析以电影热度rating.json为例;//hive中先创建一张表,将一行的json看做一个字段 create ta...

2019-09-26 22:00:48 201

原创 Hive(2)

分区(partition by)hive> create table test_44(ip string,url string,staylong int) > partitioned by (day string) > row format delimited > fields terminated by ',';vi pv.data.201...

2019-09-26 16:15:57 97

原创 Hive(1)

1,xianghua,122,xiangrong,303,xiaodong,404,xiangning,20use default;create tables test_2(id int,name string,age int)row format delimitedfileds terminated by ',';load data local inpath '/home/us...

2019-09-24 20:53:27 118

原创 MySQL(2)

SQL语句免密启动MySQL:mysqld_safe --skip-grant_tables &此条命令执行后 执行set password=password(" ") 修改密码命令报错查看所有MySQL参数:show variables;show variables like “%format%” like 模糊查询show global variables li...

2019-09-19 21:51:14 119

原创 MySQL(1)

关系型数据库与非关系型数据库关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织。(1)常见的关系型数据库包括:MySQL 、Oracle、MariDB、DB2、SQLServer等。(2)优点:容易理解、使用方便、数据一致性高、冗余低、数据完整性好、技术成熟、功能强大、支持很多复杂操作(3)缺点:读写性能比较差、固定的表结构,灵活性稍欠非关系型数据库:指...

2019-09-18 20:47:08 148

原创 python读取json文件根据电影ip求电影名的评分总和并按评分排序

import jsonwith open("E:/rating.json","r") as f: score = {} for line in f: dic = json.loads(line) #读取json文件所有内容 if dic["movie"] not in score...

2019-09-11 17:58:19 533

原创 HaoopDay06 根据电影ip求电影名的评分总和

package com.cou;public class UesrRateBean { private String movie; private Integer rate; private String timeStamp; private String uid; public String getMovie() { return m...

2019-09-11 17:52:12 213

原创 Hdoop Day05 wordcount

手动创建一个如mapreduce的jar包1.创建如下所示的class类2.在wordcountmapper中写package cim.dit;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.mapreduce.Mapp...

2019-09-11 17:49:04 136

原创 Hadoop Day03 HDFS常用命令参数介绍

HDFS常用命令参数介绍-help功能:输出这个命令参数手册-ls功能:显示目录信息示例: hadoop fs -ls hdfs://hadoop-server01:9000/备注:这些参数中,所有的hdfs路径都可以简写–>hadoop fs -ls / 等同于上一条命令的效果-mkdir功能:在hdfs上创建目录示例:hadoop fs -mkdir -p ...

2019-09-11 17:48:16 250

原创 HadoopDay04

package ynn;import org.apache.hadoop.fs.*;import org.junit.Before;import org.junit.Test;import org.apache.hadoop.conf.Configuration;import java.io.FileNotFoundException;import java.io.IOExcept...

2019-09-04 17:05:58 116

原创 Hadoop Day01集群搭建

yum -y install -y lrzsz 安装lrzsz ,以便上传文件mkdir -p /home/hadoop/apps 创建文件夹rz 将hadoop-2.8.0.tar.gz 和 jdk-8u181-linux-x64.tar.gz 上传到虚拟机配置ssh免密登陆: ssh-keygen -t rsa 产生公钥,在Hadoop01,Hadoop0...

2019-09-03 00:06:55 154

原创 Hadoop Day02

1.指定定时任务夫人软件:crond服务crontab :(1)安装:yum install crontabs(2)启动:service crond start(3)关闭:service crond stop(4)重启:service crond restart(5)重新载入:service crond reload(6)重新服务状态:service crond status修改任...

2019-09-02 23:24:12 121

原创 Python 获取QQ头像图片并保存到本地

import requestsimport reimport threadingclass QQ_head_picture(threading.Thread): def __init__(self,url,page,path,lock): threading.Thread.__init__(self) self.url = u...

2019-09-02 20:11:33 876 4

原创 Homewor07 _ 爬取清华新闻

import requestsimport reimport pymysqldef news_title(): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100...

2019-08-24 20:45:13 367

原创 Python Day07

多线程#在函数中执行线程.start_new_thread()import _threadimport timedef go(): for i in range(5): print(i,"---------------------") time.sleep(1)for i in range(5): #同时执行5次 _thread...

2019-08-22 20:50:31 124

原创 Homework06

import requestsimport reimport multiprocessingdef PUT(q): headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0....

2019-08-22 00:32:55 154

原创 Python Day06

进程锁import multiprocessingimport osimport timedef showdata(lock,i): with lock: print(multiprocessing.current_process().name) time.sleep() pr...

2019-08-22 00:12:24 116

原创 Python Day05

Python进阶PEP8编码规范:(1)代码编排: 缩进4个空格,禁止空格与Tab混用 行长80:防止单行逻辑过于复杂 (2)import:不要使用 from xxx import *顺序:1.标准库 2.第三方库 3.自定义库单行不要import多个库模块内用不到的不用去import(3)空格:装饰器闭包函数: #闭包函数: def foo(...

2019-08-20 22:39:37 131

原创 Homework_05

import jsonimport requestsimport multiprocessingdef text(path): song_play_url_list = [] song_name_list = [] with open(path,mode='r') as f: res = f.readlines()[0].strip('\n').s...

2019-08-20 22:17:57 179

原创 Python Day04

面向对象编程一、基础面向对象思想三大要素:封装、继承、多态。类和对象:类是对象的蓝图和模板,而对象是类的实例。类是抽象的概念,而对象是具体的东西。在面向对象编程的世界中,一切皆为对象,对象都有属性和行为,每个对象都是独一无二的,而且对象一定属于某个类(型)。定义类:class Class_name(object): def __init__(self): self.a = 10...

2019-08-20 00:00:34 101

原创 Homework04

#五角数def getPentagonalNumber(n): sum = 0 for i in range(1,n+1): num = i * (3 * i - 1) / 2 print(int(num),end = " ") sum += 1 if sum %10 == 0: print(...

2019-08-19 23:26:49 122

原创 HomeWork_week

#将csv文件读出来,并存到json文件中#将csv文件读出来,并存到json文件中import jsonimport csvimport numpy as npdef csvwjson(path): with open(path,'r') as csvfile: reader = csv.reader(csvfile) list = [] ...

2019-08-18 21:30:50 146

原创 Python Day03

函数1、一般形式: 声明 函数名字 (参数) def func_name([params]): 执行体 return xxx func_name([params])2.函数的参数:(1)默认参数:带默认值的参数一定要统一放在最后def fun_name(name,age = 12): print("{}今年{}岁了!".format(name,...

2019-08-18 21:30:13 232

原创 Homework03

#1.统计正数和负数并计算这些平均数def average(*shu): a = 0 b = 0 for i in range(len(shu)): if shu[i] == 0: break else: if shu[i] > 0: a += 1 #...

2019-08-18 19:27:45 95

原创 Homework02

1.解二元一次方程def hanshu(a,b,c): gen = (b*b) - (4*a*c) if gen > 0 : r1 = (-b + gen**0.5) / 2*a r2 = (-b - gen**0.5) / 2*a print("The root are {} and {}".format(r1,r2)) ...

2019-08-16 00:25:16 112

原创 Python Day02

一、循环结构for-in 循环:明确知道循环执行的次数或者是要对一个容器进行迭代时用到。主要用于计数的功能,真正的用途适用于可迭代对象。可迭代对象:(1)列表 (2)元组 (3)字典 (4)集合##eg1:用for循环实现1~100求和 sum = 0 for i in range(101):#range(start,end,step),前闭后开 sum += i ...

2019-08-15 17:45:46 167

原创 homework01

#华氏温度‘’’celsius = int(input(“Enter a degree in Celsius:”))fashrenheit = (9 / 5) * celsius + 32print(’{} Celsius is {} Fahren’.format(celsius,fashrenheit))‘’’#圆柱体的体积‘’’import mathradius = floa...

2019-08-15 08:34:26 107

原创 Python Day01~

一、初识PythonPython优点Python缺点:- [ ] 执行效率稍低,因此计算密集型任务可以由C++。- [ ] 代码无法加密,但是现在的公司很多都不是卖软件而是卖服务,这个问题会被淡化。- [ ] 在开发时可以选择的框架太多(如Web框架就有10多个),有选择地地方就有错误。Python的应用领域: 云基础设施 DevOps 网络爬虫开发 数据分析挖掘...

2019-08-14 17:52:18 130

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除