自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 收藏
  • 关注

原创 关于Hashmap

关于Hashmap(网易大数据开发编程题)小易的公司一共有n名员工, 第i个人每个月的薪酬是x_i 万元。现在小易的老板向小易提了m次询问, 每次询问老板都会给出一个整数k, 小易要快速回答老板工资等于k的员工的数量。import java.util.HashMap;import java.util.Scanner;public class Test { public static void main(String[] args) { Scanner in = new S

2020-08-08 13:14:16 260

原创 HTML表单输入属性(readonly、disabled、size、maxlength、HTML5增加的属性)

1.value 属性<form action=""> First name:<br><input type="text" name="firstname" value="John"><br> Last name:<br><input type="text" name="lastname"></form> 2.readonly 属性readonly 属性规定输入字段为只读(不能修改):<form

2020-07-21 19:07:20 1194 1

原创 HTML输入类型(number、date、month、range、week等)

1、HTML5 输入类型HTML5 增加了多个新的输入类型:colordatedatetimedatetime-localemailmonthnumberrangesearchteltimeurlweek注释:老式 web 浏览器不支持的输入类型,会被视为输入类型 text。2.输入类型:number<input type="number"> 用于应该包含数字值的输入字段。能够对数字做出限制。<form> Quantity (between 1

2020-07-19 16:13:40 2275

原创 HTML表单和表单元素

一、HTML表单HTML 表单用于搜集不同类型的用户输入。1.<form> 元素HTML 表单用于收集用户输入。<form> 元素定义 HTML 表单:<form> .form elements .</form>2.HTML 表单包含表单元素。表单元素指的是不同类型的 input 元素、复选框、单选按钮、提交按钮等等。3.<input> 元素<input> 元素是最重要的表单元素。<input>

2020-07-19 12:44:06 343

原创 XHTML简介、元素、属性

一、XHTML简介1.什么是 XHTML?XHTML 是以 XML 格式编写的 HTML。XHTML 指的是可扩展超文本标记语言XHTML 与 HTML 4.01 几乎是相同的XHTML 是更严格更纯净的 HTML 版本XHTML 是以 XML 应用的方式定义的 HTMLXHTML 是 2001 年 1 月发布的 W3C 推荐标准XHTML 得到所有主流浏览器的支持2.文档结构XHTML DOCTYPE 是强制性的<html> 中的 XML namespace 属性是强制性

2020-07-19 10:08:02 908

原创 数学类笔试题(四分位数、数据规约和协方差)

1.考虑值集{12, 24, 33, 2, 4, 55, 68, 26},其四分位数极差是:(A)A 31B 24C 55D 3四分位数(Quartile),即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。Q1的位置= (n+1) × 0.25Q2的位置= (n+1) × 0.5Q3的位置= (n+1) × 0.75n表示项数第1个和第3个四分位数之间的距离是散布的一种简单度量,它给出被数据的中间一半所覆盖的范围。该距离称为四分位数极差(IQR),定

2020-07-18 22:09:38 11397 2

原创 HTML速查列表

2020-07-17 18:55:12 168

原创 HTML脚本、字符实体和URL(统一资源定位器)

1.HTML脚本①<script>定义客户端脚本,如JavaScript。既可包含脚本语句,也可通过src属性指向外部脚本文件。javascript最常用于图片操作、表单验证以及内容动态更新。②<noscript>标签提供无法使用脚本时的替代内容,比如在浏览器禁用脚本时,或浏览器不支持客户端脚本时。可包含普通HTML页面的body元素中能够找到的所有元素。只有在浏览器不支持脚本或禁用脚本时,才会显示<noscript>元素中的内容。<script>

2020-07-17 18:32:17 190

原创 HTML颜色

HTML颜色由红色、绿色、蓝色混合组成。HTML颜色由一个十六进制符号来定义,这个符号由红色、绿色、蓝色的值组成(RGB)。每种颜色的最小值是0(十六进制:#00)。最大值是255(十六进制:#FF)。颜色十六进制值...

2020-07-17 17:39:22 4575

原创 HTML表单和框架

1.HTML表单和输入表单是一个包含表单元素的区域。表单元素是允许用户在表单中输入内容,如:文本域(textarea)、下拉列表、单选框(radio-buttons)、复选框(checkboxes)等。表单使用表单标签<form>来设置:<form> input元素</form> 多数情况下被用到的表单标签是输入标签(<input>)输入类型是由类型属性(type)定义的。大多数被用到的输入类型如下:文本框(Text Fields)&

2020-07-17 17:27:46 219

原创 HTML表格、列表和区块

1.HTML表格表格由标签来定义。每个表格均有若干行(标签定义),每行被分隔为若干单元格(由标签定义)。字母td指表格数据(table data),即数据单元格的内容。数据单元格可以包含文本、图片、列表、段落、表单、水平线、表格等。<body> <table border="1"> <tr> <th>Header 1</th> <th>Header 2</

2020-07-17 16:39:44 238

原创 HTML样式和图像

1.内联样式:当特殊的样式需要应用到个别元素时,就可以使用内联样式。使用内联样式的方法是在相关的标签中使用样式属性。<p style="color:blue;margin-left:20px;">这是一个段落。</p>如上,改变段落的颜色和左外边距。<body style="background-color:pink;"><h2 style="background-color:red">我的第一个标题</h2><p style=.

2020-07-17 10:34:07 224

原创 HTML属性、标签、格式化和head区域的元素标签

HTML属性:HTML元素提供的附加信息。HTML元素可以设置属性属性可以在元素中添加附加信息属性一般描述于开始标签属性总是以名称/值对的形式出现,比如:name=“value”。1.属性参考手册2.标签参考手册<br>插入单个折行(换行)<p>定义一个段落3.文本格式化 <b>加粗文本</b><br><br> <i>斜体文本</i><br><br> &l

2020-07-16 20:21:01 251

原创 html元素基础语法

1.简单例子<!DOCTYPE html><html><head><meta charset="utf-8"><title>牛客教程</title></head><body> <h1>我的第一个标题</h1> <p>我的第一个段落</p></body></html>2.HTML标题<!DOCTYPE h

2020-07-16 14:47:25 360

转载 STL中优先队列的使用

普通的队列是一种先进先出的数据结构,元素在队列尾追加,而从队列头删除。在优先队列中,元素被赋予优先级。当访问元素时,具有最高优先级的元素最先删除。优先队列具有最高级先出的行为特征。我们来说一下C++的STL queue库中优先队列的使用方法。STL默认使用<操作符来确定对象之间的优先级关系,所以如果要使用自定义对象,需要重载<操作符。优先队列有两种,一种是最大优先队列;一种是最小优先队列;每次取自队列的第一个元素分别是优先级最大和优先级最小的元素。使用头文件queue。优先队列的操作:q.

2020-07-10 09:58:02 356

原创 linux环境下hadoop集群时间同步

一.1.root用户下检查ntp是否存在 NTP(Network Time Protocol)协议[root@hadoop103 ~]# rpm -qa|grep ntpntp-4.2.6p5-1.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-1.el6.centos.x86_64[root@hadoop103 ~]# service ntpd statusntpd (pid 1537)

2020-06-16 22:46:14 249

原创 linux环境下hadoop集群完全分布式运行模式

配置文件(/opt/module/hadoop-2.7.2/etc/hadoop)1.vim slaves修改 hadoop102hadoop103hadoop1042.start-dfs.sh hdfs在102主要start-yarn.sh yarn在103主要http://hadoop102:50070/http://spark134:50070/http://hadoop103:8088/http://spark134:8088/检验:[atguigu@hadoop10

2020-06-16 22:44:26 230

原创 hadoop集群的免密登录

ssh(Secure Shell)免密登录ssh是群起集群时候需要依赖 的以非对称加密实现身份验证(A.B成对出现)用A加密必须用B解密公钥给远程中心 私钥给自己先102到103ssh-keygen -t rsaid_rsa私钥id_rsa.pub公钥known_hosts记录了所有见过的主机/home/atguigu/.sshssh-copy-id hadoop103(连接是单向的)密码在103 .ssh/authorized_keys authorized_keys保存所有能够

2020-06-16 22:42:15 224

原创 linux环境下hadoop2.X集群的配置

NN(1) DN(3) 2N(1)DN和NM是混搭在一起的。DN:当前节点存储,NM:当前节点的cpu.内存RM(1) NM(3)对于HDFS来说,主机是NN(102) 其他102,103,104是从机对于YARN来说,主机是RM(103),其他102,103,104是从机在102上配置,然后分发到103.104在env中填java_homevim core-site.xml<configuration> <!--指定HDFS中NameNode的地址 -->

2020-06-16 22:40:49 171

原创 Linux环境下hadoop完全分布式配置

1.克隆、改IP (在etc/hosts添加对应IP和host必须在root用户下)192.168.81.102 hadoop102192.168.81.103 hadoop103192.168.81.104 hadoop1042.scp完全copy(只是复制内容,没有复制时间戳)scp数据拷贝(可以远程拷贝)基本拷贝cp -r source destination cp -r /abc /def递归 源数据 目标数据远程拷贝:a、在hadoop101上,将hadoop101中

2020-06-16 22:36:50 335

原创 关于Java gateway process exited before sending the driver its port number

在cmd直接写pyspark就能进入anaconda,输入命令如上就一直有错误。在pycharm写也是这样。用maven写spark功能都可以实现(java和scala)。请问有什么解决方法?

2020-06-10 22:35:37 295

原创 java知识点整理0529

一、final关键字1.final修饰类、成员变量、成员方法。类不可被继承、成员变量不可变、成员方法不可被重写。2.final修饰的类不可以被继承,final修饰的方法不可以被覆盖。3.final修饰的变量为常量。只能赋值一次。4.一般final化的成员变量也会静态化。5.final不能修饰接口。6.final好人abstract不能同时使用,即final不能修饰抽象类。二、三、1.Float是类,float不是类。2.查看jdk源码就可以发现Byte,Character,Short,I

2020-05-29 23:50:16 644

原创 maven实现flink的wordcount词频统计

1.首先创建maven项目,并添加依赖。<dependencies> <!-- https://mvnrepository.com/artifact/org.apache.flink/flink-java --> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId&g

2020-05-29 14:59:15 388

原创 推荐系统架构说明和基础

红圈的最重要:召回、排序、业务调控。spark平台:计算数据仓库:存储在线评估:评估产品的好坏离线评估:离线评估好的不一定在在线评估时候好在线评估的结果最真实可靠。事先计算型:离线比如一天计算一次随取随给型:在线要求很快算出推荐一般用非关系型数据库,key-value是覆盖型,数据库需要大规模读写,CouchBash类似于json比如:经常一起购买的商品浏览此商品的顾客也同时浏览用户画像...

2020-05-26 00:19:47 208

原创 在windows上运行spark

在windows上打开sparkG:\Windows\System32>pysparkPython 3.7.4 (tags/v3.7.4:e09359112e, Jul 8 2019, 20:34:20) [MSC v.1916 64 bit (AMD64)] on win32Type "help", "copyright", "credits" or "license" for more information.20/05/12 18:19:49 WARN NativeCodeLoader

2020-05-12 18:24:37 637

原创 scrapy爬虫的简单实例

创建文件D:/pycodesD:\pycodes>scrapy startproject python123demoNew Scrapy project 'python123demo', using template directory 'c:\users\administrator\appdata\local\programs\python\python37\lib\site-pa...

2020-05-08 12:05:40 405

原创 scrapy爬虫框架介绍和与request库的比较

中间件:和request库的比较

2020-05-08 10:36:30 314

原创 股票数据定向爬虫实例

候选数据网站的选择:选取原则:股票信息静态存在于HTML页面中,非js代码生成,没有robots协议限制。选取方法:浏览器(ctrl+shift+I),源代码查看等。选取心态:不要纠结于某个网站,多找信息源尝试。import requestsfrom bs4 import BeautifulSoup#import tracebackimport redef getHTMLT...

2020-05-08 00:25:20 566

原创 淘宝商品信息定向爬虫实例

1.说明获得淘宝的搜索接口淘宝搜索页面不允许爬虫爬取不要不加限制的爬取次网站2.代码import reimport requestsdef getHTMLText(url): try: headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap...

2020-05-07 16:59:01 1735 1

原创 re库的基本使用、match对象和贪婪匹配

1.基本函数原生字符串中间的斜杠不被解释为转义符上例是邮政编码和国内手机的正则表达式即当正则表达式包含转义符时,使用raw stringre.IGNORECASE 匹配大小写import rematch=re.search(r'[1-9]\d{5}','BIT 100081')if match: print(match.group(0))结果:100081...

2020-05-07 10:09:59 467

原创 正则表达式的概念和语法

1.概念简洁,‘一行胜千言’主要应用在字符串匹配中2.语法^是异或符号

2020-05-06 01:46:07 196

原创 中国大学排名定向爬虫实例

import requestsfrom bs4 import BeautifulSoupimport bs4#将url信息爬取,并将html页面返回给其他程序def getHTMLText(url): try: r=requests.get(url,timeout=30) r.raise_for_status() r.enc...

2020-05-05 20:43:48 353

原创 基于bs4库的html内容查找方法

>>> for link in soup.find_all("a"):... print(link.get('href'))...http://www.icourse163.org/course/BIT-268001http://www.icourse163.org/course/BIT-1001870001>>> soup.find_all(...

2020-05-05 17:09:10 226

原创 信息提取的一般方法

>>> import requests>>> r=requests.get("http://python123.io/ws/demo.html")>>> demo=r.text>>> demo'<html><head><title>This is a python demo ...

2020-05-05 16:03:32 634

原创 三种信息标记和比较

1.xml键不可以有多个,值可以有多个。

2020-05-05 15:49:50 284

原创 基于bs4的Html格式化和编码

上面代码下面demo都是前几个案例中用到的>>> soup.prettify()'<html>\n <head>\n <title>\n This is a python demo page\n </title>\n </head>\n <body>\n <p class="title...

2020-05-05 01:32:22 368

原创 基于bs4库的html内容遍历方法

>>> import requests>>> r=requests.get("http://python123.io/ws/demo.html")>>> demo=r.text>>> demo'<html><head><title>This is a python demo ...

2020-05-04 18:22:05 319

原创 BeatuifulSoup库的基本元素

BeatuifulSoup库的基本元素>>> import requests>>> r=requests.get("http://python123.io/ws/demo.html")>>> r.text'<html><head><title>This is a python demo page&lt...

2020-05-03 22:23:14 230

原创 网络图片的爬取

import requestsimport osurl="http://image.ngchina.com.cn/2018/0508/20180508112527849.jpg"root="D://pics//"path=root+url.split("/")[-1]#文件名是url最后一部分20180508112527849.jpgtry: if not os.path.ex...

2020-05-03 19:41:45 287

原创 百度和360的关键词提交

1.百度关键词提交替换keyword,import requestskeyword="python"try: kv={'wd':keyword} r=requests.get("http://www.baidu.com/s",params=kv) print(r.request.url) r.raise_for_status() #r.encodi...

2020-05-03 15:05:27 1109 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除