自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 资源 (1)
  • 收藏
  • 关注

原创 夕风OCR识别工具参数设置教程

夕风OCR识别工具参数设置教程夕风OCR软件下载链接地址:https://wget.5752.me/Computer/code/夕风OCR识别工具_52pojie_V4.1.rar?hash=LxzB3r5D&download=1一、文本识别参数设置(百度OCR参数)建议自己申请key(就是软件设置里的参数),免费的!免费的!免费的!直接用自己的百度账号申请,方法在下面。1.百度OCR key申请网址,注册账号;链接地址:https://console.bce.baidu.com/a

2022-04-27 11:06:45 308

原创 用Anaconda安装TensorFlow(Windows10)

用Anaconda安装TensorFlow本部分分为方法一和方法二,方法一是从清华镜像官网下载速度较快,方法二是从GitHub下载,速度较慢(有梯子的建议使用)1.打开Anaconda Prompt2.输入下面两行命令,打开清华镜像官网conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --set show_channel_urls yes3.输

2022-04-19 19:13:07 8245 13

原创 HIVE操作命令

HIVE操作命令01.找出最高领导人(KING)(emp)所在位置(loc)select l.loc_name from emp e> join dept d> on e.deptno=d.deptno> join location l> on d.loc=l.loc > where job="PRESIDENT";02.获取emp工资前三名。工资包括sal,commselect sal+nvl(comm,0) s from emp order b

2021-12-08 18:51:16 99

原创 Xmind创建用户(root权限)

Xmind创建用户(root权限)目标文件:链接:https://pan.baidu.com/s/1ITHqmIaV9DUSjcmjcMF2pw提取码:6hir将这个文件替换到路径C:\Program Files\XMind\resources下的同名文件重启

2021-12-06 10:45:11 250

原创 MapReduce和Partition 根据部门编号分区,根据 薪水+补贴 降序排列

根据部门编号分区,根据 薪水+补贴 降序排列提取文件:https://pan.baidu.com/s/1kG7WvALT-ys24GPbDC8XgQ 提取码:dt5a目录根据部门编号分区,根据 薪水+补贴 降序排列一、MapReduce和Partition部分:二、Employee类:数据字段依次为:员工编号,名字,职业,上级编号,日期,薪水,补贴,部门编号代码分为两部分:(更改类名带入即可直接使用,注释文中均有注意查看)一、MapReduce和Partition部分:/** * @Ti

2021-11-25 10:29:52 1413 1

原创 访问HDFS集群文件并将内容写入Hbase,附带条件筛选

访问HDFS集群文件并将内容写入Hbase注释在代码中均有,可自行查看测试的目标文件:链接:https://pan.baidu.com/s/1TXQhbGAd8YSppBpljj_ldw提取码:b78n需要将其先上传到Hdfs集群上:hadoop fs -put 文件名称 路径一共三个功能自定义函数,一个main函数;/** * @Time : 2021/11/19 14:48 * @Auther : Carapace * @File : testa.java * Software

2021-11-19 19:16:41 1067

原创 Gzip解压缩代码实现

Gzip解压缩代码实现·1.运行虚拟机2.在Idea的Maven中打包代码3.将打包文件拖入虚拟机中4.执行jar包在Idea的Maven中打包代码:将xml文件压缩成gzip文件:/** * @Time : 2021/10/23 15:24 * @Auther : Carapace * @File : DeflateCodeDemo.java * Software: IntelliJ IDEA */package com.GzipCodeDemo;import org

2021-11-18 20:53:58 1926

原创 使用MapReduce对豆瓣的数据评分进行排序,最终只要:电影名,评分 两个字段。(温馨提示:数据需要去重)

使用MapReduce对豆瓣的数据评分进行排序,最终只要:电影名,评分 两个字段。(温馨提示:数据需要去重)一、首先讲一下Java中的compareTo方法:利用CompareTo时,其返回值为 0,1,-1。1 表示两个数交换顺序,-1 表示不交换顺序。0 表示表示两者重复,不交换顺序,但表示两个元素相同,发生覆盖进而造成数据丢失,是个坑。而在map中比较的是key,发现相同会进行覆盖。可以利用这个坑顺利去重。代码演示:(排序以及去重部分) if (this.score > o.

2021-11-14 17:05:55 1793

转载 Jupyter 自动提示插件

Jupyter 自动提示插件注意点:安装插件前建议关闭Jupyter notebook在Anaconda Prompt(如下所示)中输入以下代码安装(两条)pip install jupyter_nbextensions_configurator -i https://pypi.doubanio.com/simplepip install jupyter_contrib_nbextensions -i https://pypi.doubanio.com/simple配置(两条)jupy

2021-10-28 17:03:35 161

原创 Xsync 集群分发脚本

Xsync 集群分发脚本#查看全局变量[atguigu@hadoop102 ~]$ echo $PATH/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/home/atguigu/.local/bin:/home/atguigu/bin:/opt/module/jdk1.8.0_212/bin[atguigu@hadoop102 ~]$ mkdir bin[atguigu@hadoop102 ~]$ cd bin[atguigu@hadoo

2021-09-25 14:19:42 457

原创 HBase2.2.0基于Hadoop3.1.3的安装配置

HBase2.2.0基于Hadoop3.1.3的安装配置一、 安装部署HBase组件1.1 准备HBase组件Hbase下载链接:https://repo.huaweicloud.com/apache/hbase/2.2.0/------------------------若想要其他版本把链接尾部的2.2.0/删除掉即可以下均在在root用户下进行操作,如果想用其他用户,务必在解压文件前切换用户,以免因为文件所属用户,导致权限问题错误在hadoop105上准备HBase组件。步骤 1解压

2021-09-25 13:52:00 266

原创 CSDN字体格式(字体、颜色、大小)、背景色设置

CSDN字体格式(字体、颜色、大小)、背景色设置文章目录1、字体颜色2、字体大小3、字体4、背景色CSDN的markdown编辑器是其衍生版本,扩展了Markdown的功能(如表格、脚注、内嵌HTML等等)就是内嵌HTML,接下来要讲的功能就需要使用内嵌HTML的方法来实现。1、字体颜色rgb 颜色 在线查询浅红色文字:<font color="#dd0000">浅红色文字:</font><br /> 深红色文字:<font color="#660000

2021-09-16 13:00:30 68

原创 二进制,十进制,八进制,十六进制转换

二进制,十进制,八进制,十六进制转换文章目录二进制与十进制的转换二进制与八进制的转换二进制与十六进制的转换八进制与十进制的转换十进制与十六进制的转换二进制三位一组分开就是八进制, 四位一组就是十六进制二进制与十进制的转换(1)二进制转十进制方法:“按权展开求和”【例】:整数转换【例】:小数转换 (0.101)2 = 1x2-1 +0x2-2 +1x2-3 = (0.625)10规律:个位上的数字的次数是0,十位上的数字的次数是1,…,依次递增,而十分位的数字的次数是-1,百分位上数字的次数

2021-09-16 12:08:49 232

原创 二进制,十进制,八进制,十六进制转换

十进制浮点数转换成二进制㈠浮点数储存浮点数在计算机中存储也是以二进制的形式,遵循IEEE二进制算数标准;格式为:float : 符号位(首位)、指数位(8位)、尾数(23位)double:符号位(首位)、指数位(11位)、尾数(52位)㈡十进制浮点数转换为二进制★方法:⑴整数部分:除以2,取出余数,商继续除以2,直到得到0为止,将取出的余数逆序⑵小数部分:乘以2,然后取出整数部分,将剩下的小数部分继续乘以2,然后再取整数部分,一直取到小数部分为零为止。如果永远不为零,则按要求保留足够位

2021-09-16 11:59:57 101

原创 IDEA Maven配置

IDEA Maven配置IDEA之maven配置详解IDEA专业版安装使用链接:https://pan.baidu.com/s/1indoy-DcFbtM4UcAj37Hnw 提取码:Ytgz这两天被maven配置搞得焦头烂额,前后忙活了三天才彻底搞定。下面我总结一下配置的步骤。步骤首先去maven官网去下载maven,http://maven.apache.org/ ,这里教大家一个小技巧,apache公司的所有项目都可以通过像maven.apache.org或tomcat.apac

2021-09-15 10:35:15 106

原创 CentOS7更改为Huawei镜像源

CentOS7更改为Huawei镜像源CentOS的镜像地址为:https://repo.huaweicloud.com/centos/1、备份配置文件:cp -a /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak2、两种方案,请大家自行选取。方案一:下载新的CentOS-Base.repo文件到**/etc/yum.repos.d/目录下,选择CentOS**版本:wget -O /etc/yu

2021-09-10 12:47:21 558

原创 VMware创建虚拟机,并克隆虚拟机

VMware创建虚拟机 1.点击创建新的虚拟机 2.点击下一步 3.选择稍后安装操作系统 4.客户机操作系统:Linux 版本:CentOS 7 (32位64位根据电脑选择) 5.虚拟机名称:起些方便的,便于以后的IP地址与虚拟机名称映射6.首先,打开任务管理器,点击性能,图中红色方框,逻辑处理器个数即为CPU总个数 ---记为CP 处理器数量即为CPU数 图中为一台虚拟机的处理器内核数 根据总共要创

2021-09-04 14:30:12 392

原创 CPU,核心,线程,超线程技术以及它们之间的关系

CPU,核心,线程,超线程技术以及它们之间的关系总结:1.CPU就是处理器。(物理核心)2.我们任务管理器下看到的CPU总数,是你的CPU物理核心数用超线程技术虚拟出来的核心数。3.线程数就是模拟出来的CPU核心数(注意不是CPU物理核心数) 4.对于一个CPU,线程数总是大于或等于核心数(物理核心)的。一个核心(物理核心)最少对应一个线程,但通过超线程技术,一个核心可以对应两个线程,也就是说它可以同时运行两个线程。这也就解释了为什么会有六核心(物理核心)十二线程(CPU核心数)的原因。

2021-09-04 12:07:16 6722

原创 Vmware 设置NAT模式及IP地址和主机名称映射

Vmware 设置NAT模式NAT模式,就是让虚拟系统借助NAT(网络地址转换)功能,通过宿主机器所在的网络来访问公网。也就是说,使用NAT模式可以实现在虚拟系统里访问互联网。NAT模式下的虚拟系统的TCP/IP配置信息是由VMnet8(NAT)虚拟网络的DHCP服务器提供的,无法进行手工修改,因此虚拟系统也就无法和本局域网中的其他真实主机进行通讯。文章中的名词,子网IP,网关IP,子网掩码,等名词可以参考:IP地址,子网掩码、默认网关,DNS服务器是什么意思?网关地址和网关IP是什么?打开虚拟

2021-09-03 23:04:58 119

原创 网关地址和网关IP是什么

网关地址和网关IP是什么一、什么是IP?:1、IP地址是指互联网协议地址(英语:Internet Protocol Address,又译为网际协议地址),是IP Address的缩写。IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。目前还有些ip代理软件,但大部分都收费。2、IP是英文Internet Protocol的缩写,意思是“网络之间互连的协议”,也就是为计算机网络相互连接进行通信而设计的协议。在因特网中,它是能使连接

2021-09-03 22:01:39 4451

原创 IP地址,子网掩码、默认网关,DNS服务器是什么意思?

IP地址,子网掩码、默认网关,DNS服务器是什么意思? (一) 问题解析问: IP地址,子网掩码,默认网关,DNS服务器,有什么区别呀?我知道没有IP地址就不能上网,我也知道没设DNS就不能上外网,可它们都有什么功能,有什么区别呢?还有真奇怪,我的计算机没设DNS,竟然能上QQ,却不能打开网页,这是为什么呢>答: IP是32位二进制数据,通常以十进制表示,并以“.”分隔。IP地址是一种逻辑地地址,用来标识网络中一个个主机,IP有唯一性,即每台机器的IP在全世界是唯一的。D

2021-09-03 21:58:39 545

原创 Selenium爬虫及浏览器模拟自动化操作

Selenium爬虫及浏览器模拟自动化操作selenium模块的基本使用方法:https://blog.csdn.net/m0_46299185/article/details/119985640?spm=1001.2014.3001.5502代码的前提是用对谷歌和drive插件(浏览器驱动),配置selenium库给出drive插件(浏览器驱动)安装详情链接:https://blog.csdn.net/m0_46299185/article/details/119725783?spm=1001.

2021-08-29 21:20:17 41

原创 selenium模块的基本使用

selenium模块的基本使用下载路径:http://chromedriver.storage.googleapis.com/index.html驱动程序和浏览器的映射关系:https://blog.csdn.net/m0_46299185/article/details/119725783?spm=1001.2014.3001.5502若想要试试手,可以参考这篇文章了解基本使用:问题:selenium模块和爬虫之间具有着怎样的关联? - 便捷的获取网站中动态加载的数据 - 便捷实现

2021-08-29 21:12:14 31

原创 /etc/profile 和 /etc/profile.d/ 的区别

/etc/profile 和 /etc/profile.d/ 的区别/etc/profile /etc/profile.d/1这两个文件都是设置环境变量文件的,/etc/profile是永久性的环境变量,是全局变量,/etc/profile.d/设置所有用户生效。2/etc/profile.d/更好维护,不想要什么变量直接删除/etc/profile.d/下对应的shell脚本即可,不用像/etc/profile 需要改动此文件。...

2021-08-27 19:14:31 30

原创 Python爬取新浪博文的所有文章并存为带目录的word文档

Python爬取博客的所有文章并存为带目录的word文档1.先获取到所有文章的标题、发表日期、链接2.通过链接获取文章的内容3.将文章标题作为“1级”,发表日期和内容作为正文写入word文件4.保存word文件每段代码含义,作用在代码注释中都有解释文章只需要更改想要访问的网址,和保存的word文档名称即可(代码本身可以直接使用),看完可以小手点赞收藏呦,谢谢。#-*- codeing = utf-8 -*-#@Time : 2021/8/23 20:24#@Auther : Yt.Mono

2021-08-24 14:04:17 139

原创 selenium关于 chromedriver与chrome版本映射表

selenium关于 chromedriver与chrome版本映射表在学习爬虫,因访问频繁,ip被封,去学习了selenium,需要下载与浏览器相对应的浏览器驱动(个人谷歌浏览器),找起来比较麻烦,于是想整理一份比较完善的chromedriver与chrome的对应关系表,希望对大家有用:支持的Chrome版本chromedriver版本v71-73v2.46v70-72v2.45v69-71v2.44v69-71v2.43v68-70v2.42

2021-08-16 10:06:02 170

原创 正则表达式之 贪婪与非贪婪模式详解(概述)

1 概述贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NFA引擎所支持。属于贪婪模式的量词,也叫做匹配优先量词,包括:“{m,n}”、“{m,}”、“?”、“*”和“+”。在一些使用NFA引擎的语言中,在匹配优先量词后加上“?”,即变成属于非贪婪模式的量词,也叫做忽略优先量词,包括:“{m,n}?”、“{m,}?”、“??”、“*?”和“+?”。从正则语法的

2021-08-10 12:00:58 341

原创 给浏览器添加油猴插件 and 如何使用

给浏览器添加油猴插件 and 如何使用1.下载安装文件https://chrome.pictureknow.com 选择油猴下载在浏览器提示中选择保留2.打开浏览器拓展安装页面浏览器名称://extensions/chrome://extensions/ 谷歌浏览器edge://extensions/ Edge浏览器等等3.安装插件在拓展安装页面打开**【开发者模式】**,把1中下载好的.crx文件拖入拓展中心即可。Edge的开发者模式chrome的开发者模式

2021-08-10 09:54:34 5074

原创 Pycharm下载安装Wordcloud的出错问题

Pycharm下载安装Wordcloud的出错问题文章末尾#附加一个近乎万能Python安装包网址(网址内control+f搜索即可)声明:在Pycharm的Project Interpreter中下载安装wordcloud时,出现 Install packages failed: Installing packages: error occurred. Details…或者在Terminal中执行pip install wordcloud的安装包时出现 ERROR: wordcloud-1.8.1

2021-07-31 22:21:09 962 1

原创 html前端素材(网页模板素材)

html前端素材(网页模板素材)Pycharm html网页模板制作素材(后续会进行补充…)链接:https://pan.baidu.com/s/1wCzKBvKgOPSLF2TyL6PmAQ提取码:Ytmo

2021-07-29 18:07:03 566

原创 解决127.0.0.1 已拒绝连接的方法

127.0.0.1 已拒绝连接。出现这种情况时,打开cmd,在cmd中 ping 127.0.0.1 会出现下图情况。在cmd中ping 127.0.0.1解析出来的是IPV6的::1,原因是windows有个优先解析列表,当ipv6的优先级高于ipv4时,就会出现这种情况。修改优先级的方法解决的,即修改ipv4优先级高于ipv6的记录到优先解析表中。具体方法如下:1.win+x---->Windows PowerShell(管理员)(A) (就用是管理员权限打开cmd)2.输入

2021-07-28 21:53:55 19601 13

原创 将txt文件内容提取出来并写入xls表格中

## 将txt文件内容提取出来并写入xls表格中1.根据上篇的提取txt文件内容排序,写入xls表格中,上代码(内容已包含上篇内容)。import xlwtimport jiebafrom jieba.analyse import *f=open('C:/Temp/sample1.txt',encoding='gbk').read() #提取txt文件的绝对路径a=[]for keyword,weight in textrank(f,topK=20,withWeight=True

2021-07-11 10:57:00 33

原创 利用jieba对txt文件进行提取关键词(热词,top*)并根据出现次数进行排序,输出关键词以及权重

利用jieba对txt文件进行提取关键词(热词,top*)并根据出现次数进行排序,输出关键词以及权重1.内容可直接使用,只需修改提取文件的绝对路径,话不多说上代码import jiebafrom jieba.analyse import *f=open('C:/Temp/sample1.txt',encoding='gbk').read() #只需要修改提取文件的绝对路径即可a=[]for keyword,weight in textrank(f,topK=20,withWeight=T

2021-07-11 10:37:39 35

原创 从xlsx中提取信息,或从xlsx中提取信息写入txt文件中

从xlsx中提取信息,或从xlsx中提取信息写入txt文件中1.直接上代码吧import xlrdworkbook=xlrd.open_workbook(‘C:/Temp/酒店评论(样例数据).xlsx’) #可直接添加文件绝对路径workbook1=xlrd.open_workbook(‘C:/Temp/景区评论(样例数据).xlsx’) #同上#第一个工作表sheet=workbook.sheet_by_index(0)sheet1=workbook.sheet_by_index(0)

2021-07-11 10:29:54 89

原创 2021-07-11

从xlsx中提取信息,或从xlsx中提取信息写入txt文件中1.在这里插入代码片import xlrdworkbook=xlrd.open_workbook(‘C:/Temp/酒店评论(样例数据).xlsx’) #可直接添加文件绝对路径workbook1=xlrd.open_workbook(‘C:/Temp/景区评论(样例数据).xlsx’) #同上#第一个工作表sheet=workbook.sheet_by_index(0)sheet1=workbook.sheet_by_i

2021-07-11 10:24:47 52

原创 2021-04-10

##怎么将任意程序添加进右键菜单?1.(这里我们以QQ为例)我要把QQ程序添加进右键菜单中,如图所示2.怎么操作呢,笔者来介绍一下:在开始菜单中点击右键,选择运行,如图所示3.打开运行菜单(或者win+r),输入regedit,如图所示4.在HKEY_CLASSES_ROOT目录下,依次展开:Directory\Background\shell,(切记,*目录下的shell添加的是右键图标菜单)如图所示5.选中shell,右键,新建项,如图所示6.将文件夹名字改为QQ,如图所示7.

2021-04-10 23:30:19 25

原创 2021-03-22

电脑总是自动安装软件弹出广告怎么办?1#直接点击电脑屏幕左下角的【菜单】-【设置】。2#之后选择第二行最后面的【应用】选项。3#在这里将获取应用的位置设置为【仅Microsoft store(推荐)】,这样当电脑想要安装软件时,系统就会出现提示,询问是否安装了。##阻止广告弹窗方法一1#电脑桌面上,双击【此电脑】,之后在【系统】中点击【管理】。2#双击【任务计划程序】,弹出【任务计划程序库】,对其进行单击。3#右侧这个框里显示的这些程序就是要弹出广告的程序。对其进行禁用即可。可以选

2021-03-22 11:24:06 47

Douban_Flask.zip

Douban_Top250爬虫结果搭建的网站,爬虫代码:https://blog.csdn.net/m0_46299185/article/details/119149827?spm=1001.2014.3001.5501

2021-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除