自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hxxjxw的博客

写了一天bug累了吧

  • 博客(27)
  • 收藏
  • 关注

原创 大数据技术原理与应用(二):大数据处理架构Hadoop

Hadoop简介Hadoop是Apache软件基金会旗下开源软件,是一个开源分布式计算平台Hadoop屏蔽了大数据底层实现的细节,只需要按照它提供的更高层的接口,做一些简单的编程操作,后台所有的工作全部由整个系统自己实现。Hadoop平台是利用java平台来开发的。但是Hadoop可以支持多种语言Hadoop两大核心——HDFS(分布式文件系统)+MapReduce(分布式并行框...

2019-05-29 18:21:11 608

原创 大数据技术原理与应用(一):大数据概述

大数据时代大数据开始被人们所熟知是在2010年前后。2010年前后,以云计算、大数据、物联网的普及为标志迎来第三次信息化浪潮大数据的概念与影响4V大数据由结构化和非结构化数据组成,90%都是非结构化的结构化数据是指存储在关系型数据库当中的非常规范的数据大数据对我们思维方式的影响全样而非抽样(已经由足够的空间和计算能力对全样数据进行存储和分析而不...

2019-05-28 14:15:32 3444

原创 Python—Scrapy爬虫框架

scrapy爬虫框架scrapy是一个功能强大的网络爬虫框架scrapy不是一个函数功能库,而是一个爬虫框架scrapy爬虫框架一共包含7个部分,称为“5+2”结构。5个部分是框架的主体部分,另外包含2个中间件中间件之一spiders是整个爬虫框架最核心的一个单元中间件之二requesus库和scrapy爬虫比较scrapy是基于异步结构设...

2019-05-26 08:58:59 739 2

原创 Python网络爬虫与信息提取(四):网络爬虫之实战(淘宝商品比价 & 股票数据)

正则表达式正则表达式的概念regular expression RE正则表达式是用来简洁表达一组字符串的表达式一行胜千言正则表达式的语法正则表达式语法由字符和操作符构成Re库的基本使用Re库是python的标准库,主要用于字符串匹配即“\”不被解释为转义符import rematch = re.sea...

2019-05-23 14:50:11 473

原创 Windows安全模板配置

"安全模板"是一种可以定义安全策略的文件表示方式,它能够配置账户和本地策略、事件日志、受限组、文件系统、注册表以及系统服务等项目的安全设置。安全模板都以.inf格式的文本文件存在,用户可以方便地复制、粘贴、导入或导出某些模板。此外,安全模板并不引入新的安全参数,而只是将所有现有的安全属性组织到一个位置以简化安全性管理,并且提供了一种快速批量修改安全选项的方法。 安全模板...

2019-05-22 16:14:53 4863

原创 查看win10系统日志

①右键win键,选择事件查看器

2019-05-22 15:31:26 3496

原创 Python网络爬虫与信息提取(三):网络爬虫之提取(Beautifulsoup bs4)

Beautifulsoup库简介Beautifulsoup,又叫美丽汤,是一个优秀的python第三方库,能够对html,xml进行解析,并且提取其中的相关信息。Beautifulsoup的使用原理是他能够吧任何你给他的文档当做一锅汤,然后给你煲制这锅汤import requestsr = requests.get('http://python123.io/ws/demo....

2019-05-20 22:18:09 747 2

原创 字符串编码(ASCII, GBK, ANSI, Unicode(‘\u‘), UTF-8编码)

GBK编码 GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。 由于ASCII编码不支持中文,因此,当中国人用到计算机时,就需要寻求一种编码方式来支持中文。于是,国人就定义了一套编码规则:当字符小于127位时,与ASCII的字符相同,但当两个大于127的字符连接在一起时,就代表一个汉字,第一个字节称为高字节(从0xA1-0xF7),第二个字节为低...

2019-05-12 15:01:36 18205 1

原创 Windows系统常见的文件系统格式(FAT, NTFS, ExFAT)

1、FAT,文件配置表(英语:File Allocation Table,首字母缩略字:FAT) FAT文件系统诞生于1977年,它最初是为软盘设计的文件系统,但是后来随着微软推出dos和win 9x系统,FAT文件系统经过适配被逐渐用到了硬盘上,并且在那时的20年中,一直是主流的文件系统。 后来随着硬件技术的进步,硬盘的容量也越来越大,这种文件格式逐渐被扩展了,出...

2019-05-12 08:43:17 23635

原创 ini文件和inf文件的区别

.inf Device INFormative File 是Microsoft公司为硬件设备制造商发布其驱动程序推出的一种文件格式.ini Initialization File 初始化文件 ini是配置文件,保存一些登录用的ID和密码。软件的个性化设置等信息inf是驱动文件,主要用来安装驱动程序,也用来配置光盘自动运行...

2019-05-11 12:56:09 1434

原创 C语言:main函数的命令行传参

一直以来通常情况下我们编写C语言程序都是这样的:但其实一个完整的main函数是如下定义的 main 函数中有两个参数,分别是 argc 和 argv。但是在 C 语言中规定,main 函数是不能被别的函数调用的,那究竟是谁传递了参数给main 函数呢?答案是:命令行 当我们在命令执行程序时,其实就是在给main 函数传递参数。其中 argc 的全称是 arg...

2019-05-09 19:38:55 4372

原创 IA-32处理器与8086 && 实模式,保护模式和虚拟8086模式

IA-32微处理器是8086的延伸 IA-32是32位的处理器,而8086是16位的。 IA-32(Intel Architeture),英特尔体系架构,也叫x86-32架构。IA-32在英特尔公司在1985年推出80386处理器时首先采用。 IA-32有很多比8086拓展的地方,比如16位拓展到32位,IA-32微处理器开始有了实模式和保护模式之...

2019-05-09 18:31:13 639

原创 Windows防火墙添加禁用规则——以禁用微信为例

①打开防火墙,选择高级设置②选择出站规则右侧的新建规则③选择程序,点击下一步④选择微信的地址,点击下一步⑥选择阻止连接,点击下一步⑦下一步⑧取名称,点击完成之后微信马上就显示网络不可用了想取消直接右键——禁用规则即可...

2019-05-06 20:17:52 11561

原创 Python网络爬虫与信息提取(二):网络爬虫之规则(Requests库 & Robots规则)

Requests库的7个主要方法Requests库的get()方法获得一个网页最简单的一行代码就是 r = requests.get(url)Requests库支持6种常用的连接异常raise_for_status() 方法 response这样一个对象返回了所有的网页内容,它也提供了一个方法:raise_for_status(),这个方法是专门与异常打...

2019-05-05 18:25:31 1159

原创 Python网络爬虫与信息提取(一)(Wing & Canopy)

相关基础知识和概念掌握定向网络数据爬取和网页解析能力The Website is the APIRequests库:自动爬取HTML页面,自动网络请求提交 robots.txt:网络爬虫排除标准 BeautifulSoup库:解析HTML页面,提取相关信息 Re库:正则表达式库。通过正则表达式的使用可以在页面中提取我们最关心的关键信息 Scrapy:专业网络爬虫的框架pyt...

2019-05-05 17:38:13 336

原创 人工智能实践:Tensorflow笔记(三):神经网络优化

1、1943年McCulloch Pitts神经元模型引入的激活函数f可以有效避免仅使用的线性组合,提高了模型的表达率,是模型具有更好的区分度。常用的激活函数有relu、sigmoid、tanh2、神经网络的复杂度 神经网络的复杂度多用神经网络层数和神经网络参数的个数表示计算层数只计算具有运算能力的层(所以是不计入输入层的)3、神经网络的优化...

2019-05-05 12:46:50 793

原创 desktop.ini和folder.htt

Windows系统允许你自定义文件夹的属性,而系统把这些文件夹的属性信息就存放在folder.htt和desktop.ini中,这两个文件不是很重要,如果你不喜欢,随时你都可以把它删除,但说不定什么时候系统还会自动创建它。但是现在的某些病毒如“欢乐时光”病毒就把自己隐藏在此文件中 desktop.ini是系统可识别的一个文件,作用是存储用户对文件夹的个性设置(用户...

2019-05-03 16:44:37 758

原创 操作系统市场份额

1、操作系统市场份额Windows Server 2008 > Windows Server 2012 > Windows Server 2003 > Linux以前一直以为服务器操作系统主要是Linux的天下,原来依旧是Windows占主流2、Unix和Linux...

2019-05-03 16:43:26 6873

原创 ActiveX

什么是ActiveX ActiveX 是一个打开的集成平台,为开发人员、 用户和 Web生产商提供了一个快速而简便的在 Internet 和 Intranet 创建程序集成和内容的方法。 使用 ActiveX, 可轻松方便的在 Web页中插入 多媒体效果、 交互式对象、以及复杂程序,创建用户体验相当的高质量多媒体 CD-ROM...

2019-05-03 11:14:18 3698

原创 Windows修改注册表实现开机自启动

1、打开注册表 计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run2、右键添加字符串值3、添加想要开机自启动运行的程序的地址注意一定要加英文双引号,不然不行...

2019-05-03 10:52:06 13478 1

原创 WSH和FSO

WSH (Windows Scripting Host)中文叫Windows脚本宿主,是内嵌于 Windows 操作系统中的脚本语言工作环境。 你自己编写了一个脚本文件,如后缀为 .vbs 或 .js 的文件,然后在 Windows 下双击并执行它,这时,系统就会自动调用一个适当的程序来对它进行解释并执行,而这个程序,就是 Windows Scripting Hos...

2019-05-03 09:54:03 394

原创 Windows任务计划程序

通常开发过程中,我们的windows控制台应用程序要想在windows中自动定时运行,windows任务计划程序是一个非常简便的选择。步骤:

2019-05-02 19:50:24 6873 1

原创 Windows启动文件夹与设置开机自启动脚本/软件开机自启

1、Windows启动文件夹系统“启动”文件夹 :C:\ProgramData\Microsoft\Windows\Start Menu\Programs\StartUp 这个ProgramData文件夹是隐藏的 某个用户的“启动”文件夹 :C:\Users\Default\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Sta...

2019-05-02 18:48:49 19822

原创 Windows组策略

1、什么是组策略? 组策略是一种管理员限制用户和限制计算机使用界面,使用功能的一种工具(管理注册表的系统应用),使用gpedit.msc打开,但Win10家庭版被禁用了 组策略(Group Policy)是Microsoft Windows系统管理员为用户和计算机定义并控制程序、网络资源及操作系统行为的主要工具。通过使用组策略可以设置各种软件、计算机和用户策略。...

2019-05-02 18:21:26 21631

原创 Windows的口令文件SAM

Windows对用户账户的安全管理使用了安全账号管理器(Security Account Manager,简称SAM)的机制 SAM文件即账号密码数据库文件。当我们登录系统的时候,系统会自动地和Config中的SAM自动校对,如发现此次密码和用户名全与SAM文件中的加密数据符合时,你就会顺利登录;如果错误则无法登录。登陆Windows系统后SAM是被锁死的,不能复制...

2019-05-01 12:05:41 8838

原创 HTTPS 与 SSL

https即http下加入SSL层SSL(Secure Socket Layer) 安全套接字应用层 出现背景:传统的万维网协议HTTP不具备安全机制——采用明文的形式数据传输、不能验证通信两方的身份、无法防止传输的数据被篡改等,导致HTTP无法满足电子商务和网上银行等应用的安全性要求 Netscape公司提出的安全协议SSL,利用数据加密、身份验证和消息完整性验证机...

2019-05-01 10:37:16 724

原创 人工智能实践:Tensorflow笔记(二):TensorFlow框架

1、使用Tensorflow搭建神经网络时,通常用张量表示数据,用计算图搭建神经网络,用会话执行计算图,再优化神经网络的参数(权重),获得更准确的模型2、张量与计算图 张量(tensor):多维数组(列表) 阶:张量的维数 0阶张量就是标量判断张量是几阶的,就可以看方括号有几个,n个就是n阶张量可以表示0阶到n阶数组(列表)...

2019-05-01 09:09:42 612

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除