自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 资源 (4)
  • 收藏
  • 关注

原创 14-用Python 读写 Excel 文件

在以前,商业分析对应的英文单词是Business Analysis,大家用的分析工具是Excel,后来数据量大了,Excel应付不过来了(Excel最大支持行数为1048576行),人们...

2020-09-30 08:09:00 423

原创 14-python爬虫之JSON操作

结构化的数据是最好处理,一般都是类似JSON格式的字符串,直接解析JSON数据,提取JSON的关键字段即可。JSONJSON(JavaScript Object Notation) 是一种轻量级的数据交换格式;适用于进行数据交互的场景,比如网站前台与后台之间的数据交互Python 3.x中自带了JSON模块,直接import json就可以使用了。Json模块提供了四个功能:dumps、dump、loads、load,用于字符串 和 python数据类型间进行转换Python操作json的标准ap

2020-09-29 23:45:31 14121 31

原创 13-用 Python 读写 Excel 文件

在以前,商业分析对应的英文单词是Business Analysis,大家用的分析工具是Excel,后来数据量大了,Excel应付不过来了(Excel最大支持行数为1048576行),人们开始转向python和R这样的分析工具了XlsxWriterxlrd&xlwtOpenPyXLMicrosoft Excel API介绍可以创建 Excel 2007 或更高版本的 XLSX 文件即 python-excel,含 xlrd、xlwt 和 xlutils 三大模块,分别提

2020-09-29 23:27:13 11159 20

原创 12-python正则表达式

掌握了XPath、CSS选择器,为什么还要学习正则?正则表达式,用标准正则解析,一般会把HTML当做普通文本,用指定格式匹配当相关文本,适合小片段文本,或者某一串字符(比如电话号码、邮箱账户),或者HTML包含javascript的代码,无法用CSS选择器或者XPath在线正则表达式测试网站http://tool.oschina.net/regex/官方文档https://docs.python.org/zh-cn/3/library/re.html了解正则表达式正则表达式是对字符串操作的一种逻辑公

2020-09-29 23:25:23 9467 16

原创 13-python爬虫之JSON操作

结构化的数据是最好处理,一般都是类似JSON格式的字符串,直接解析JSON数据,提取JSON的关键字段即可。JSONJSON(JavaScript Object Notation) 是一...

2020-09-29 08:09:00 483

转载 刚刚用鸿蒙跑了个“hello world”!跑通后,我特么开始怀疑人生....

最近[华为鸿蒙OS 2.0]正式开源!关于鸿蒙的教程其实网上也已经有一些尝鲜的小伙伴分享的相关文章了,编者我按照步骤一步步跑下来,整个流程还是非常简单的,尤其是对Android开发的小伙伴来说,从IDE到项目的创建及项目的编译安装简直是一模一样呀。我特么的都有点怀疑人生了…感兴趣的读者也可以试试哦。再贴一下鸿蒙的源码地址:https://openharmony.gitee.com咱们一起来跟着一位网友学习一下如何跑起来第一个“hello world”,原文如下:1、前序1.1 官网:https:

2020-09-28 13:38:32 10887 1

原创 12-正则表达式

掌握了XPath、CSS选择器,为什么还要学习正则?正则表达式,用标准正则解析,一般会把HTML当做普通文本,用指定格式匹配当相关文本,适合小片段文本,或者某一串字符(比如电话号码、邮箱...

2020-09-28 08:09:00 506

原创 10-python爬虫之lxml库

lxml 是一种使用 Python 编写的库,可以迅速、灵活地处理 XML ,支持 XPath (XML Path Language)lxml python 官方文档 http://lxml.de/index.html学习目的利用上节课学习的XPath语法,来快速的定位 特定元素以及节点信息,目的是 提取出 HTML、XML 目标数据如何安装Ubuntu :sudo apt-get install libxml2-dev libxslt1-dev python-devsudo apt-g

2020-09-27 23:47:51 10611 1

原创 11-python爬虫之Beautiful Soup

CSS SelectorCSS(即层叠样式表Cascading Stylesheet),Selector来定位(locate)页面上的元素(Elements)。Selenium官网的Document里极力推荐使用CSS locator,而不是XPath来定位元素,原因是CSS locator比XPath locator速度快.Beautiful Soup 支持从HTML或XML文件中提取数据的Python库 支持Python标准库中的HTML解析器 还支持一些第三方的解

2020-09-26 18:50:50 13516 64

原创 09-XPath 语言-python爬虫

XPath 语言XPath(XML Path Language)是XML路径语言,它是一种用来定位XML文档中某部分位置的语言。学习目的将HTML转换成XML文档之后,用XPath查找HTML节点或元素比如用“/”来作为上下层级间的分隔,第一个“/”表示文档的根节点(注意,不是指文档最外层的tag节点,而是指文档本身)。比如对于一个HTML文件来说,最外层的节点应该是"/html"。XPath开发工具 开源的XPath表达式编辑工具:XMLQuire(XML格式文件..

2020-09-26 18:38:17 9233

原创 08-页面解析之数据提取-python爬虫

​一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值,内容一般分为两部分,非结构化的文本,或结构化的文本。关于结构化的数据JSON、XML、HTMLHTML文本(包含JavaScript代码)是最常见的数据格式,理应属于结构化的文本组织,但因为一般我们需要的关键信息并非直接可以得到需要进行对HTML的解析查找,甚至一些字符串操作才能得到,所以还是归类于非结构化的数据处理中。把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。.

2020-09-26 18:31:58 8867

原创 06-第一个python爬虫库urllib

终于要开始写爬虫代码了我们首先了解一下 Urllib 库,它是 Python 内置的 HTTP 请求库,也就是说我们不需要额外安装即可使用,它包含四个模块:第一个模块 request,它...

2020-09-22 08:06:00 418

原创 07-TCP3次握手,4次挥手过程!都不知道怎么学爬虫

1、建立连接协议(三次握手)(1)客户端发送一个带SYN标志的TCP报文到服务器。这是三次握手过程中的报文1。(2)服务器端回应客户端的,这是三次握手中的第2个报文,这个报文同时带ACK...

2020-09-22 08:06:00 296

原创 07-TCP 3次握手,4次挥手过程!都不知道怎么学爬虫

1、建立连接协议(三次握手)(1)客户端发送一个带SYN标志的TCP报文到服务器。这是三次握手过程中的报文1。(2)服务器端回应客户端的,这是三次握手中的第2个报文,这个报文同时带ACK标志和SYN标志。因此它表示对刚才客户端SYN报文的回应;同时又标识SYN给客户端,询问客户端是否准备好进行数据通讯。(3)客户必须再次回应服务段一个ACK报文,这是报文段3。为什么需要“三次握手”这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后,它可以把ACK和SYN(A

2020-09-22 07:23:38 8805

原创 06-python爬虫库urllib,开始编写python爬虫代码

终于要开始写爬虫代码了我们首先了解一下 Urllib 库,它是 Python 内置的 HTTP 请求库,也就是说我们不需要额外安装即可使用,它包含四个模块:第一个模块 request,它是最基本的 HTTP 请求模块,我们可以用它来模拟发送一请求,就像在浏览器里输入网址然后敲击回车一样,只需要给库方法传入 URL 还有额外的参数,就可以模拟实现这个过程了。第二个 error 模块即异常处理模块,如果出现请求错误,我们可以捕获这些异常,然后进行重试或其他操作保证程序不会意外终止。第三个 .

2020-09-22 07:17:12 8507 15

原创 04-爬虫利器Fiddler

Fiddler不但能截获各种浏览器发出的HTTP请求,也可以截获各种智能手机发出的HTTP/HTTPS请求。Fiddler能捕获IOS设备发出的请求,比如IPhone, IPad, MacBook. 等等苹果的设备。同理,也可以截获Andriod,Windows Phone的等设备发出的HTTP/HTTPS。工作原理Fiddler 是以代理web服务器的形式工作的,它使用代理地址:127.0.0.1,端口:8888。Fiddler抓取HTTPS设置启动Fiddler,打开..

2020-09-20 15:28:54 17619 35

原创 05-HTTP协议-万字好文!建议收藏

HTTP协议介绍设计HTTP(HyperText Transfer Protocol)是为了提供一种发布和接收HTML(HyperText Markup Language)页面的方法。Http组成由两部分组成:请求与响应客户端请求消息客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下图给出了请求报文的一般格式。服务器响应消息HTTP响应也由四个部分组成,分别是:

2020-09-20 13:58:18 16125 27

原创 05-HTTP协议-值得收藏

HTTP协议介绍设计HTTP(HyperText Transfer Protocol)是为了提供一种发布和接收HTML(HyperText Markup Language)页面的方法。H...

2020-09-20 11:57:27 302

原创 03-python爬虫基本原理

爬虫是 模拟用户在浏览器或者某个应用上的操作,把操作的过程、实现自动化的程序当我们在浏览器中输入一个url后回车,后台会发生什么?比如说你输入http://www.sina.com.cn/简单来说这段过程发生了以下四个步骤: 查找域名对应的IP地址。 向IP对应的服务器发送请求。 服务器响应请求,发回网页内容。 浏览器解析网页内容。 网络爬虫本质本质就是浏览器http请求浏览器和网络爬虫是两种不同的网络客户端,都以相同的方式来获取网页:..

2020-09-19 20:41:37 13601 48

原创 02-认识python爬虫

学习目的了解爬虫,爬虫起源;爬虫是什么专业术语:网络爬虫(又被称为网页蜘蛛,网络机器人)网络爬虫,是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。爬虫起源(产生背景)随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战;搜索引擎有Yahoo,Google,百度等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南网络爬虫是搜索引擎系统中十分重要的组成部分,它负责从互联网中搜集网页,采集信息这些网页信息用于建立索.

2020-09-19 20:29:26 9650 18

原创 03-爬虫基本原理

爬虫是 模拟用户在浏览器或者某个应用上的操作,把操作的过程、实现自动化的程序当我们在浏览器中输入一个url后回车,后台会发生什么?比如说你输入http://www.sina.com.cn...

2020-09-19 20:07:00 352

原创 10-jQuery中的事件与动画教程

jQuery中的事件作者:曾庆林事件初探加载文档完成触发:$(document).ready(function(){})事件可以多次执行。代码可以简写:$(function(){})事件绑定1 可以之间添加事件函数 $("h1").click(function(){ //触发事件要做的事情 })问题是:每次单击h1都会相应事件,不能解除。这个里面的函数也不能复用只能绑定一个函数2 可以通过绑定事件bind() 绑定事件unbind() 解绑事

2020-09-19 18:03:38 9297

原创 09-jquery获取元素的尺寸

元素的尺寸height()width()内容的宽 不含padding marigninnerHeight()innerWidth()内容的宽加上paddingouterHeight()outerWidth()内容的宽+padding+borderWidth(元素的实际宽)outerHeight(true)outerWidth(true)是内容的宽+padding+borderWidth(元素的实际宽)+margin$(window).width(

2020-09-19 17:54:45 10512

原创 08-jquery 文档Dom操作大全-建议收藏

jQuery 插入元素内部插入append()方法语法格式append(内容)Append(function(index,html))该方法在匹配元素集合的每个元素末尾插入由参数指定的内容并返回jQuery对象。html<button>按钮</button> <div class="b"> <h2>this 我是h2</h2></div>js$(function(){ $("button").clic

2020-09-19 09:33:41 10360 29

原创 07-jQuery-Class 操作

Class 操作作者:曾庆林addClass() 添加class$(elem).addClass("active");//注意class active 前面没有加点 removeClass() 删除class<h1 class="active header"></h1><script>$(function({ $("h1").removeClass("active"); // 这样只会删除 active class

2020-09-19 09:23:27 9027

原创 06 jquery 获取元素的内容-html()-val()-text()

获取元素的内容作者:曾庆林html()方法Html():获取匹配元素集合中第一个元素的HTML内容html(htmlstring) 设置匹配元素中的HTML内容//很少用,几乎大部分的jquery方法都可以用这样的回掉函数形式html(function(index,hmtl)):根据传递的函数来设置匹配元素集合中每个元素的HTML内容并返回jQuery对象。text()方法text():获取匹配元素中的文本text(string):设置元素的文本 注意:html() 和 text

2020-09-19 09:14:36 9233

原创 05-jquery-CSS 相关操作

CSS 相关操作CSS()方法 // 获取元素的css $("h1").css("font-size"); // 设置css $("h1").css("font-size","14px"); // 设置多个css属性 $("h1").css({"font-size":"14px","color":"red"}); 位置offset()获取匹配元素在当前视口的相对偏移。返回的对象包含两个整形属性:top 和 left。p

2020-09-19 09:12:14 10026

原创 04- jQuery 选择器大全教程收藏备用

jQuery 基本选择器&层次选择器作者:曾庆林jQuery选择器的优势写法简单支持CSS1至CSS3选择器完善的处理机制CSS选择器回顾选择器语法ID选择器#ID{CSS规则}类选择器.className{CSS规则}分组选择器E1,E2,E3{CSS规则}包含选择器E F{CSS规则}通配符选择器*{CSS规则}jQuery选择器的分类基本选择器层次选择器过滤选择器基本过滤选择器内容过滤选择器可见性过

2020-09-19 09:08:37 12257 24

原创 01-为什么要学爬虫-python小白爬虫入门教程

学习目的以及需求 需求来自于:抓取的某个网站或者某个应用的内容,提取有用的价值 实现手段 模拟用户在浏览器或者应用(app)上的操作,实现自动化的程序 爬虫应用场景(利用爬虫能做什么?) 大家最熟悉的应用场景 抢票神器(360抢票器)投票神器(微信朋友圈投票) 企业应用场景 咨询报告: 拉勾网招聘职位数据分析报告 2019年中国外卖O2O行业发展报告 2019年中国在线出境游市场研究报告 ..

2020-09-18 22:17:52 15647 43

原创 如何破解从入门到放弃,跨入最有钱途岗位,成为一个开发者?

​在大学计算机专业、理工类专业大多学习,C/C++,Java这些开发语言,Android, iOS也有不少同学买书或下载视频学习,但是最后都是没有结果。推荐诸位一本教孩子学习语言的书,很多家长看了都说管用!另外再推荐几本程序猿必备的精品读物:《C语言:从看懂到看开》、《JAVA语言:从精通到陌生》、《NET语言:从放弃到坚持放弃》、《21天精通Dreamweaver:从安装到卸载》、《数据结构:从蒙圈到无限茫然》、《软件工程:从空白到空白》、《UNIX:还没入门就夺门而逃》……

2020-09-18 22:08:04 9354

原创 Python学习资料总结

把手里积累了这么久的Python入门资料整理了一下,发现其实,有了这些,python入门真的不难,每天花点时间学,真的不会影响工作。下面一起来看看这些资料吧!一、可以学习Python的地...

2020-09-17 08:02:00 356

原创 Python学习资料总结-建议收藏备用

​把手里积累了这么久的Python入门资料整理了一下,发现其实,有了这些,python入门真的不难,每天花点时间学,真的不会影响工作。下面一起来看看这些资料吧!一、可以学习Python的地方♥曾庆林老师【python教程】App版本:https://www.anxz.com/down/77882.html网页版本:http://www.520mg.com/it1、Vamei老师:【python快速教程】https://www.cnblogs.com/vamei/arc...

2020-09-16 22:36:43 19761 64

原创 03-$(document).reay()

页面载入作者:曾庆林 jquery基础入门+实战系列教程 window.onload方法长久以来是程序员解决客户端页面载入问题的一个方法,只有少数大型的图片文件会被快速的载入,而大部分大型的图片文件会使window.onload()载入的很慢.DOM 1.0 加载方式window.onload=init;function init(){ alert("abc");}window.onload=init2;function init2(){ alert("123");}多次使用

2020-09-11 23:50:46 14079

原创 01-jquery概述

JQuery概述作者:曾庆林jQuery由美国人John Resig于2006年初创建,至今已吸引了来自世界各地的众多javascript高手加入其team。jQuery是一个快速的,简洁的javaScript库,使用户能更方便地处理HTML documents、events、实现动画效果,并且方便地为网站提供AJAX交互。jQuery能够使用户的html页保持代码和html内容分离,也就是说,不用再在html里面插入一堆js来调用命令了,只需定义id即可。jQuery是一个优秀的JavaScri

2020-09-11 23:28:37 16318

原创 02-$符号-jquery与js相互转换

$符号-jquery与js相互转换作者:曾庆林获取Dom对象JavaScript方式var id=document.getElementById("id");jQuery方式var $id=$("#id");js Dom对象 转换为jQuery 对象$(expression)接收一个包含 CSS 选择器的字符串,然后用这个字符串去匹配一组元素将一个或多个DOM元素转化为jQuery对象 注意是jQuery对象,而不是DOM对象var myh=document.getElement

2020-09-11 23:25:17 13660

原创 10-python程序员,面向对象基础

《python小白入门系列教程》有对象吗?没有就new 一个今天我们要用python new 一个对象面向过程VS面向对象1)面向过程核心是过程(流水线式思维),过程即解决问题的步骤,面向过程的设计就好比精心设计好一条流水线,考虑周全什么时候处理什么东西。**优点是:**极大的降低了写程序的复杂度,只需要顺着要执行的步骤,堆叠代码即可。**缺点是:**一套流水线或者流程就是用来解决一个问题,代码牵一发而动全身。**应用场景:**一旦完成基本很少改变的场景,著名的例子有Linux內核,gi

2020-09-11 22:58:15 18905 55

原创 09-python文件处理与输入输出

《python小白入门系列教程》 专栏 • 第09篇有些时候你的程序会与用户产生交互。举个例子,你会希望获取用户的输入内容,并向用户 打印出一些返回的结果。我们可以分别通过 input() 函数与print函数来实现这一需求。对于输入,我们还可以使用 str (String,字符串)类的各种方法。例如,你可以使用 rjust 方法来获得一个右对齐到指定宽度的字符串。你可以查看 help(str) 来了解更多细 节。另一个常见的输入输出类型是处理文件。创建、读取与写入文件对于很多程序来说是必不可 少的

2020-09-11 22:36:06 13091 2

原创 10-python程序员,如何快速处对象

《python小白入门系列教程》专栏 • 第10篇文|曾庆林深度好文:7000字 | 15分钟阅读有对象吗?没有就new 一个今天我们要用python new 一个对象面向过程VS...

2020-09-11 08:00:00 444

原创 04python—15种字符串操作

《python小白入门系列教程》专栏 • 第02篇字符串是字符的序列 。字符串基本上就是一组单词。我几乎可以保证你在每个Python程序中都要用到字符串,所以请特别留心下面这部分的内容。下面告诉你如何在Python中使用字符串。1. 字符串定义使用单引号'你可以用单引号指示字符串,就如同'这是一句话'这样。str = '这是一句话'print( str )使用双引号" 在双引号中的字符串与单引号中的字符串的使用完全相同,...

2020-09-05 13:42:00 19030

原创 08-python中的包与模块

你已经了解了如何在你的程序中通过定义一次函数工作来重用代码。那么如果你想在你所编写的别的程序中重用一些函数的话,应该怎么办?正如你可能想象到的那样,答案是模块(Modules)编写模块有很多种方法,其中最简单的一种便是创建一个包含函数与变量、以.py为后缀的文件from..import语句import语句允许在当前运行的程序文件中使用模块中的代码。通过将函数存储在独立的文件中,可隐藏程序代码的细节,将重点放在程序的高层逻辑上。这还能让你在众多不同的程序中重用函数。...

2020-09-05 00:03:50 15892

C语言练习案例100例精解-非常有趣.pdf

C语言练习案例100例精解题目:有1、2、3、4个数字,能组成多少个互不相同且无重复数字的三位数?都是多少? 程序分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去 掉不满足条件的排列。

2020-09-12

C语言小白入门教程超越了 90%的程序员.pdf

当你决定阅读本教程时,你已然超越了 90%的程序员 作为一门古老的编程语言,C 语言已经坚挺了好几十年了,初学者从 C 语言入门,大学将 C 语言视为基础课程。不 管别人如何抨击,如何唱衰,C 语言就是屹立不倒;Java、C#、Python、PHP、Perl 等都有替代方案,它们都可以 倒下,唯独 C 语言不行。

2020-09-12

简明Python3教程.pdf

,旨在于介绍如何使用 Python 语言进行编 程的自由图书。它以教材与指南的形式为入门者介绍 Python 语言。如果你对电脑知识的了解 仅限于如何保存文本文件的话,那这本书就是为你准备的。

2020-09-12

Python基础训练100题(带答案)2.docx

Python3 100例 实例001:数字组合 实例002:“个税计算” 实例003:完全平方数 实例004:这天第几天 实例005:三数排序 实例006:斐波那契数列 实例007:copy 实例008:九九乘法表 实例009:暂停一秒输出 实例010:给人看的时间 实例011:养兔子 实例012:100到200的素数 实例013:所有水仙花数 实例014:分解质因数 实例015:分数归档 实例016:输出日期 实例017:字符串构成 实例018:复读机相加 实例019:完数 实例020:高空抛物 实例021:猴子偷桃 实例022:比赛对手 实例023:画菱形 实例024:斐波那契数列II

2020-09-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除