![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python学习
文章平均质量分 50
雾里看花_lhh
这个作者很懒,什么都没留下…
展开
-
Python爬虫--通用框架
前言: 相信不少写过Python爬虫的小伙伴,都应该有和笔者一样的经历吧~只要确定了要爬取的目标,就开始疯狂的写代码,写脚本~经过一番努力后,爬取到目标数据;但是回过头来,却发现自己所代码复用性小,一旦网页发生了更改,我们也不得不随之更改自己的代码,而却自己的程序过于脚本化,函数化,没有采用OPP的思维方式;没有系统的框架或结构。 指导老师看了笔者的爬虫作品后,便给出了以下三点原创 2017-07-10 19:50:52 · 1375 阅读 · 0 评论 -
Python GUI编程实战--Tkinter组件详解:Entry
Radiobutton控件 Radiobutton(单选按钮):组件用于实现多选一的问题。Radiobutton 组件可以包含文本或图像,每一个按钮都可以与一个 Python 的函数或方法与之相关联,当按钮被按下时,对应的函数或方法将被自动执行。Radiobutton 组件仅能显示单一字体的文本,但文本可以跨越多行。另外,还可以为其中的个别字符加上下划线(例如用于表示键盘快捷键)。默认情况下,...原创 2018-11-05 15:45:30 · 2385 阅读 · 0 评论 -
Python GUI编程实战--Tkinter组件详解:Scale
Scale组件“Scale”小组件提供了一个图形滑块对象,允许您从特定比例中选择值。语法Here is the simple syntax to create this widget −w = Scale ( master, option, … )Parametersmaster − This represents the parent window.options − Here i...原创 2018-11-05 18:11:24 · 2435 阅读 · 0 评论 -
Python爬虫实战--WeHeartIt爬虫
前言:通过上次的小猪短租爬虫实战,我们再次熟悉的使用requests发送一个网页请求,并使用BeautifulSoup来解析页面,从中提取出我们的目标内容,并将其存入文档中。同时我们也学会了如何分析页面,并提取出关键数据。下面我们将进一步学习,并爬去小猪短租的详情页面,提取数据。Just do it~~!目标站点分析目标URL:https://weheartit.com/inspirat...原创 2018-11-15 14:15:15 · 2242 阅读 · 0 评论 -
Python爬虫实战--TripAdvisor爬虫
目标站点分析目标URL:https://www.tripadvisor.cn/Attractions-g60763-Activities-New_York_City_New_York.html#FILTERED_LIST明确内容:在图中,我们明确爬去的内容为:title,comment, cate(即绿色框中的内容),同时我们也可以看到一些干扰内容,这是我们不需要的内容,需要剔除掉。那我们...原创 2018-11-14 21:55:53 · 2847 阅读 · 0 评论 -
Python爬虫实战--58同城二手商品爬虫
呜呜~~本来说今天就把代码上传上来,可惜了,还是有点差错,今天估计赶不上啦!明天加油吧!今天我们一起来好好分析一下,看看我们该如何去爬去58二手商品。目标站点分析目标URL:http://bj.58.com/sale.shtml第一步:主页分析在主页里面,我们需要提取说有的二级分类,特别注意,绿色框的内容,它的格式和内容,如其他的内容相差较大,所以我们一开始就把它剔除,从而在一定程度上...原创 2018-11-20 22:05:17 · 2004 阅读 · 0 评论 -
Python爬虫实战--小猪短租爬虫
原创 2018-11-15 09:58:04 · 3216 阅读 · 1 评论 -
Python爬虫实战--CSDN博客爬虫(内有玄机)
前言:哈哈,继续高兴一下,通过自己的小手段,让博客访问量过万啦~怎么做到的呢?大家想一想我们近来所学的爬虫知识,养兵千日用兵一时,在前面的学习,我们已经可以很轻松的爬去一些中小型和大型网站了,现在我们一起来思考一下,我们该怎么去爬虫CSDN网站,并顺便提高一下我们博客的浏览量呢?问题分析:我们主要的目标是爬去CSDN博客,也顺带提升一下我们的浏览量,那我们应该爬去CSDN全站呢?还是只需要...原创 2018-11-21 21:00:12 · 1170 阅读 · 0 评论 -
Python爬虫实战--斗鱼直播爬虫
前言:稍微总结一下前面我们所学到的内容吧!在前面的实战学习中,我们学会如何使用requests来获取网页源码,并从中提取出我们所需要的数据, 那接下来,我们也将进一步学会使用selenium获取网页,分析网页,和提取数据。目标站点分析**目标URL:**https://weheartit.com/inspirations/beach?page=1明确内容:本次爬虫实战里,我们将要爬取斗...原创 2018-11-21 21:26:21 · 5779 阅读 · 1 评论 -
数据分析实战--认识Jupyter
什么是jupyter?Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。本质:是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。特点:在Jupyter Notebook 中,代码可以实时的生...原创 2018-11-22 09:27:28 · 5648 阅读 · 0 评论 -
阿里云服务器(ECS)实战--CentOS 7安装redis
什么是redisRedis 是一个开源的多平台数据存储软件,使用 ANSI C 编写,直接在内存使用数据集,这使得它得以实现非常高的效率。Redis 支持多种编程语言,包括 Lua, C, Java, Python, Perl, PHP 和其他很多语言。redis 的代码量很小,只有约3万行,它只做“很少”的事,但是做的很好。尽管是在内存里工作,但是数据持久化的保存还是有的,而redis 的可靠...原创 2018-11-23 20:13:03 · 1701 阅读 · 1 评论 -
Python GUI编程实战--Tkinter组件详解:ListBox
Listbox控件 列表框控件;在Listbox窗口小部件是用来显示一个字符串列表给用户Listbox 组件通常被用于显示一组文本选项,Listbox 组件跟 Checkbutton 和Radiobutton 组件类似,不过 Listbox 是以列表的形式来提供选项的(后两个是通过按钮的形式)。语法Listbox(master=None, **options) (class)master...原创 2018-11-05 14:50:35 · 17470 阅读 · 6 评论 -
Python爬虫--2017python师资培训(完)总结
开心一下,自己总算完整的看完了“2017python师资培训”视频,感谢给我视频的陈老师,但是却很抱歉,我还是没有完成你交给我的任务。还是好好地总结一下吧:这期间断断续续,本计划一个星期看完的,没想到后来却花了这么多的时间,陈老师交给我的任务,到现在也还没有完成,虽然吧视频看完了,实战内容页完成了,该学的也都学到了。可是不得不好好地反思自己,老是抱着无所谓的心态。拖延症也随之大涨,总把事情交给...原创 2018-11-05 12:07:06 · 2324 阅读 · 0 评论 -
Python GUI编程实战--Tkinter组件详解:Entry
Tkinter 文本框:EntryPython Tkinter 文本框用来让用户输入一行文本字符串。你如果需要输入多行文本,可以使用 Text 组件。你如果需要显示一行或多行文本且不允许用户修改,你可以使用 Label 组件。语法et = Entry( master, option, … )master: 按钮的父容器。options: 可选项,即该按钮的可设置的属性。这些选项可以用...原创 2018-11-01 16:01:32 · 3701 阅读 · 0 评论 -
Python爬虫--初始
什么是网络爬虫: 1.通俗理解:爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。 2.专业介绍:百度百科。 爬虫分类: 1.通用爬虫:通用爬虫是搜索引擎抓取系统(百度、谷歌、搜狗等)的重要组成部分。主要是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 2.聚焦爬虫:是面向特定需求的一种网络爬虫程序,他与通用爬虫的区别...原创 2018-09-11 17:49:36 · 1032 阅读 · 0 评论 -
Python爬虫--http详解及chrome响应URL过程
什么是http和https协议: 1.HTTP协议:全称是HyperText Transfer Protocol,中文意思是超文本传输协议,是一种发布和接收HTML页面的方法。服务器端口号是80端口。 2.HTTPS协议:是HTTP协议的加密版本,在HTTP下加入了SSL层。服务器端口号是443端口。在浏览器响应http请求的过程: 当用户在浏览器的地址栏中输入一个URL并按回车键之后,...原创 2018-09-11 17:55:36 · 1336 阅读 · 0 评论 -
Python爬虫--常用库与cookie
urllib库 urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。urlopen函数: 在Python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块下面了,以先来看下urlopen函数基本的使用:from urllib import requestresp...转载 2018-09-11 18:15:01 · 2335 阅读 · 0 评论 -
Python爬虫--认识Fiddler
什么是Fiddler?Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的“进出”Fiddler的数据(指cookie,html,js,css等文件)。 Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http通讯还提供了一个用户友好的格式。同类的工具有: httpwatch, firebug, wiresh...原创 2018-10-29 16:24:27 · 1344 阅读 · 0 评论 -
Python爬虫--正则表达式
什么是正则表达式?正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。概念正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻...原创 2018-10-29 16:44:29 · 982 阅读 · 0 评论 -
Pycharm个性化设置和常用快捷键
设置Pycharm为暗色皮肤主题步骤:File -> Settings -> Appearance&Behavior -> Appearance -> Theme -> 选择“Darcula”,size选择“16”(建议字体大小为16~24),如下图所示:设置编辑器“颜色、字号、字体”步骤:File -> Settings -&原创 2018-10-26 21:08:13 · 1520 阅读 · 0 评论 -
Python GUI编程实战--Tkinter初识
什么是Tkinter?Tkinter模块(“Tk 接口”)是Python的标准Tk GUI工具包的接口.Tk和Tkinter可以在大多数的Unix平台下使用,同样可以应用在Windows和Macintosh系统里.Tk8.0的后续版本可以实现本地窗口风格,并良好地运行在绝大多数平台中.Tkinter编程Tkinter 是 Python 的标准 GUI 库。Python 使用 Tkinter ...原创 2018-11-01 09:33:26 · 1655 阅读 · 0 评论 -
Python GUI编程实战--认识Tkinter组件
Tkinter 组件Tkinter的提供各种控件,如按钮,标签和文本框,一个GUI应用程序中使用。这些控件通常被称为控件或者部件。目前有15种Tkinter的部件。如下图:标准属性标准属性也就是所有控件的共同属性,如大小,字体和颜色等等。几何管理Tkinter控件有特定的几何状态管理方法,管理整个控件区域组织,一下是Tkinter公开的几何管理类:包、网格、位置以上内容,均来...原创 2018-11-01 09:52:20 · 1170 阅读 · 0 评论 -
Python GUI编程实战--Tkinter组件详解:Label
Label 控件在 Tkinter 中, Label 控件用以显示文字和图片. Label 通常被用来展示信息, 而非与用户交互. (注: Label 也可以绑定点击等事件, 只是通常不这么用).import tkinter as tk# 创建窗口对象root = tk.Tk()#创建标签组件并绑定父组件rootlabel = tk.Label(root, text="Hello, ...原创 2018-11-01 11:34:18 · 3823 阅读 · 1 评论 -
Python GUI编程实战--Tkinter组件详解:Button
Button控件Tkinter 按钮组件用于在 Python 应用程序中添加按钮,按钮上可以放上文本或图像,按钮可用于监听用户行为,能够与一个 Python 函数关联,当按钮被按下时,自动调用该函数。语法bt = Button ( master, option=value, … )master: 按钮的父容器。options: 可选项,即该按钮的可设置的属性。这些选项可以用键 = 值的形...原创 2018-11-01 15:04:18 · 5939 阅读 · 2 评论 -
阿里云服务器(ECS)实战--CentOS 7 安装Anaconda
前言:双十一的时候买了台阿里云(ECS),采用Centos7系统,40G的高效云盘。这段时间一直就把放在那里,差点账号和密码都忘了,当然,这是不可能的,经过几天的构思,我决定,将我本地使用的Ubuntu服务器,转移到阿里云上,以此避免,我不在本地局域网时,连接不上服务器的尴尬局面。由于之前一直用的是Ubuntu,没有接触过Centos,所以做起来,有一定的难度,好在都是Linux的系统,问题不到...原创 2018-11-23 15:14:27 · 7431 阅读 · 0 评论