- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 学习python编程之正则表达式(一)
个人觉得,正则表达式是最基本的东西,因为,正则表达式很具有通用性,无论何种语言,或者系统都有正则表达式的影子,并且各种文件操作,已经网页的数据获取,都可以用到正则表达式,所以我决定第一章开始介绍正则表达式.什么是是正则表达式: 简单的说,正则表达式就是一些有字符和图书符号组成的字符串,它描述了模式 或者表示的多种字符.或者换句话说就是能按照某种模式匹配(matching)一系列有相似特征的字...
2018-03-14 00:41:54 312 2
原创 (二)python爬虫urllib库的基本使用及了解第一小节
urllib库是python官方提供的一个http请求库,在python3中的urllib库其实是把python2里的urllib库和urllib2整合在一起的.我们这里主要说的就是python3首先开发环境:系统: windows10开发语言: Python3IDE: pytharm东西都准备好了就进入我们今天的主题.如何使用urllib快速的请求一个网站并且获得网站的源码,import url...
2018-03-08 19:03:30 10423
原创 用Scrapy简单爬取jobbele所有技术文章。
用国内镜像安装,安装scrapy,pip install -i http://pypi.douban.com/simple scrapypip install -i http://pypi.douban.com/simple pypiwin32安装以上2个库就能正常运行scrapy了环境:win10-64python3.6开发工具:pycharm首先分析目标网站:http://blog.jobbo...
2018-02-25 14:13:56 312
原创 (python爬虫项目)某婚恋网的简单数据爬取
爬取项目目标网站: www.7rdao.com想要获得的数据: 获取想要省份用户基本信息。 (你想要哪个省就爬哪个省份咯)既然目标明确,工具齐备. 话不多说,直接打开网页分析.网页分析: 这是我们想获取的信息.先提交一次看有什么反应!完整的URL: http://www.7rdao.com/user/search.aspx?sex=0&ddl_StartAg...
2018-02-11 14:15:42 5884 4
原创 (一)python爬虫的简单理解和相关库
作为自己的学习梳理,后期或许会讲一些案例什么的.以前不喜欢写什么博客什么的,想的自己会的东西别人大概都是会的,反正这东西网上一搜一大堆!现在想想,其实自己会些什么东西自己还是只有一些笼统的概念,会做什么的.都没有一个清晰的认识,所以今天就想着梳理一下自己到底会一些什么样的东西!爬虫的基本原理1什么是爬虫:简单 一句话就是: (1)"请求" 网站,并且 (2) "提取
2018-01-27 18:51:02 316
原创 接触linux的第一天 。丢掉WIN10,(小白Aking的日记)
翻来覆去的想了很久,自己的学习方式什么是不是应该有一些总结什么的,不然今天学了,明天忘了,想要复习什么都找不到地方去,就想着,或者博客,对我来说也就是日常行为的分析吧。希望可以通过他来三省自身。 今天搞了10几个小时,终于学会了一件会的 人只用几分钟 就能搞好的事情(U盘装LUNIX系统)。在这里Aking表示很难过,可能是理解能力的问题吧,百度上的经验看不懂。...
2017-10-05 04:36:54 5875 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人