自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 pyquery 的一些用法

pyquery 相关用法pyspider 的内容选择器默认已经实例化一个pyquery对象,可以直接使用pyquery的api来获取自己需要的内容。在pyquery中使用response.doc就可以直接实例化一个pyquery对象,就可以直接在里面使用pyquery方法了,html()和text()获取相应的HTML块或文本块,根据HTML标签来获取元素,例:html:'<div>&...

2018-03-14 13:03:29 464

原创 用爬虫做一个翻译“客户端”

前提前些时,要考专业英语了,看见室友一边对着百度翻译,一边复习单词,心生一想法,页面明显是动态加载出来的,我能不能抓到它返回的东西,然后提取出来,这样可以弄成以个客户端,可以试一试。观察打开百度翻译的页面,调用浏览器的开发者模式,输入一个“你好”,然后刷新,观察请求在哪里,其实挺简单的,一下子就可以看到,请求,如下图![请求观察](http://img.blog.csdn.net/2017122

2017-12-28 19:27:30 1473

原创 python 断言

在python中,断言是个很有趣的用法,今天总结一下: 在官方文档中:https://docs.python.org/3/reference/simple_stmts.html#assert ;含义所谓断言,就是一个确信的事情,在某个程序片段运行中,我确信某个条件会一直为真,那么我就可以用断言来“判断”他,一旦它不为真,就会报错。用法例如下面一个代码片:s = 'foobar'assert

2017-12-18 15:04:14 308

原创 字符编码问题总结(来源网上)

字符编码 我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的 是还有一个编码问题。 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数 字才能处理。最早的计算机在设计时采用 8 个比特(bit)作为一个字节 (byte),所以,一个字节能表示的最大的整数就是 255(二进制 11111111=十进制 255),如果要表示更大的整数,就必须用更多的字 节。比如

2017-12-14 22:30:23 232

原创 beautifulsoup 学习

今天发现一个有意思的、值得注意的地方,先记录下来,第五行声明了一个BeautifulSoup对象,res选取了他的ol的内容,此时的res是个list,当我取出list 的值后,发现他又是一’tag‘对象,开始的soup 也是一个tag对象,也就是说,list是tag对象的集合,所以我开始,企图再次声明一个BeautifulSoup对象是会报错了,取出的contents bong不是成为了一个str

2017-11-29 21:51:07 285

原创 正则表达式

基础匹配规则\w 匹配字母数字及下划线\W 匹配非字母数字下划线\s 匹配任意空白字符,等价于 [\t\n\r\f].\S 匹配任意非空字符\d 匹配任意数字,等价于 [0-9]\D 匹配任意非数字\A 匹配字符串开始\Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串\z 匹配字符串结束\G 匹配最后匹配完成的位置\n 匹配一个换行符\t

2017-11-28 20:45:22 285

原创 py 爬虫 requests库 用法(一)//源码

In [4]: print(“hello”) hello In [3]: import requests import urllib In [7]: print(1+2) 3 测试¶In [17]: import requests res=requests.get(“http://httpbin.org/get“) print(res.text) { “args”:

2017-11-27 21:24:42 396

原创 jupyter 初步

在anaconda中,pip3可以直接安装;命令行直接打开;命令:jupyter notebook; 关于jupyter 的一些介绍(来源网上) Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码

2017-11-27 19:30:18 280

原创 python爬虫urllib库学习(源码)

####urllib库的使用import urllib.requestimport http.cookiejarfrom urllib.parse import urlparse# 复杂请求构造request对象;# respons = urllib.request.Request("https://www.python.org")# response=urllib.request.

2017-11-20 17:59:35 1210

原创 个人代码记录-学生社团管理

此文章记录代码--学生社团管理系统源码。#include "stdio.h"#include "stdlib.h"#include "string.h"#include "conio.h"void jiemian();struct student{char name[50];char sex[5];int age;char num[100

2017-05-01 22:40:02 1479 1

原创 first blog

This is my first blog.

2016-09-28 22:47:20 181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除