自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 3、信息组织与提取方法

信息的标记:形成信息组织结构,增加信息维度有利于通讯,存储和展示标记的结构和信息一样有着重要的价值有利于程序理解与处理,应用HTML的信息标记:     html是www(World Wide Web)的信息组织方式,将声音,图像,视频等超文本信息嵌入到文本中     html是通过预定义的标签形式将不同类型信息组织起来的1、信息标记的三种形式:XML、JSON、Y

2017-04-22 21:43:56 674

原创 2、Beautiful Soup库(bs4)入门

该库能够解析HTML和XML使用Beautiful Soup库: frombs4importBeautifulSoup soup =BeautifulSoup('<p>data</p>', 'html.parser') #html解析器:html.parser ,前一个参数则是要解析的内容小测:from b...

2017-04-13 14:47:50 38463 4

原创 三、Python2.x 数据的获取与表示

3.1本地数据获取注意,打开文件要记得关闭文件文件的打开     file_obj = open(filename,mode = 'r',buffering = -1)     filename:强制参数,必须要有的参数     mode:为可选参数,模式参数,默认为'r'也就是读;'w'为写     buffering: 可选参数,默认为-1, 0代表不缓冲,1或大于1的

2017-04-13 13:32:17 859

原创 二、Python2.x 基本内容2

2.1 条件结构if语句     if 条件表达式:         #注意有冒号          代码块              #注意缩进     else:                       #与if对齐          代码块    elif语句     if 条件:          代码块     elif 条件:   

2017-04-13 13:24:57 353

原创 一、Python 2.x 基础内容1

1.1:Python的简介1.2:Python的第一个程序“Hello world”Python输出:print语句:print 'Hello world'输入:raw_input()Python风格:注释:以#开始续行:\一行多语句:分号隔开(一般不用)缩进:1——缩进表示语句块的开始;2——相同缩进表示同级别语句块;3——减少缩进表示语句块的退出1.3:Python

2017-04-13 13:20:29 434

原创 1、网络爬虫之规则之requests库入门

导学:掌握定向网络数据爬取和网页解析的基本能力一、 Requests库入门公认的爬取网页最好的第三方库,简单和简洁import requestsr = requests.get('http://www.baidu.com')num = r.status_code    #状态码print(num)r.encoding = 'utf-8'print(r.tex

2017-04-13 12:19:35 2167

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除