2017年04月_禾如月

原创 3、信息组织与提取方法

信息的标记：形成信息组织结构，增加信息维度有利于通讯，存储和展示标记的结构和信息一样有着重要的价值有利于程序理解与处理，应用HTML的信息标记： html是www(World Wide Web)的信息组织方式，将声音，图像，视频等超文本信息嵌入到文本中 html是通过预定义的标签形式将不同类型信息组织起来的1、信息标记的三种形式：XML、JSON、Y

2017-04-22 21:43:56 694

原创 2、Beautiful Soup库（bs4）入门

该库能够解析HTML和XML使用Beautiful Soup库: frombs4importBeautifulSoup soup =BeautifulSoup('<p>data</p>', 'html.parser') #html解析器：html.parser ，前一个参数则是要解析的内容小测：from b...

2017-04-13 14:47:50 38693 4

原创三、Python2.x 数据的获取与表示

3.1本地数据获取注意，打开文件要记得关闭文件文件的打开 file_obj = open(filename,mode = 'r',buffering = -1) filename：强制参数，必须要有的参数 mode：为可选参数，模式参数，默认为'r'也就是读；'w'为写 buffering：可选参数，默认为-1, 0代表不缓冲，1或大于1的

2017-04-13 13:32:17 901

原创二、Python2.x 基本内容2

2.1 条件结构if语句 if 条件表达式: #注意有冒号代码块 #注意缩进 else: #与if对齐代码块 elif语句 if 条件: 代码块 elif 条件:

2017-04-13 13:24:57 370

原创一、Python 2.x 基础内容1

1.1：Python的简介1.2：Python的第一个程序“Hello world”Python输出：print语句：print 'Hello world'输入：raw_input()Python风格：注释：以#开始续行：\一行多语句：分号隔开（一般不用）缩进：1——缩进表示语句块的开始；2——相同缩进表示同级别语句块；3——减少缩进表示语句块的退出1.3：Python

2017-04-13 13:20:29 456

原创 1、网络爬虫之规则之requests库入门

导学：掌握定向网络数据爬取和网页解析的基本能力一、 Requests库入门公认的爬取网页最好的第三方库，简单和简洁import requestsr = requests.get('http://www.baidu.com')num = r.status_code #状态码print(num)r.encoding = 'utf-8'print(r.tex

2017-04-13 12:19:35 2206

禾如月的博客

原创 3、信息组织与提取方法

原创 2、Beautiful Soup库（bs4）入门

原创三、Python2.x 数据的获取与表示

原创二、Python2.x 基本内容2

原创一、Python 2.x 基础内容1

原创 1、网络爬虫之规则之requests库入门

空空如也

空空如也

原创 3、信息组织与提取方法

原创 2、Beautiful Soup库（bs4）入门

原创 三、Python2.x 数据的获取与表示

原创 二、Python2.x 基本内容2

原创 一、Python 2.x 基础内容1

原创 1、网络爬虫之规则之requests库入门

空空如也

空空如也

原创三、Python2.x 数据的获取与表示

原创二、Python2.x 基本内容2

原创一、Python 2.x 基础内容1