- 博客(6)
- 收藏
- 关注
原创 3、信息组织与提取方法
信息的标记:形成信息组织结构,增加信息维度有利于通讯,存储和展示标记的结构和信息一样有着重要的价值有利于程序理解与处理,应用HTML的信息标记: html是www(World Wide Web)的信息组织方式,将声音,图像,视频等超文本信息嵌入到文本中 html是通过预定义的标签形式将不同类型信息组织起来的1、信息标记的三种形式:XML、JSON、Y
2017-04-22 21:43:56 694
原创 2、Beautiful Soup库(bs4)入门
该库能够解析HTML和XML使用Beautiful Soup库: frombs4importBeautifulSoup soup =BeautifulSoup('<p>data</p>', 'html.parser') #html解析器:html.parser ,前一个参数则是要解析的内容小测:from b...
2017-04-13 14:47:50 38693 4
原创 三、Python2.x 数据的获取与表示
3.1本地数据获取注意,打开文件要记得关闭文件文件的打开 file_obj = open(filename,mode = 'r',buffering = -1) filename:强制参数,必须要有的参数 mode:为可选参数,模式参数,默认为'r'也就是读;'w'为写 buffering: 可选参数,默认为-1, 0代表不缓冲,1或大于1的
2017-04-13 13:32:17 901
原创 二、Python2.x 基本内容2
2.1 条件结构if语句 if 条件表达式: #注意有冒号 代码块 #注意缩进 else: #与if对齐 代码块 elif语句 if 条件: 代码块 elif 条件:
2017-04-13 13:24:57 370
原创 一、Python 2.x 基础内容1
1.1:Python的简介1.2:Python的第一个程序“Hello world”Python输出:print语句:print 'Hello world'输入:raw_input()Python风格:注释:以#开始续行:\一行多语句:分号隔开(一般不用)缩进:1——缩进表示语句块的开始;2——相同缩进表示同级别语句块;3——减少缩进表示语句块的退出1.3:Python
2017-04-13 13:20:29 456
原创 1、网络爬虫之规则之requests库入门
导学:掌握定向网络数据爬取和网页解析的基本能力一、 Requests库入门公认的爬取网页最好的第三方库,简单和简洁import requestsr = requests.get('http://www.baidu.com')num = r.status_code #状态码print(num)r.encoding = 'utf-8'print(r.tex
2017-04-13 12:19:35 2206
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人