- 博客(6)
- 资源 (39)
- 收藏
- 关注
原创 sscanf()函数与sprintf()函数的用法
1.所在头文件:<stdio.h>2.功能记忆:scanf("%d",&n)可以理解为scanf(screen,"%d",&n);即把screen的内容以%d格式输入到n中(从左到右), printf("%d",n)可以理解为printf(screen,"%d",n);即把n以%d格式传输的screen.(从右到左), sprintf与sscanf功能类似,只不过把...
2020-03-13 16:17:52 343
原创 python网络爬虫(五):正则表达式库Re
一。正则表达式定义regular expression(EE),是用来简洁表达一组字符串的表达式,是通用的字符串表达框架。优点是简洁。主要用于字符串匹配中。二。正则表达式的使用使用前必须编译,即将符合正则表达式语法的字符串转换成正则表达式表达式特征。可以说正则表达式是某种语法格式,但在程序中必须用字符串的形式表达它,编译将记录一组字符串特征的正则表达式串转化为一组字符串。三。正则表达式的语...
2020-03-10 13:10:41 714
原创 python网络爬虫(四):信息标记与信息提取
一.信息标记的方式HTML是WWW(world wide web)上,通过预定义标签组织信息的方式,将声音,图像,视频等超文本信息嵌入到文本中。三种主要组织信息方式的对比方式说明应用领域XML最早的通用信息标记语言,可扩展性好,但繁琐Internet上信息的交互与传递JSON信息有类型,适合程序处理(js),比XML简洁移动应用云端和节点的信息通信,无注释...
2020-03-08 20:53:31 122
原创 python网络爬虫(三):Beautiful Soup库
一,安装命令行进入python.exe文件所在目录,输入pip install bs4二…Beatiful Soup库简介以HTML文件为例,它的源代码由一组尖括号构成的标签组织起来的。每一对尖括号形成一个标签,而标签之间存在上下游关系,形成一个便签数。所以Beatiful Soup库是解析,遍历,维护“标签树”的功能库。三…基本用法from bs4 import BeautifulSo...
2020-03-08 19:25:07 216
原创 python网络爬虫(二):了解知识
一.网络爬虫的尺寸类别说明爬取对象第一类小规模,数据量小,爬取量小,爬取速度不敏感,Requests库网页第二类中规模,数据规模量较大,爬取速度敏感,Scrapy库(系列)网站第三类大规模,搜索引擎,爬取速度关键,定制开发爬取全网二.网络爬虫可能产生的问题服务器骚然问题, 法律风险,隐私泄露。三.网络爬虫的限制来源限制,发布公告(Rob...
2020-03-07 23:33:31 79
原创 python网络爬虫(一):Requests库
1,.win+r进入命令行,进入python.exe目录下,输入pip install requestsRequests库的两个重要对象:r=requests.get(url)Response对象:包含爬虫返回的内容Request对象2. Reponse对象的属性:属性说明r.status_codeHTTP请求的返回状态,200表示返回成功,404失败r.t...
2020-03-07 21:33:49 124
c语言快速入门程序
2018-09-17
遗传工具箱的使用
2018-09-16
c编程规范,c代码风格,3种常见标准
2018-11-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人