目录
css
css构造
继承,就是大的套小的,继承大的属性。
1.将CSS样式定义在html标记的style属性里,多个属性分号分割(困困困😴😴😴,睡了20分钟,继续听课)
2.内部定义样式表
嵌入,把别人的复制一份放自己口袋里;链接,一个链接到别人的东西。
<style text="text/css">
<!--
.p1{font-size:18px; color:blue;}
-->
</style>
选择符:格式用在哪些元素上
div标记
span标记
JavaScript
用途
Javascript解释工具就是浏览器,交互窗口
语法
语句,函数,对象(方法属性)
表单(form):文本框,提交框
爬虫
认识了网页信息,爬虫的概念:自动下载 网页的计算机程序或自动化脚本。 种类:1.全网爬虫:百度大型web;2.聚集爬虫:只爬相关的;3.增量式爬虫:已下载的网页采取增量式更新;4.深层网络爬虫
网站会写协议,告诉你这个网站你能获取什么信息。
反爬虫
- user-agent
- 访问频度
- 验证码
- 变换网页结构
- 账号权限反爬(例如微博查看评论需要登录账号)
反反爬虫
模拟user-agent
调节访问频度
python爬虫相关库
- urllib
- requests:获取网页
- urllib 3
框架:scrapy
html/xml解析器
- lxml(c语言编写,需要c语言环境visual c++)
- beautifulsoup4
爬虫的保存
csv(最多兼容)、excel、文本文件、mysql
网页前端基础
网络编程socket库
8080端口监听,三次握手,互联网协议http子协议网页www
http请求
python相关方法:get方法:只能读取
请求与响应:1.连接web服务器 2.发送http请求:报文 3.服务器接收请求并返回http响应 4.释放连接tcp连接 5.
http状态码:200 OK ;400 bad request;404 not found
http头部信息:F12查看
cookie机制:记录用户状态,合法且未过期
cookie存储:内存式(浏览器关闭后会消失),硬盘式存储。
说了这么多概念,爬一个吧。
import requests
# 爬取一般网站
url = 'http://www.tipdm.com/'#网站名
# 生成get请求
rqg = requests.get(url) # rqg为爬取的网页对象
print("结果类型:", type(rqg)) # 查看结果类型
print("状态码:", rqg.status_code) # 查看状态码
print("编码:", rqg.encoding) # 查看编码
print("响应头:", rqg.headers) # 查看响应头
print("网页内容:", rqg.text) # 查看网页内容
练习
1、JavaScript能否单独运行
JavaScript程序本身不能独立存在,它是依附于某个HTML页面,在浏览器端运行的
2、JavaScript一般位于什么位置
答:
(1)位于HEAD部分的脚本
- 如果把脚本放置到head部分,在页面载入的时候,就同时载入了代码。
- 通常这个区域的JavaScript代码是为body区域程序代码所调用的事件处理函数。
- 举例如下:
<head>
<script type="text/javascript">
function show(){
alert("欢迎进入JavaScript学习之旅!");
}
</script>
</head>
(2)位于 BODY部分的脚本
- 当你把脚本放置于 body 部分后,在页面载入时不属于某个函数的脚本就会被执行,执行后的输出就成为页面的内容。
<body onload='alert("欢迎进入JavaScript学习之旅!");'>
<script src="xxx.js"></script>
3、JavaScript用来实现编程的基本结构有哪些
答:有顺序、分支和循环三种基本结构。
1、JavaScript是一款什么样的编程软件
JavaScript是一款嵌入到html页面内的解释型程序设计语言。
2、JavaScript的运行环境
Javascript运行环境有两种,一个是浏览器运行环境,另一个则是Node.js运行环境
3、JavaScript的基本功能
4、JavaScript的网页标记什么
网页标记是:
直接引用:<script type="text/javascript"></script>
间接引用:<script src=“url” type="text/javascript"></script>