数据可视化-4

目录

css

css构造

div标记

span标记

JavaScript

用途

语法

爬虫

反爬虫

反反爬虫

python爬虫相关库

爬虫的保存

网页前端基础


css

css构造

继承,就是大的套小的,继承大的属性。

1.将CSS样式定义在html标记的style属性里,多个属性分号分割(困困困😴😴😴,睡了20分钟,继续听课)

2.内部定义样式表

嵌入,把别人的复制一份放自己口袋里;链接,一个链接到别人的东西。

<style text="text/css">
<!--
.p1{font-size:18px; color:blue;}
-->
</style>

选择符:格式用在哪些元素上

div标记

span标记

JavaScript

用途

Javascript解释工具就是浏览器,交互窗口

语法

语句,函数,对象(方法属性)

表单(form):文本框,提交框

爬虫

认识了网页信息,爬虫的概念:自动下载 网页的计算机程序或自动化脚本。 种类:1.全网爬虫:百度大型web;2.聚集爬虫:只爬相关的;3.增量式爬虫:已下载的网页采取增量式更新;4.深层网络爬虫

网站会写协议,告诉你这个网站你能获取什么信息。

反爬虫

  • user-agent
  • 访问频度
  • 验证码
  • 变换网页结构
  • 账号权限反爬(例如微博查看评论需要登录账号)

反反爬虫

模拟user-agent

调节访问频度

python爬虫相关库

  • urllib
  • requests:获取网页
  • urllib 3

框架:scrapy

html/xml解析器

  • lxml(c语言编写,需要c语言环境visual c++)
  • beautifulsoup4

爬虫的保存

csv(最多兼容)、excel、文本文件、mysql

网页前端基础

网络编程socket库

 8080端口监听,三次握手,互联网协议http子协议网页www

http请求

python相关方法:get方法:只能读取

请求与响应:1.连接web服务器 2.发送http请求:报文 3.服务器接收请求并返回http响应 4.释放连接tcp连接 5.

http状态码:200 OK ;400 bad request;404 not found

http头部信息:F12查看

cookie机制:记录用户状态,合法且未过期

cookie存储:内存式(浏览器关闭后会消失),硬盘式存储。

说了这么多概念,爬一个吧。

import requests

# 爬取一般网站
url = 'http://www.tipdm.com/'#网站名
# 生成get请求
rqg = requests.get(url)  # rqg为爬取的网页对象
print("结果类型:", type(rqg))  # 查看结果类型
print("状态码:", rqg.status_code)  # 查看状态码
print("编码:", rqg.encoding)  # 查看编码
print("响应头:", rqg.headers)  # 查看响应头
print("网页内容:", rqg.text)  # 查看网页内容

 练习

1、JavaScript能否单独运行

JavaScript程序本身不能独立存在,它是依附于某个HTML页面,在浏览器端运行的

2、JavaScript一般位于什么位置

答:

 (1)位于HEAD部分的脚本

  • 如果把脚本放置到head部分,在页面载入的时候,就同时载入了代码。
  • 通常这个区域的JavaScript代码是为body区域程序代码所调用的事件处理函数。
  • 举例如下:
<head>
   <script type="text/javascript">
       function show(){
       	alert("欢迎进入JavaScript学习之旅!");
       }
  </script>
</head>

(2)位于 BODY部分的脚本

  • 当你把脚本放置于 body 部分后,在页面载入时不属于某个函数的脚本就会被执行,执行后的输出就成为页面的内容。  
(2.1) 直接位于事件处理部分的代码中 ,举例:
<body onload='alert("欢迎进入JavaScript学习之旅!");'>
(2.2) 位于网页之外的单独脚本文件,举例:
<script src="xxx.js"></script>

3、JavaScript用来实现编程的基本结构有哪些

答:有顺序、分支和循环三种基本结构。

1、JavaScript是一款什么样的编程软件

JavaScript是一款嵌入到html页面内的解释型程序设计语言。

2、JavaScript的运行环境

Javascript运行环境有两种,一个是浏览器运行环境,另一个则是Node.js运行环境

3、JavaScript的基本功能

可以将文本动态的放入 HTML 页面。类似于这样的一段 JavaScript 声明可以将一段可变的文本放入 HTML 页面: document.write ("<h1>"+name+"</h1>")
可以对事件做出响应。例如页面载入完成或者当用户单击某个 HTML 元素时,调用指定的 JavaScript 程序。
可以读写 HTML 元素。 JavaScript 程序可以读取及改变当前 HTML 页面内某个元素的内容,如文本框中的输入内容。
可被用来验证用户输入的数据。在数据被提交到服务器之前, JavaScript 可被用来验证这些数据。
可被用来检测访问者的浏览器,并根据所检测到的浏览器,为这个浏览器载入相应的页面。
可被用来创建 cookies ,用来存储和取回位于访问者的计算机中的信息。
可利用 Ajax 技术来完成和服务器的直接通信,无刷新的修改当前 HTML 页面内容。

4、JavaScript的网页标记什么

网页标记是:

直接引用:<script type="text/javascript"></script>

间接引用:<script src=“url” type="text/javascript"></script>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cole~~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值