URL概述
前言
因特网上的可用资源可以用简单字符串来表示,该文档就是描述了这种字符串的语法和语义。而这些字符串则被称为:“统一资源定位器”(URL)。
(源于百度百科)其他的百科上面有的就不赘述了,本文有一些摘录和自己的总结,为了方便以后自己查看学习。
一、URL是什么?
在WWW上,每一信息资源都有统一的且在网上唯一的地址,该地址就叫URL(Uniform Resource Locator,统一资源定位器),它是WWW的统一资源定位标志,就是指网络地址。
- URL组成:资源类型、存放资源的主机域名、资源文件名。
protocol :// hostname[:port] / path / [;parameters][?query]#fragment
https://cn.bing.com/search?q=1&qs=n&form=QBRE&sp=-1&pq=1&sc=7-1&sk=&cvid=D5C2B73C351841C8B1C451841AEBFF33
protocol:协议,最常用的是HTTP协议
http通过HTTP访问该资源。格式http://
https通过安全的HTTPS访问资源。格式https://
http和https的异同
hostname:主机名,是指存放资源的服务器的域名系统(DNS) 主机名或 IP 地址。
port:端口号,整数,可选,省略时使用方案的默认端口,各种传输协议都有默认的端口号,如http的默认端口为80。
path:路径,由零或多个“/”符号隔开的字符串,一般用来表示主机上的一个目录或文件地址。
parameters:参数。
query:查询,可选,用于给动态网页(如使用CGI、ISAPI、PHP/JSP/ASP/ASP.NET等技术制作的网页)传递参数,可有多个参数,用“&”符号隔开,每个参数的名和值用“=”符号隔开。
二、使用步骤
1.引入库
代码如下(示例):
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore') import ssl ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv( 'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv') print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。