- 博客(5)
- 资源 (3)
- 收藏
- 关注
原创 python库——BeautifulSoup
beautifulsoup可以将html内容解析为soup文档。将不具备良好html格式的网页转化为完整的html文档。究竟什么是html的完整格式?那么在此之前先介绍一下html。HTMLHTML是一种超文本标记语言,并不是编程语言。它常与CSS、JavaScript一起用于设计网页、网页应用程序以及移动应用程序的用户界面。标签标签是html的重要成分,通常成对的出现,两个标签之间为...
2018-10-30 17:14:30 383
原创 python爬虫爬取淘宝失败原因分析
正则表达式data = re.findall(‘g_page_config = (.*?)g_srp_loadCss’, html,re.S)[0] 报错out of range去掉[0]后输出,只输出了一个空列表,发现其实并没有抓取到网页信息,空列表里取首元素就出现了out of range的错误。输出html后发现代码和网页源代码不相同,没有应有的商品信息。大概有两种可能淘宝页面异步...
2018-10-20 15:50:03 15294 3
原创 TCP/IP
TCP/IP协议为传输控制协议/因特网互联协议,又名网络通讯协议。是Internet最基本的协议、Internet国际互联网络的基础,由网络层的IP协议和传输层的TCP协议组成。TCP/IP不是一个协议,而是一个协议族的统称。里面包括了IP协议,IMCP协议,TCP协议,以及http、ftp、pop3协议等。用于和其他的计算机终端做自由的交流。协议采用了4层的层级结构,每一层都呼叫它的下一层所...
2018-10-17 13:12:51 184
原创 github及git的基本使用
github的全英界面导致英语差的人使用起来很不方便(我)。文章主要为了防止自己忘记某些功能。点击创建仓库后需要填写 Repository name(仓库名)Description (optional)(项目描述)勾选最下方可生成一个readme文档。可以在新建文件中建立任意后缀的文件(后缀必须加),并在preview中查看。为方便后续修改和查看,在下面表单中填写每次提交的目的...
2018-10-14 22:37:43 147
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人