User-Agent html(将数据以网页形式展示) 文件夹 join() 打包

最新推荐文章于 2024-07-24 17:16:26 发布

她最爱橘了

最新推荐文章于 2024-07-24 17:16:26 发布

阅读量901

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41664526/article/details/79405069

版权

一: 使用python的第三方包来获取User-Agent

1. 在cmd命令行中输入: pip install fake_useragent

2. 在代码中引用该包:

from fake_useragent import UserAgent

3. 使用该包:

ua = UserAgent()

'User_Agent': ua.random

二: 从网页上爬取的数据以简单网页形式展示

1. 首先爬虫写好,能在控制台上输出你想要的数据

2. 创建一个HTML file 文件

3. 为了方便,与使网页美观,这时候就要使用HTML的bootstrap工具包

将这个包放在所写代码的文件目录中

4. 打开HTML file

在<title>输入网页名称</title>

输入<link rel="stylesheet"(固定的) href="bootstrap-3.3.7-dist/css/bootstrap.css"(使用bootstrap的.css文件, 代码会自动提示)>

然后再<body></body>中写入源码

<div class = 'container'>

<table class="table(表)(这里创建表格) table-bordered table-hover table-responsive(这三个都是修饰这个表格,比如添加斑马线与阴影等)">

<tr>(表示行)

<td>content</td>(表示列)

<td>content</td>

<td>content</td>

<tr>

</table>

</div>

关于具体的bootstrap可以查看点击打开链接

5. 在爬虫代码中使用这些HTML源码

一般在获取数据之前写进

with open('movie_info.html'(自己指定), 'w', encoding='utf-8') as f:

这里的HTML源码一般写的是标题类的

其余的HTML在获取代码中写入

如 for遍历内容的时候

""" % (数据, 数据,数据...))

注意: 在将HTML源码写入代码的时候一定要注意HTML源码的完整性有头有尾标签一一对应

三: 判断文件夹是个存在

import os 这是操作文件的包 python自带

import shutil 这是文件操作的更高级模块

if (not) os.path.exists('文件夹名称'):

如果文件夹存在(不存在) 则:

os.makedirs('文件夹名称')

创建这个文件夹

shutil.rmtree('文件夹名称', ignore_errors=True)

删除这个文件夹无论里面还有多少东西

四: 将所爬取的数据写入表格当中

1. 首先爬虫写好,能在控制台上输出你想要的数据

2.

with open('文件名称', 'a', encoding='gbl18030'(这是写入表格防止乱码的编码格式) as f:

f.write(job_naem+','+data_time+','+money+'\n')

注意: 这里的','逗号必写就好像是在表格当中能空开一样!

当写入的数据比较多的时候可以:

with open('文件名称', 'a', encoding='gbl18030')

job_list = [job_name,data_time,money,'\n']

f.write(','.join(job_list))

这里使用join()

作用: join()函数主要用来拼接字符串

语法： 'sep'.join(seq)

参数说明

sep：分隔符。可以为空

seq：要连接的元素序列、字符串、元组、字典

上面的语法即：以sep作为分隔符，将seq所有的元素合并成一个新的字符串

返回值：返回一个以分隔符sep连接各个元素后生成的字符串

五: 打包py文件用于让客户直接运行查看效果

1. 在cmd中输入 pip install pyinstaller

2. 在所在py文件夹内按住shift键,接着在空白区域点击鼠标右键选择在此处命令行打开

3. 在新打开的命令行中输入 pyinstaller -F py文件名称.py(这里的.py可以直接按tab键系统会自动补充出来)

4. 运行结束后会出现一个disr文件夹.在这个文件夹内就可以找到打包好的py文件点击就可以直接运行.

注意: 在打包过程中最好不要出现任何中文,防止打包过程中出现不可预估的错误.

她最爱橘了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

她最爱橘了 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。