python中open函数的encoding参数utf-8未生效解决办法

解决网页抓取乱码问题
本文介绍了一种常见的网页抓取过程中遇到的字符编码问题及解决方案。通过使用Python的requests库获取网页内容,并调整文件写入时的编码格式从utf-8到UTF-8,成功解决了生成文件出现乱码的问题。

解决办法

import requests
url='https://www.baidu.com/s?wd=ip'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'}
page_text=requests.get(url=url,headers=headers).text

with open('ip.html','w',encoding='utf-8') as fp:
    fp.write(page_text)

但是生成的ip.html却产生了乱码
讲enconding中改成如下

with open('ip.html','w',encoding='UTF-8') as fp:
    fp.write(page_text)

讲utf-8变成UTF-8

### A*算法中的Open表和Close表 #### Open表的作用及实现 在A*算法中,Open表用于存储待评估节点列表。每当遇到一个新的节点或需要重新考虑已知节点时,该节点会被加入到Open表中。对于每个节点,计算其代价函数\( F(n)=G(n)+H(n) \),其中: - \( G(n) \)表示从起始节点到达当前节点的实际成本; - \( H(n) \)则是估计的剩余距离。 通过比较这些值来决定下一个要探索的最佳候选者[^2]。 为了高效管理这个优先级队列,通常采用二叉堆数据结构来实现实现Open表的功能,在这种情况下插入新元素的时间复杂度为O(log n)。 ```cpp // C++代码片段展示如何初始化并操作open list作为binary heap struct Node { int f, g, h; }; std::vector<Node> openList; // 使用STL vector模拟heap行为 void push(Node node){ openList.push_back(node); std::push_heap(openList.begin(), openList.end()); } Node pop(){ std::pop_heap(openList.begin(), openList.end()); Node top = openList.back(); openList.pop_back(); return top; } ``` #### Close表的作用及实现 另一方面,Close表则用来记录已经处理过的节点集合。当某个节点被选作下一步扩展对象之后就会立即移入Closed List之中;这有助于防止重复访问相同位置造成不必要的运算浪费,并确保每条可能路径只被考察一次[^1]。 一般来讲,可以通过简单的哈希表或者布尔数组形式来进行标记,以快速查找特定坐标是否已经被关闭过。 ```cpp // 假设地图大小固定为MAX_SIZE x MAX_SIZE bool closed[MAX_SIZE][MAX_SIZE]; if (!closed[x][y]){ // 如果(x,y)不在close table里,则继续处理... closed[x][y]=true;// 将当前位置设置为已访问状态 }else{ continue; // 跳过已被处理的位置 } ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值