数据加载，存储与文件格式

蜡笔新小

于 2021-07-26 21:16:01 发布

阅读量72

点赞数

分类专栏：数据处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52945258/article/details/119118454

版权

数据处理专栏收录该内容

11 篇文章 2 订阅

订阅专栏

读取函数

主要函数有两个，如下所示：

read_csv：默认分隔符为逗号

read_table：默认分隔符为制表符（‘\t’）

一些函数：

skiprows=[0,2,3]:跳过文件的第一行，第三行和第四行

sentinels={'列名':['foo','NA'],'列名':['two']}

pd.read_csv('',na_values=sentinels)

Web信息收集

from urllib.request import urlopen, Request
from lxml.html import parse
url = 'https://movie.douban.com/top250?start=%s&filter='
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'}
ret = Request(url, headers=headers)
parsed=parse(urlopen(ret))
doc=parsed.getroot()
links=doc.findall('.//a')
print(links[15:20])

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'}

获取方式：在浏览器中输入about:version

读取Excel文件

xls_file=pd.ExcelFile(data.xls)
table=xls_file.parse('Sheet1')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据加载，存储与文件格式

读取函数主要函数有两个，如下所示：read_csv：默认分隔符为逗号read_table：默认分隔符为制表符（‘\t’）一些
复制链接

扫一扫

专栏目录

蜡笔新小 CSDN认证博客专家 CSDN认证企业博客

码龄4年

44: 原创

32万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

541: 积分

15: 粉丝

31: 获赞

21: 评论

138: 收藏

私信

关注

热门文章

分类专栏

最新评论

bug解决：AssertionError: No inf checks were recorded for this optimizer.
蜡笔新小: 但是这个问题在我这里实质是精度的问题，所以把混合精度去掉是最简单的解决方法了，我的如果解决不了你去看看别的帖子呗
bug解决：AssertionError: No inf checks were recorded for this optimizer.
qq_25944655: 你解决了个寂寞，不就是为了amp混合精度快吗
四大卷积设计
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
bug解决：AssertionError: No inf checks were recorded for this optimizer.
chanruoburuo: 我也遇到了这个问题,摸索了半天终于解决了,原因可能是骨干网络采用了冻结训练,而且从骨干网络出来的张量直接进入只针对该没有梯度回传的张量算损,所以我把Freeze_train设为False,问题自动解决.
bug解决：AssertionError: No inf checks were recorded for this optimizer.
chanruoburuo: 我也遇到了这个问题,摸索了半天终于解决了,原因可能是骨干网络采用了冻结训练,而且从骨干网络出来的参数直接进入算损流程,而且只针对没有梯度回传的张量算损,所以我把Freeze_train设为False,问题自动解决.

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。