自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 问答 (1)
  • 收藏
  • 关注

原创 【Excel】函数之易踩坑系列(常用函数干货)

Excel函数公式优化之INDEX、COUNTIFS、SEARCH

2023-01-20 16:06:58 303

原创 【pytorch】cuda torch torchvision版本对应

cuda torch torchvision版本对应以及查看查看服务器cuda版本:cat /usr/local/cuda/version.txt查看torch torchvision版本:import torchprint(torch.__version__)import torchvisionprint(torchvision.__version__)print(torch.cuda.is_available()) # 查看是否有可用GPUprint(torch.cuda.de

2021-10-13 16:00:13 2747 1

原创 【深度学习】 loss不下降,准确率很低的原因

loss不下降,ACC很低(只有0.1,0.2这种)可能的原因有:数据集有问题(噪声过多或存在过多的标签错误或类别不平衡)梯度爆炸梯度消失笔者遇到的梯度爆炸情况下图的矩阵是pooler_output(从bert得到的句子向量):若干个不同的文本,在训练两个batch后可见模型的输出几乎一样了,这正是梯度爆炸的原因梯度异常检验检验模型权重更新情况、句子向量、loss值model = BERT()model.to(device)criterion = nn.CrossEntrop

2021-09-29 14:41:14 9348 10

原创 分享中文NLP比赛的经验

数据预处理枯燥而必须做的三部曲:检查缺失值,文本去重,去噪。其中文本的噪声一般有:如“\xa0”、“\t”、“\n”等特殊字符。网址。如“https://baidu.com/”等。日期。如“XXXX 年 X 月 X 日”等。地名。如带有“A 市”、“A8 县”,“B4 区”等英文单词为开头的地名。首尾冗余。如“您好!”、“谢谢!”等这些没有价值的字样。在分词后利用正则表达式选择保留数据集中的文字、标点、数字符号。分词技术首先,需要考虑将要用词向量还是字向量喂给模型。词向量。先去找

2021-04-16 11:23:49 372

原创 利用斗鱼api学习爬取斗鱼直播间信息

python爬取斗鱼房间的弹幕斗鱼弹幕服务api:https://open.douyu.com/source/api/63基本步骤:连接斗鱼api服务器构造登录请求进入房间并构造获取弹幕请求保持心跳断开连接import multiprocessingimport socketimport timeimport reimport signalimport jiebaimport requestsfrom bs4 import BeautifulSoup as bs4from

2020-09-19 14:35:25 2740

原创 总结wordcloud安装的一些经验以及问题的解决(看完可以举一反三噢)

完美解决安装wordcloud时遇到的问题第一步:先去https://www.lfd.uci.edu/~gohlke/pythonlibs/ 页面下载所需的wordcloud模块的whl文件;选择对应版本进行安装,一定要注意对应python安装版本,比如这是作者的版本:所以我下载这个版本:安装到\Lib\site-packages\目录下。到这一步可以试一下直接到cmd执行pip install wordcloud-1.7.0-cp37-cp37m-win_amd64.whl;如果不行就接第二步

2020-05-28 18:39:57 1377 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除