自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zoe9698的博客

奇迹是努力的另一个名字

  • 博客(94)
  • 问答 (2)
  • 收藏
  • 关注

原创 使用Python分析周杰伦《Mojito》豆瓣短评

源代码+数据集已上传至GitHub:公众号博文:Python告诉你网友究竟如何看待周杰伦的《Mojito》1.将数据集(包含我手动标注的情感倾向:{0:"不喜欢",1:"中立",2:"喜欢"})转为dataframe格式#coding:utf-8import pandas as pdfpath = "D://数据集大荟萃/周杰伦新歌《Mojito》豆瓣短评数据集/mojito6931/1Mojito豆瓣短评数据6.12.csv"df = pd.read_csv(fpath,en.

2020-07-08 20:12:36 575

原创 torch保存和加载 模型、参数

缺点:这种方式保存的模型只能在相同的环境中使用,因为它依赖于模型定义的代码。如果您在不同的环境中使用这种方式保存的模型,可能会出现错误。(相同的环境指的是运行代码的环境,包括操作系统、Python 版本、PyTorch 版本以及其他依赖库的版本都相同。来保存和加载模型的参数。这样,您只需要在新环境中定义相同的模型结构,然后使用。优点:想要在不同的环境中使用保存的模型,建议使用。保存整个模型,包括模型结构+参数。函数加载保存的参数即可。

2023-06-08 09:50:35 488

原创 assert语句和raise语句

语句通常用于在程序运行过程中抛出异常,以便在发生错误时通知调用者。时抛出一个异常并停止程序,而不仅仅是检查代码中的假设是否正确。语句可以让您更清楚地指定异常类型和错误消息,从而提高代码的可读性。语句在效率上没有显著差异。它们的主要区别在于用途和可读性。语句通常用于调试目的,用来检查代码中的假设是否正确。在生产环境中,可以通过运行Python解释器时加上。语句可能更合适,因为您希望在参数为。语句来抛出内置异常或自定义异常。语句中的条件为假,则会抛出一个。(优化)选项来禁用所有的。在您提供的示例中,使用。

2023-04-07 11:05:45 393

原创 python加载json文件

你可以检查你的json文件是否有多个json对象,如果有的话,你需要把它们包裹在一个列表中,或者使用列表推导式逐行读取。数据长这样:一共53360条。所以这个方法不方便。

2023-03-09 14:36:48 507

原创 Python中动态变量使用记录

exec方法好像不能单独调用?比如说用exec生成了几个动态变量好像没有办法直接调用 只能是用locals和globals

2022-12-04 16:58:14 242

原创 亲测最完善的文本清楚中英文标点符号的方法

【代码】亲测最完善的文本清楚中英文标点符号的方法。

2022-11-02 11:16:29 186

转载 Python树状图绘制包phantomjs安装过程Linux

最后一步就是建立软连接了(在/usr/bin/目录下生产一个phantomjs的软连接,/usr/bin/是啥目录应该清楚,不清楚使用 echo $PATH查看)到这一步就安装成功了,接下来测试一下 (经过上面建立的软连接,你就可以使用了,而且是想使用命令一样的进行使用哦!# 下载好后进行解压(由于是bz2格式,要先进行bzip2解压成tar格式,再使用tar解压)# 再使用tar进行解压到/usr/local/目录下边。# 重命名(方便以后使用phantomjs命令)# 安装依赖软件 可选。

2022-10-11 11:27:10 159

原创 VsCode import自己写的包各种报错解决方案2022.9

比如当主文件中import了兄弟文件夹中的bert.py文件时,在bert.py文件中import其他包既可以用“相对于【主文件的父目录】的绝对路径”,也可以用“相对于bert.py的相对路径”。难道以后每次import自己写的包都要写绝对路径?网上说的有1.修改setting文件的(x),2.python文件顶部添加sys(x),3.还有什么用绝对路径的(x)全都是错的。代码内部涉及到调用其他文件,既可以用相对于【主文件的父目录】的绝对路径,也可以用当前python文件的相对路径。比如说,目前要运行的。

2022-09-05 15:48:41 5687 4

转载 python 可选参数

原因:函数在定义时,默认参数L所制定的地址已经确定,而L是一个list,所以每次调用该函数时,如果改变了L的内容,则下次调用时,默认参数的内容就会改变。在参数前面加上*就是可变参数。允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装成一个dict。可变参数:就是传入的参数个数是可变的,可以是1个、2个到任意个,还可以是0个。参数定义的顺序:必选参数、默认参数、可变参数和关键字参数。函数参数:必选参数、默认参数、可选参数、关键字参数。设置默认参数时注意事项:必选参数在前,默认参数在后。

2022-08-24 14:46:24 4283

原创 Python NLP 基础常见code 技巧

pytorch每日一学20(torch.arange()、torch.range()、torch.linespace()、torch.logspace())根据步长创造一维tensor_Fluid_ray的博客-CSDN博客_torch。arangepytorch.range() 和 pytorch.arange() 的区别_Who is abc的博客-CSDN博客_torch.arrange 参数解释:start:创建的tensor元素的起始值(不一定一定第一个元素就是start),默认为0。en

2022-07-14 10:47:06 335

原创 (情感倾向分类)2分类文本任务,Bert微调详细教程

🎀Dataset:SST-2Model:bert-base-cased✨transformers库的使用【三】对预训练模型进行微调Transformers实战——使用Trainer类训练和评估自己的数据和模型HuggingFace从在线库中载入SST2数据集from datasets import load_datasetdataset = load_dataset('glue','sst2')Tokenizer:将input转换为模型可以处理的格式。from

2022-05-04 23:23:20 2860

原创 解决OSError: [WinError 127] Error loading “S:\anaconda\envs\bert\lib\site-packages\torch\lib\caffe2_de

OSError: [WinError 127] 找不到指定的模块。anaconda\lib\site-packages\torch\lib\caffe2_detectron_ops.dll“FileNotFoundError - caffe2_detectron_ops.dll on Windows source build if Python 3.8 used · Issue #35803 · pytorch/pytorch · GitHub删掉caffe2_detectron_ops.dll..

2022-04-30 20:59:58 2390 2

转载 【无标题】

假设X 是一个随机变量(random variable), 是它的一个实现(realisation)。 是另一个随机变量, 是它的一个实现。 是个常数。(密度函数):参数为 时,出现的概率。这里的 是一个特定的值,比如3.14(注意, 可能已知也可能未知,但它是一个值,不是一个分布的某个实现)。2. (条件概率):随机变量为 时,在这一条件下,出现的概率。随机变量是不确定的,服从某个概率分布,这里 是 的一个实现。3. (联合概率):随机变量为 时且随机变量为 时..

2021-12-02 16:42:48 104

原创 ubuntu系统常见问题

ubuntu18.04问题1:requests.exceptions.ConnectionError: HTTPSConnectionPool(host='raw.githubusercontent.com', port=443):terminal中export http_proxy="http://127.0.0.1:12333"export https_proxy="http://127.0.0.1:12333"问题2:Malformed version string ‘~‘

2021-11-23 14:53:28 1980

原创 读《多头自注意力层和卷积层的关系》笔记

这是一篇2020年ICLRhttps://iclr.cc/virtual_2020/poster_HJlnC1rKPB.html

2021-06-06 17:05:06 1272

原创 Python机器学习常用

2021/5/31更新Pytorch nn.Softmax()函数这个函数的公式是

2021-05-31 19:21:31 105

原创 [Deep Learning]卷积神经网络的详细理解

Deep Learning has 3 steps: Step1 step2 step3 define a set of function(neural network) goodness of function pick the best function How to connect the neurals?怎么把神经元连接起来?最常见的方式是全连接前馈神经网络。Fully connect feedforward network.所以神经网络

2020-09-27 15:58:03 387

原创 Chest-X-Ray-Images-Pneumonia肺炎X射线图像识别健康或肺炎患者,基于tensorflow2.0 CNN

github:https://github.com/zoe9698/Chest-X-Ray-Images-Pneumonia-参考文献:https://tensorflow.google.cn/tutorials数据集:Chest X-Ray Images (Pneumonia)数据集观察:肺炎肺有雾化的阴影 数据预处理:'''图片预处理'''def preprocess_image(image): ''' image=img_raw ''' .

2020-06-23 17:20:03 1237

原创 林子雨教程中sqoop安装过程时区问题解决

https://blog.csdn.net/Flyfish111222/article/details/53143499http://dblab.xmu.edu.cn/blog/install-sqoop1/林子雨老师给的薛倩sqoop安装教程时区问题版本对应报错。https://my.oschina.net/u/4087795/blog/3213702/print见此链接,jdk8,mysql5.7,应该用Connector/J 8.0,教程中用的是5.0。用8.0的Connec.

2020-06-01 13:22:12 785

原创 机器学习的发展历程--《西瓜书》笔记

机器学习的发展历程可以简单分为3个阶段———— / BEGIN / ————1950年代-1970年代:推理期这个时期人们认为“智能”就是“逻辑推理”,想要赋予计算机“智能”只需要赋予计算机逻辑推理能力即可。这个时期代表作有A.Newell和H.Simon的“逻辑理论家”和“通用问题求解”程序。其中“逻辑理论家”程序在1963年证明了《数学原理》中的全部52条定理。因此两位科学家...

2020-05-07 23:45:45 2367

原创 王道机试指南-代码-P16日期问题

考点:平年是date.year%4==0&&date.year%100==0;否则是闰年 平年二月是28天,闰年是29天/*计算天数*/int caldays(Date date){ int result=date.day; int runnian_days[]={31,29,31,30,31,30,31,31,30,31,30,31}; int pingnia...

2020-03-07 12:55:18 180

原创 C++算法题总结

vector【原创】C++ 动态数组 vector 详解c++中vector动态数组用法例1:2000完数和盈数例2:求两个数的最大公约数例3:日期计算例4:统计首字母相同的单词个数例5:一组英文单词排序例6:异常处理总结:字符串处理,不定长度的动态数组。常见操作:push_back尾插,size()数组长度,[i]访问。algorithm例1:数字排序...

2020-03-05 16:24:32 258

原创 github上传项目的步骤

git clone https://github.com/zoe9698/sinaspider.git把你在这个目录要上传的文件复制到新出现的文件夹里 cd sinaspider git add . git push -u origin master over ...

2020-03-05 15:20:16 248

原创 Python+appium+安卓真机实现微信朋友圈爬虫

0.使用步骤解压android_sdk,去官网下载appium,双击node-v12.14.1-x64.msi安装nodejs教程见https://www.jianshu.com/p/6505d11aecc31.windows每天自动执行logwx.py 教程见https://blog.csdn.net/u012849872/article/details/827193722.文件中...

2020-02-12 13:23:18 1103

原创 2020-1-26 2016机试题

1、输入学生信息,姓名 成绩(成绩的数目不一定)输出每个学生的学号和平均成绩,以及不及格课程数超过2的学生,按不及格课程数从大到小排好序输出。#include<iostream>#include<string>#define MAX 100using namespace std;struct Student{ string name; int sco...

2020-01-27 14:19:06 134

原创 基于深度学习的音乐推荐系统(三)使用已训练的卷积神经网络提取语谱图特征并计算图像间相似度

该模块包含几部分:调用训练好的并且已经保存的CNN模型(仅四层卷积层部分) 逐个读取tfrecords文件中的元素,并送入已训练好的CNN中,给每个图片提取128个特征 每首歌包含11个图片,即11*128个特征,将每首歌的11*128个特征之间进行余弦相似度计算 逐个歌曲计算,返回每个歌曲的最相似的三首歌歌名,以列表的形式 调用训练好的并且已经保存的CNN模型(仅四层卷积层部分)...

2019-06-07 21:45:58 4600 9

原创 基于深度学习的音乐推荐系统(二)用于语谱图分类的卷积神经网络结构

Tensorflow1.13极客云GPU服务器极客云注册地址用这个链接可以免费获得10元优惠券,好像是不需要充值就可以用。本系统用单核GPU,最便宜的那种就行。该CNN的训练样本分为两类一共10类音频,每类100首歌曲,每首歌曲分割为11张图。即每类1100张图。训练集:每类的前1000张图。测试集:每类的后100张图。代码如下:train_li...

2019-06-07 10:56:52 4250 4

原创 马克一下

自爬行者公益团公开招募志愿者以来,收到了很多报名邮件,谢谢大家的信任与支持。在最近一段时间内,我们新招募并确定了甘肃、内蒙古、​山西、陕西、贵州、云南等六个地区的团长及邮箱。现将所有分区邮箱汇总公布,各地区的爱心人士可发到简历到对应的邮箱报名。北京paxingzhe_bj@163.com上海paxingzhe_sh@163.com河南paxingzhe_hen@163.com河...

2019-04-30 12:06:24 245

原创 基于深度学习的音乐推荐系统(一)音频频谱图绘制

采集mp3音频样本 数据量小可以直接客户端批量下载,网易云下载的是mp3格式,每天每个id下载限度300首。数据量大写爬虫。 mp3音频样本转为wav格式样本 这一步涉及到python的文件路径编程,主要用到的是os库函数。from pydub import AudioSegmentimport os,sys#单个转码# print(sys.argv[0])...

2019-04-14 13:19:20 6416 3

转载 音频处理中需要用到的关于声乐的基本概念

参考文献:图解泛音及形成原理音的高度:=音的振动频率(正比) 音高的计量:钢琴上每七个白键一个循环,分别叫做CDEFGAB(为何不是从A开始,而是从C开始?这是个历史问题。。。),也就是我们熟知的”Do Re Mi Fa So La Si”,过了一个循环就下标加一,又叫升八度,即,C1, C2, C3, C4…高八度的声音,频率高一倍,也就是说,C2比C1的频率高一倍,C3比C2的频...

2019-04-12 17:17:45 7668

原创 关于C语言中链表声明中结构体的使用方法

typedef struct _node{ int data; struct _node * next;};//尾插法:创建一个递增有序的单链表_node* last_create(){ _node *head = (_node*)malloc(sizeof(_node)); head->data = 10;//带头结点,头结点dat...

2019-03-20 16:12:11 2043

原创 数据结构-单链表创建(头插尾插)遍历_C版

/*在一个递增有序的单链表中有数值相同的元素存在目标:删除数值相同的元素,使表中不再有重复的元素*/#include<stdio.h>#include<stdlib.h>typedef struct _node{ int data; struct _node * next;}Node;/*自动生成(1,2,3,4,5,6,7,8,9,10)链表...

2019-03-20 15:38:56 349

原创 Kaggle比赛入门----泰坦尼克幸存几率预测

import pandas as pd import matplotlib.pyplot as plt train_data = pd.read_csv("../titanic/titanic/train.csv")fig = plt.figure()fig.set(alpha = 0.2) #设定图表颜色alpha参数plt.subplot2grid((3,3),(0,0)) #...

2019-02-01 15:54:58 321

原创 阿里云轻量应用服务器搭建tensorflow+jupyter并远程windows登陆

环境:阿里云轻量应用服务器(1核 2G 40G)ubuntu16.04(python环境为服务器自带)1.阿里云服务器自带Python2和3以及pip,但没有pip3这个简单啊,到网上下载get-pip.py的脚本,然后scp到你的阿里云服务器上,python3 get-pip.py即可。如果不会scp,哈哈,按照下面的几步:wget https://bootstra...

2019-01-24 13:54:57 1503

原创 C++ C2460 error

关于该错误的官方说明:https://msdn.microsoft.com/en-us/library/1kf0205c.aspx结构形如:identifier1' : uses 'identifier2'类或结构(identifier2)被声明为其自身(identifier1)的成员。不允许递归定义类和结构。即:C++中类或结构递归调用自身必须用指针类型。...

2018-10-27 13:23:57 1318

原创 C++结构体使用方法

#include&lt;iostream&gt;using namespace std;struct Books{ int id; char title[4];};int main(){ //声明一个Books结构体类型的变量book Books book; //声明一个Books结构体类型的指针变量bp,使bp指向book struct Books* bp; bp ...

2018-10-27 11:48:19 1835

原创 严蔚敏数据结构复习(C)-1-顺序表的初始化以及赋值

 /*time:2018/9/20function:    顺序表的初始化    b1赋值给顺序表summarize:    1.结构体声明2种        #1#             typedef struct            {                char no[20];//图书ISBN                char name[50];...

2018-09-20 21:36:11 4097

原创 正规方程(标准方程)法---笔记

第一篇文章对梯度下降的解释,初始位置在山上某点,目的位置是山的最低点,那么下山就需要不断的在当前位置找到下山最陡的那条路的'方向‘,然后向这个方向往下走一段路,再重新计算最陡方向,直到到达最低点。假设我们的预测函数只有一个theta参数,损失函数是一个二次方程:对应的图像是:那么对于这个损失函数我们可以使用梯度下降法求损失函数的最小值。或者从数学的角度考虑,对于二次函数秋最值我...

2018-09-05 13:52:15 7335 10

原创 特征选择,特征缩放---笔记

特征选择frontage是这块地靠近公路的那一面的长度depth是垂直公路的长度把这两个变量单独拿出来进行房价预测没有必要,于是我们设置变量x(面积)=frontage*depth,只看这一个自变量即可。这就是特征选择即将不合理的变量经过合并,剔除来简化。特征缩放在计算的过程当中,我们发现,有很多时候,参数的取值差距非常大,导致很多时候要进行大量的大数值的计算。...

2018-09-04 19:37:55 1060

原创 多项式回归---笔记

吴恩达老师课程文档版https://www.cnblogs.com/babers/p/6761827.html在房价预测问题中,前面我们都是利用线性回归的方法,但实际上,房价关于某个自变量的变化可能在增长到一定程度后趋于平缓。如下图:如果面对这样的数据分布继续使用线性方程去拟合,那么到数据的后半部分便会拟合效果下降,自然,我们会想到这个分布图像更像一个二次方程。这样的效果似乎也不...

2018-09-04 19:20:44 872

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除