自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Claly

今天小陈也要加油呀!

  • 博客(21)
  • 收藏
  • 关注

原创 截取函数

MID字符串函数,作用是从一个字符度串中截取出指定知数量的字符MID(text, start_num, num_chars)text被截取的字符=mid(a1,3,3)=right(a1,3)从右取三个字符=left(a1,3)从左取三个字符...

2020-05-03 10:18:01 2314

原创 常见内置函数

python数学类型abs(a) : 求取绝对值。abs(-1)max(list) : 求取list最大值。max([1,2,3])min(list) : 求取list最小值。min([1,2,3])sum(list) : 求取list元素的和。 sum([1,2,3]) >>> 6sorted(list) : 排序,返回排序后的list。len(list) : l...

2020-03-10 23:22:24 548

原创 软件

GraphPad Prism 7偶然get的一个神仙作图工具,主要针对在坐标系下的图形,从数据到图像的转变。链接:https://pan.baidu.com/s/1H9sGOH0wxTlb_K-vDXDTAQ提取码:khm0安装:解压,一路向下即可。安装完成到桌面找到软件,然后点击鼠标右键——打开文件位置回到数据包中将提供的注册机复制到上一步打开的目录下并运行,点patch,破解完成...

2020-02-19 15:51:32 192

原创 python报错“ImportError: The _imagingft C module is not installed”

windows系统卸载pillow,重新安装pip uninstall pillowpip3 install pillow加上 --no-cache-dir参数:pip3 install pillow --no-cache-dirUbuntu系统卸载同上然后安装develsudo apt-get install libtiff-devel libjpeg-devel lib...

2020-02-14 22:14:21 10099 4

原创 python报错:(1)"No module named 'urllib2'",(2)NameError: name 'file' is not defined

问题(1)将urllib2改为urllib.request。问题(2)原因:由于是python3.5,函数使用有变化,将file()改为open()即可。

2020-02-08 20:33:00 511

原创 mysql安装

下载登录mysql官网https://www.mysql.com/downloads/拉到最下面,点击mysql community server我是win10系统,选择,点击download.然后选no thanks…,下载即可。安装解压压缩包,在解压的文件夹下新建data文件夹 和mysql.ini文件,其中mysql.ini文件的内容为:[mysql]# 设置mys...

2020-02-08 20:32:08 92

原创 解决“由于找不到VCRUNTIME140_1.dll,无法继续执行代码,重新安装程序可能会解决此问题。”

Visual C++ Redistributable for Visual Studio 下载网址2015 https://www.microsoft.com/zh-CN/download/details.aspx?id=48145点击下载VC_redist.x64.exe(我这边是64位, 32位请选择x86版本)。安装完成后打开C:\Windows\System32, 可以找到文件vcr...

2020-02-04 20:27:19 117170 9

原创 windows下载7z

1.官网下载系统对应的7zip版本32位系统下载32位版本,64位系统下载64位版本。https://www.7-zip.org/download.html2.安装3.将7zip功能选项加入到鼠标右键中。参考:https://jingyan.baidu.com/article/f79b7cb30dcb109145023e74.html...

2020-01-29 22:54:43 2719

原创 基本流程——NLP

文本处理流程预处理流水线

2019-09-05 17:23:37 207

原创 Linux常用指令

系统信息arch 显示机器的处理器架构uname -m 显示机器的处理器架构uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI)hdparm -i /dev/hda 罗列一个磁盘的架构特性hdparm -tT /dev/sda 在磁盘上执行测试性读取操作cat /proc/cpuinfo 显示CPU info的信息ca...

2019-09-04 10:56:19 144

原创 梯度消失 梯度爆炸

梯度消失爆炸的解决方案主要包括以下几个部分梯度剪切、权重正则(针对梯度爆炸)使用不同的激活函数使用batchnorm使用残差结构使用LSTM网络方案1-预训练加微调此方法来自Hinton在2006年发表的一篇论文,Hinton为了解决梯度的问题,提出采取无监督逐层训练方法,其基本思想是每次训练一层隐节点,训练时将上一层隐节点的输出作为输入,而本层隐节点的输出作为下一层隐节点的输入...

2019-09-02 17:36:19 150

原创 ROC曲线

from sklearn.metric import roc_curve,aucimport matplotlib.pyplot as pltfpr,tpr,_ = roc_curve(y_true,y_pred)area = auc(fpr,tpr)plt.plot(fpr,tpr,lw =1,alpha=0.8,label = 'ROC (AUC=%2F)'%(area))plt....

2019-08-22 15:16:35 166

原创 panda.cut-连续数据离散化

数据预处理的作用在于在之后的训练和预测中能够将我们的预测划分在某个区间内,并不要求其准确到具体,否则预测的准确率将会极低,预处理的方法不仅限于文本处理,在图像处理中,这种理念同样适用。介绍在python中如何进行连续数据离散化,用到panda.cut函数,分类数为4。import pandas as pdimport numpy as npbins = [0, 5, 10, 20, 80...

2019-08-22 11:26:56 791

原创 IF语句

听说NLP大神连excel都用的贼6,是真的emmmmmmIF函数,数据预处理阶段

2019-08-21 16:19:08 172

原创 python出现Unknown label type: 'continuous'问题

在调用sklearn时出现 Unknown label type: ‘continuous’以DecisionTreeClassifier为例原码model.fit(X_train, y_train)更改为model.fit(X_train, y_train.astype('int'))

2019-08-13 11:14:51 47541 7

原创 python报错 SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3

拿我的路径作为示例DATA_FILE = 'C:\Users\Desktop\data_ai\house.csv'会报错这里是因为在python字符串中\有转义的含义解决办法第一种:双反斜杠DATA_FILE = 'C:\\Users\\Desktop\\data_ai\\house.csv'第二种:在前面加入r,保持字符原始值DATA_FILE = r'C:\Users\De...

2019-08-05 16:19:25 15387 1

原创 IPython-%魔术命令

%magic查看所有的魔术命令%hist 查看 IPython 命令的输入历史%pdb 异常发生后自动进入调试器%reset 删除当前命名空间中的全部变量或名称%who 显示 IPython当前命名空间中已经定义的变量%time statement 给出代码的执行时间,statement 便是一段代码%timeit statement 多次执行代码,计算综合平均执行时间%...

2019-07-30 14:03:35 218

转载 决策树

原文转自:https://blog.csdn.net/m0epNwstYk4/article/details/81437498决策树(DT)是用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过学习从数据特征推断出的简单决策规则来预测目标变量的价值。例如,在下面的例子中,决策树从数据中学习使用一组if-then-else决策规则来逼近正弦曲线。树越深,决策规则越复杂,模型也越复杂。用...

2019-07-23 10:46:49 531

原创 Anaconda2和3并存时调用python

之前一直在用Anaconda3里的python3.6,但后来需要装caffe和pytorch不得不用到Python2.7版本,而装pytorch时需要调用conda指令下载,索性又装了Anaconda2(具体安装不详细概述)。装完后cmd到python,如果出现python3,说明你的环境变量Python3在2之前(这里建议分别命名为python和python3)。如想修改,见下图,设置环境变量...

2019-07-21 13:13:08 111

转载 数据分析之生存分析

最近在读一篇医学信息处理相关的论文,由于在医学图像和医学信息相关的计算机处理方面还是个新手,遇到了一个生存分析预后的概念,提到KM生存曲线、COX回归模型这样的部分时读的一知半解,索性就上网学习了一下,留个记录吧。什么是生存分析?生存分析是对生存资料的分析。所谓生存资料是指描述寿命或者一个发生时间的数据。通俗来讲,“一个个体能活多久”这个问题扁鹊再世也无法回答,但通过对某一具有相同特质的群体进...

2019-07-11 10:57:36 11033 1

原创 Claly的csdn旅程

First Day

2019-07-06 21:29:26 169 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除