- 博客(9)
- 资源 (15)
- 收藏
- 关注
原创 Python利用dict实现switch
Python3还是没有switch,可以利用if-else来实现,但是非常不方便。使用dict来实现会比较简洁优雅。# -*- coding: utf-8 -*-"""Python利用dict实现switch"""def add(x, y): return x + y def subtract(x, y): return x - y
2017-11-21 16:23:50 1657
转载 N-gram算法
最近在做谷歌text normlization的时候,俩队友用到了这个算法,搞得我一脸懵逼。整体来说,还是一种字符串模糊匹配算法吧,多用来衡量字符串之间的相似度。字符串的精确匹配算法KMP算法之前也提到过。N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面,N
2017-11-13 13:26:20 8148
原创 Sklearn中LabelEncoder与OneHotEncoder
1. LabelEncoder()#简单来说 LabelEncoder 是对不连续的数字或者文本进行编号from sklearn.preprocessing import LabelEncoderle = LabelEncoder()le.fit([1,5,67,100])le.transform([1,1,100,67,5])array([0,0,3,2,1])2. On
2017-11-10 09:50:02 4001 1
转载 准确率与召回率
1、两个最常见的衡量指标是“准确率(precision)”(你给出的结果有多少是正确的)和“召回率(recall)”(正确的结果有多少被你给出了)这两个通常是此消彼长的(trade off),很难兼得。很多时候用参数来控制,通过修改参数则能得出一个准确率和召回率的曲线(ROC),这条曲线与x和y轴围成的面积就是AUC(ROC Area)。AUC可以综合衡量一个预测模型的好坏,这一个指标综合了
2017-11-08 14:34:10 51653 5
原创 大话数据结构 - 串
1. 串的定义串是由0个或多个字符组成的有限序列,也叫做字符串。2. 串的比较3. 串的抽象数据类型4. 串的存储结构5. 朴素的模式匹配算法6.KMP模式匹配算法
2017-11-02 21:27:02 448
原创 Windows+Python3.6.0(Anaconda3)+OpenCV3.2.0安装配置
注:本次安装因为我要配的这个笔记本是win7(32bit)的,所以安装中软件版本的选择就是按32位走的,我之前在win10(64bit)也装过,实际中这个教程的方法对于win7还是win10,32位又或是64位系统是通用的,软件版本按需选择就行了。1.安装Python环境,推荐使用Anaconda,下载地址2. 双击Anaconda3-4.3.1-Windows-x86.exe一路
2017-11-02 15:30:45 717
转载 Windows10使用Anaconda安装OpenCV
Windows10使用Anaconda安装OpenCV这里假定大家都已经安装好Anaconda环境,并且将使用Anaconda所提供的图形化界面Anaconda Navigator来进行环境创建和工具包安装。 *备注:关于Anaconda的简单教程,请戳这里创建一个全新的Python环境启动Anaconda Navigator,初始界面如下图 选择左侧的Envi
2017-11-02 14:21:32 2555
原创 xgboost参数详解
XGBoost参数在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters:General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster有树模型(tree)和线性模型(linear model)。Booster parame
2017-11-01 16:30:23 1483
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人