- 博客(12)
- 资源 (39)
- 问答 (3)
- 收藏
- 关注
原创 【Python】Django、Flask、Tornado的框架性能分析
本文仅关注目前最常用的三大 Python 框架:Django、 Flask 以及 Tornado。
2019-02-28 11:56:06 3256 1
原创 【人工智能】SVM、NN等统计学算法爆内存的解决方案
Swap空间的作用可简单描述为:当系统的物理内存不够用的时候,就需要将物理内存中的一部分空间释放出来,以供当前运行的程序使用。那些被释放的空间可能来自一些很长时间没有什么操作的程序,这些被释放的空间被临时保存到Swap空间中,等到那些程序要运行时,再从Swap中恢复保存的数据到内存中。就是内存条的空间不够了,为了能让应用程序认为它拥有连续可用的内存(一个连续完整的地址空间),我们匀出一部分硬盘空间来充当内存使用的。通常情况下,我们会把总样本2-8分成测试集和训练集,通常也是在执行训练和测试的时候耗时的。
2019-02-28 11:35:05 9449 2
原创 【人工智能】支持向量机(SupportVectorMachine)文本算法的精确率——升级版sklearn
Sklearn的svm算法中,LinearSVC效果是最优的。
2019-02-27 10:07:11 8617 2
原创 【人工智能】Liblinear中的支持向量机(SupportVectorMachine)文本算法的精确率
文章目录简介Liblinear中的效果和Sklearn中的效果对比Liblinear实验整体流程Liblinear核心源码简介最近的项目中,用到了很多机器学习的算法,每个机器学习的算法在不同的样本下的精准率是不同的。为了验证每个算法在每种不同样本数量的能力,就做了一下实验,本文讲的是“支持向量机”在运用Liblinear库时,在文本算法中的精准率。Liblinear中的效果和Sklearn中...
2019-02-22 19:18:52 3564 1
原创 【人工智能】liblinear的帮助文档翻译
Python(http://www.python.org/)是一种适合快速编程的编程语言发展。该工具为LIBLINEAR(一个库)提供了一个简单的Python接口用于支持向量机(http://www.csie.ntu.edu.tw/~cjlin/liblinear)。该界面非常易于使用,因为其用法与LIBLINEAR的用法相同。该界面是使用内置的Python库“ctypes”开发的。
2019-02-21 17:05:58 9698 5
原创 【人工智能】随机森林(Random Forest)文本算法的精确率
TF-IDF(词频-逆文本频率),前面的TF也就是常说到的词频,我们之前做的向量化也就是做了文本中各个词的出现频率统计,并作为文本特征,这个很好理解。有些句子中的词,比如说“的”,几乎所有句子都会出现,词频虽然高,但是重要性却应该比 主语、宾语等低。最近的项目中,用到了很多机器学习的算法,每个机器学习的算法在不同的样本下的精准率是不同的。概括来讲, IDF反应了一个词在所有文本中出现的频率,如果一个词在很多的文本中出现,那么它的IDF值应该低。6、把测试集得出的词向量丢到拟合后的模型中,看得出的结果。
2019-02-20 14:17:29 14922 7
原创 【人工智能】朴素贝叶斯(Naive Bayesian Model)文本算法的精确率
最近的项目中,用到了很多机器学习的算法,每个机器学习的算法在不同的样本下的精准率是不同的。为了验证每个算法在每种不同样本数量的能力,就做了一下实验,本文讲的是“朴素贝叶斯”在文本算法中的精准率。这里应该多跑几遍不同样本,然后把结果取平均值,每次的结果还是稍有不同的。2、把整体样本按照8:2的比例,分为80%的训练集,20%的测试集。4、接着把训练集的样本和标签统一的传入算法中,得到拟合后的模型。6、把测试集得出的词向量丢到拟合后的模型中,看得出的结果。对输入数据的表达形式很敏感,分类的性能不一定很高。
2019-02-20 12:36:22 5397 1
原创 【人工智能】K近邻(K-NearestNeighbor)文本算法的精确率
TF-IDF(词频-逆文本频率),前面的TF也就是常说到的词频,我们之前做的向量化也就是做了文本中各个词的出现频率统计,并作为文本特征,这个很好理解。最近的项目中,用到了很多机器学习的算法,每个机器学习的算法在不同的样本下的精准率是不同的。通过以上数据可以看出在样本数量较低的情况下还不错,在样本数量在5000的时候效果还可以,但是到达20000的时候,准确率已经在65%左右了。概括来讲, IDF反应了一个词在所有文本中出现的频率,如果一个词在很多的文本中出现,那么它的IDF值应该低。
2019-02-20 11:38:55 3903 1
原创 【人工智能】sklearn中的支持向量机(SupportVectorMachine)文本算法的精确率
Sklearn的svm算法中,LinearSVC效果是最优的。在数据量达到20000条,精确率依然在80%左右。其实SVM简单的调参后,精确率会更高。机器学习 之 支持向量机(SupportVectorMachine)文本算法的精确率——升级版sklearn。
2019-02-20 11:10:04 4087 1
原创 【人工智能】逻辑回归(LogisticRegression)文本算法的精确率
TF-IDF(词频-逆文本频率),前面的TF也就是常说到的词频,我们之前做的向量化也就是做了文本中各个词的出现频率统计,并作为文本特征,这个很好理解。2)预测结果呈“S”型,因此从log(odds)向概率转化的过程是非线性的,在两端随着log(odds)值的变化,概率变化很小,边际值太小,slope太小,而中间概率的变化很大,很敏感。最近的项目中,用到了很多机器学习的算法,每个机器学习的算法在不同的样本下的精准率是不同的。2、把整体样本按照8:2的比例,分为80%的训练集,20%的测试集。
2019-02-19 15:42:16 9897
原创 【编程语言】各个流行语言优缺点对比及其适用场景
TIOBE编程语言排行榜是编程语言流行趋势的一个指标,每月更新,这份排行榜排名基于互联网有经验的程序员、课程和第三方厂商的数量。C更适合广泛应用于计算机的底层开发,例如系统软件:编译器,JVM,驱动,操作系统内核,还有各种嵌入式软件,固件等。目前很多人工智能的算法都是用Python来实现的,在AI的领域Python的地位还是很高的。Java的热度一直让它处于编程语言排行榜首位的位置的面向对象的静态语言。简称Go语言,它是一个有动态语言感觉的静态语言,写起来的效率很高。C语言是一门面向过程的静态语言。
2019-02-02 14:52:21 27669 3
原创 【人工智能】感知机(Perceptron)
今天来学习下机器学习的敲门砖——感知机模型。网上查了很多中英文资料,得知感知机是在1957年由Frank Rosenblatt提出的,它被成为机器学习领域最为基础的模型。虽然是最为基础的,但是它在机器学习的领域中,有着举足轻重的地位,它是SVM(支持向量机)和NN(神经网络)学习的基础,可以说它是最古老的分类方法之一了。虽然今天看来它的分类模型在大多数时候泛化能力不强,但是它的原理却值得好好研究。如果研究透了感知机模型,再学习支持向量机、神经网络,也是一个很好的起点。
2019-02-01 16:59:05 48902 1
MinGW 开发工具集:MingW-i686
2024-02-22
Qt For Android 开发相关套件 之 NDK r19c
2023-12-01
EmSDK1.39.7版本
2021-08-07
eolinker_os_4_0.zip
2020-03-06
GateOne最新.zip
2020-03-04
Microsoft_Visual_C++_14.0.zip
2020-02-21
Postman-win64-7.18.0.zip
2020-02-21
apache-cassandra-2.2.14-bin.tar.gz
2019-06-21
neo4j-community-3.5.6-unix.tar.gz
2019-06-20
Qt5把Qt4的QFTP封装成库
2019-04-30
OpenHardwareMonitorLib的动态库
2019-04-11
Pycharm的汉化文件
2019-02-21
Qt利用Poppler解析pdf成图片
2019-02-01
windows服务自启instsrv.exe、srvany.exe
2018-12-29
Qt以Base64加密作为基础实现3种加解密方式(包含中文处理)
2018-08-23
openGL 必备的库文件,3.7beta版本
2018-02-06
Qt在Android上所需的ssl文件下载
2018-02-05
QWebEngineView简单示例-沙师弟专栏
2017-07-17
Qt5.6+VLC简单实现示例(沙师弟专栏)
2017-05-24
在Qt平台C++和Java代码的交互
2017-04-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人