![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 68
DASEason
https://github.com/qq547276542
展开
-
Linux下切换python2和python3为默认执行版本的方式(也能作用于sublime等编辑器的默认执行方式)
使用 alternate 机制可以自由切换python默认版本,只需要在终端输入简单的几个指令:sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100sudo update-alternatives --install /usr/bin/python python /usr/bin/py原创 2017-03-31 11:39:50 · 8580 阅读 · 0 评论 -
Ubuntu下安装MySQLdb(mysql-python)的过程
MySQLdb 是链接python和mysql数据库的工具,Ubuntu 自带了python,但是这个工具还是需要我们自己安装配置的前提:系统安装了python和mysql1:下载MySQLdb:点击链接 http://downloads.sourceforge.net/project/mysql-python/mysql-python-test/1.2.3c1/MySQL-pyth原创 2017-04-01 18:37:29 · 5063 阅读 · 2 评论 -
逻辑回归python实现(随机增量梯度下降,变步长)
关于逻辑回归的学习,建议大家看看这篇blog,讲的很清楚:点击打开链接逻辑回归,实际上就是对线性回归多增加了一个函数映射,使其值域由无穷区间映射到[0,1]区间在线性回归中,估计函数为 其中delta是参数向量,x是输入样本的特征向量而在逻辑回归中,估计函数实际上就是在线性回归的基础上,嵌套了一个sigmoid函数。逻辑回归的估计函数为 其中,e的指数部分就是线性回归的输原创 2017-04-25 10:26:30 · 6010 阅读 · 1 评论 -
Kaggle入门模板:以手写识别Digit Recognizer为例
首先本文参考了点击打开链接 这篇博客,然后可能时间有点久远,Kaggle的这道题给的数据文档和之前的不一样了,以及还有一些注意点这篇文章里没有突出。因此这里重新做个总结,希望大家能早点入个门。这里我使用的sklearn中的支持向量机来解决手写识别问题。这里的svm是可以解决多分类问题的。核函数使用的是高斯核(rbf),松弛变量c选择的是5.kaggle这道题一共提供了3个文件:train.原创 2017-07-05 10:24:03 · 3395 阅读 · 0 评论 -
浅析机器学习中的模型选择与调参(cross validation + grid search)
对于一个预测问题,同时有多种可用的模型,每种模型有多种可用的参数。如何选择一个最合适的模型?总题过程分为2个部分:1.对于一个模型,如何评估该模型在特定问题上的好坏?2.选择了最好的模型后,如何选择最优的参数? 对于模型的评估,我们一般使用交叉验证(cross validation)来进行评估。 在这里我们使用了k折叠法,将训练集划分为相等的k份。然后从1原创 2017-07-20 09:59:58 · 11436 阅读 · 2 评论 -
朴素贝叶斯分类文本 python实现
朴素贝叶斯(naive bayes)模型主要用于文本分类,比如要将邮件分类为正常邮件和带侮辱性词汇邮件对于一封邮件来说其特征可以表示为该邮件中单词出现的情况。比如我们有一个5000个词的词典表,那么邮件的特征可表示成一个特征向量,特征向量的维数等于词典表的单词个数,特征向量每一维的取值空间为0或1(即这个单词是否出现)对于p(x|y),在某一组样本中:p(x1x2...x5000|原创 2017-04-27 22:10:05 · 9123 阅读 · 5 评论 -
解决fasttext内存不足无法读取模型的问题
fasttext是个好东西,是由facebook在2016年推出的一个训练词向量的模型。相比于之前Google的word2vec,fasttext可以解决out of vocabulary的问题。更赞的是,facebook提供了200多种语言的预训练模型和词向量。 然而,在安装完fasttext后,当我读取了3GB的中文模型时,却出了下面的问题:Traceback (most recent cal原创 2017-12-15 21:56:13 · 6144 阅读 · 1 评论 -
GreenPlum数据仓库快速配置,通过python连接
GreenPlum数据仓库快速配置,通过python连接数据库期末作业要用GP开发一个项目,弄的蛋疼,这里总结下我的快速配置过程…1.docker官网下载docker客户端,安装官网链接: 点击这里2.拉取GP的docker镜像,挂载按照这个来https://yq.aliyun.com/articles/57656#1,照做1.1~4.3步(5.1开始的就不一样了,版本原创 2018-01-14 19:01:20 · 4279 阅读 · 0 评论