python
文章平均质量分 95
vickyleexy
生命在于折腾 github博客:vickyleexy.com 未完成,会越来越好滴~
展开
-
炼数成金优惠码
炼数成金优惠码vickyleexy分享了炼数成金邀请码,使用邀请码报名课程可以减免50%固定学费哦! http://www.dataguru.cn/invite.php?invitecode=H456 优惠码为: H456原创 2017-02-08 21:19:28 · 893 阅读 · 0 评论 -
Python机器学习(03)
课程大纲:第一课时:介绍机器学习 第二、三课时:贝叶斯分析 第四、五课时:树模型,决策树、回归树、提升树、随机森林、深度森林、xgboost、剪枝算法(预习:统计学习要素、统计学习方法) 第六课时:特征工程专题,怎样在海量特征中选取最合适的特征。 第七、八课时:半监督学习 第九、十课时:凸优化 第十一课时:凸优化或流形学习贝叶斯建模方法:Cameron书第33页,承接上节课关于接受短信原创 2017-05-18 23:19:17 · 1007 阅读 · 0 评论 -
决策树01——决策树的原理
此笔记根据《machine learning in action》和周志华教授的《机器学习》所作。决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的确实不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型《machine learning in action》:If so return 类标签;Else 寻找划分数据集的最好特征原创 2017-05-31 23:27:34 · 984 阅读 · 1 评论 -
彻底解决matplotlib中文乱码问题
当我们用matplotlib作图时,往往会发现中文的文字变成了小方块,我在绘制决策树的时候就碰到了这个问题。将各种方式试了个遍,都不管用……最终发现是没有删除matplotlib下字体的缓存目录,即~/.cache/matplotlib 下面记录找到的比较好的方法,以便下次使用。1.环境查看a.系统版本查看vickyleexy@vickyleexy-pc:~$ cat /etc/lsb-releas转载 2017-06-08 16:27:03 · 9619 阅读 · 1 评论 -
具体剪枝算法
C4.5的剪枝《Python大战机器学习》 第36页基本思路:计算每个节点的“经验熵”递归地从树的叶节点向上回退,如果回退使“损失函数”值下降,则剪枝,把父节点变成新的叶节点递归进行上一步 损失函数: T表示决策树; α表示先验参数,惩罚系数。α越大,树越简单; C表示代价函数; Tf T_f 表示叶节点的个数; NtN_t 表示在决策树的第t个叶结点中,样本的总数量; N原创 2017-06-22 23:12:38 · 1252 阅读 · 0 评论 -
决策树02——决策树的构建
《 machine learning in action》之决策树计算给定数据集的香农熵创建文件trees.py# -*- coding=utf-8 -*-#计算给定数据集的熵from math import logdef calcShannonEnt(dataSet): numEntries = len(dataSet) labelCounts = {} #实例总数原创 2017-06-06 02:07:02 · 697 阅读 · 1 评论 -
决策树(补充)
算法核心问题该按什么样的次序来选择变量(属性)?最佳分离点(连续的情形)在哪儿?ID3信息增益计算 C4.5信息增益的方法倾向于首先选择因子数较多的变量信息增益的改进:增益率 CART分类树算法大部分流行机器学习软件的决策树都是使用CART实现的可以支持分类和回归在分类树算法中使用基尼指数选择变量 韩家炜 p221预剪枝和后剪枝 看《Python 大战机器学习》原创 2017-06-19 10:58:20 · 303 阅读 · 0 评论 -
解决PyQt错误(QObject::startTimer: QTimer can only be used with threads started with QThread)
近日在PyQt使用Model时,发现如果Model创建时未设置Parent,则运行完退出时会报错:QObject::startTimer: QTimer can only be used with threads started with QThread 解决方法也很简单,创建Model时加上Parent即可。关于这个问题的原因及解决方案可以查看链接:PyQt QTimer problem {FI转载 2017-12-20 16:11:41 · 11667 阅读 · 1 评论 -
win10环境下安装Qt4.8、PyQt及development tools
环境:windows10python2.7(32位)因为是初学qt所以这里选择资料相对比较多一点的版本4。1. 下载安装包1.1 下载QT4.8.6链接:http://download.qt.io/archive/qt/4.8/4.8.6/ 这里下载qt-opensource-windows-x86-mingw482-4.8.6-1.exe 版本。1.2 Qt Creator 下载链接:h原创 2017-12-14 15:08:30 · 5441 阅读 · 0 评论 -
GitHub中15个最受欢迎的Python开源框架
因为过一阵想搭建一个计算网站,但不晓得用什么框架比较好,转载mark学习之。从GitHub中整理出的15个最受欢迎的Python开源框架。这些框架包括事件I/O,OLAP,Web开发,高性能网络通信,测试,爬虫等。 1. Django: Python Web应用开发框架 Django 应该是最出名的Python框架,GAE甚至Erlang都有框架受它影响。Django是走大而全的方向,它最...转载 2018-05-10 16:15:43 · 2283 阅读 · 0 评论 -
pycharm 中提示:this license **** has been cancelled
转载于:https://blog.csdn.net/qwdafedv/article/details/78802590sudo vim /etc/hosts在最后面加上0.0.0.0 account.jetbrains.comwq! 保存退出然后再试。activation code:EB101IWSWD-eyJsaWNlbnNlSWQiOiJFQjEwMUlXU1dEIiwibGljZ...转载 2018-11-19 14:37:29 · 17764 阅读 · 1 评论 -
linux安装PyCharm并创建桌面快捷方式
在官网下载PyCharm,传送门DownPyCharm解压PyCharm,安装 tar -zxvf pycharm.tar.gz cd /pycharm-2018.2.5/bin sh ./pycharm.sh创建快捷方式(planA):直接从安装好的pycharm的tools中创建desktop entry创建快捷方式(planB):sudo gedit /usr/shar...原创 2018-11-19 15:20:38 · 10825 阅读 · 3 评论 -
使用决策树预测隐形眼镜类型
步骤收集数据:提供的文本文件。准备数据:解析tab键分隔的数据行。分析数据:快速检查数据,确保正确的解析数据内容,使用createPlot()函数绘制最终的树形图。训练算法:使用上节的createTree()函数测试算法:编写测试函数验证决策树可以正确分类给定的数据实例。使用算法:存储树的数据结构,以便下次使用时无需重新构造树。#-×-coding=utf-8 -×-import tr原创 2017-06-16 17:26:28 · 1496 阅读 · 0 评论 -
决策树03——使用matplotlib绘制树形图并测试算法
在决策树02——决策树的构建中,我们将已经进行分类的数据存储在字典中,然而字典的表示形式非常不直观,也不容易理解,所以我们将字典中的信息绘制成树形图。Matplotlib注解功能 Matplotlib提供一个注解工具annotations,它可以在数据图形上添加文本注释。 以下将使用Matplotlib的注解功能绘制树形图,它可以对文字着色,并提供多种形状以供选择,而且我们还可以反转箭头,将它指原创 2017-06-06 22:56:57 · 3161 阅读 · 0 评论 -
python机器学习(02)
ps:没有01python机器学习课程模块贝叶斯分析从决策树到随机森林,gcForest凸优化半监督学习特征工程参考书:https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers 使用到的扩展包:PyMCPyMC安装比较困难,基于Anaconda部署比原创 2017-04-21 23:12:40 · 646 阅读 · 0 评论 -
Python安装及各个包的安装
Python安装及各个包的安装1安装python安装完成后在系统变量中,找到Path,双击;再字符串的末尾,加一个分号;然后再输入你安装python的路径2.Python自带pip将D:\Python27\Scripts添加到环境变量中即可3.安装numpy+mklpip install “numpy-1.11.2+mkl-cp27-cp27m-win32.whl”4.安装scipypip inst原创 2017-03-09 19:15:30 · 1110 阅读 · 0 评论 -
Python机器学习(01)
xgboost框架文章推荐: http://www.leiphone.com/news/201609/gox8CoyqMrXMi4L4.html 达特茅斯会议与人工智能的缘起: http://tech.163.com/16/0313/12/BI1P1CLI00094P0U.html书推荐: 维纳《控制论》 《七周七语言》 《人工智能:一种现代方法》(第三版) mark: ht原创 2017-03-13 22:08:11 · 447 阅读 · 0 评论 -
Windows下pip安装包报错:Microsoft Visual C++ 9.0 is required Unable to find vcvarsall.bat
在机器上windows环境下装上pip方便以后安装包的时候使用, 使用pip安装pysam报错在Windows10x64下使用pip安装包的时候提示报错:Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat)环境:windows10 x64 ,python2.7 ,VS2013原因:windows下使用pip安装包的时原创 2017-04-10 14:49:18 · 1343 阅读 · 0 评论 -
基因数据:使用Python处理vcf文件
使用pyvcf扩展包:good site: https://pypi.python.org/pypi/PyVCF/ http://pyvcf.readthedocs.io/en/latest/使用pysam扩展包:good site: http://pysam.readthedocs.io/en/latest/index.html http://www.cnblogs转载 2017-04-10 15:18:20 · 6531 阅读 · 0 评论 -
python 教程——next()方法
http://www.runoob.com/python/python-tutorial.htmlPython File next() 方法Python File(文件) 方法 概述next() 方法在文件使用迭代器时会使用到,在循环中,next()方法会在每次循环中调用,该方法返回文件的下一行,如果到达结尾(EOF),则触发 StopIteration语法next() 方法语法如下:fileObj转载 2017-04-10 21:58:56 · 4531 阅读 · 0 评论 -
python中yield用法
参考:http://blog.163.com/l_greatsea/blog/static/2049860442013220113640476/ http://www.cnblogs.com/fangyuan1004/p/4571304.html http://www.cnblogs.com/tqsummer/archive/2010/12/27/1917927.html h转载 2017-04-10 22:25:55 · 1168 阅读 · 0 评论 -
Python教程及vcf收藏
https://www.stavros.io/tutorials/python/https://docs.python.org/2/tutorial/https://pypi.python.org/pypi/PyVCF/http://www.mamicode.com/info-detail-166275.htmlhttp://pyvcf.readthedocs.io/en/latest/INTRO.转载 2017-04-11 15:36:20 · 1168 阅读 · 0 评论 -
linux 安装opencv——从开始到放弃……
linux 安装opencv: http://docs.opencv.org/2.4/doc/tutorials/introduction/linux_install/linux_install.html#linux-installation原创 2017-05-04 19:40:22 · 1534 阅读 · 0 评论 -
linux安装jupyter
搭建环境:deepin 15.4安装:在终端: sudo pip install jupyter notebook 即可其依赖的安装包会自动安装使用之前的版本是在终端输入: ipython notebook 即可跳转到浏览器界面打开。 虽然现在也可以用这条命令打开,但同时会提示警告:[TerminalIPythonApp] WARNING | Subcommand `ipython not原创 2017-04-22 21:43:24 · 9993 阅读 · 0 评论 -
机器学习实战—k近邻算法(kNN)02-改进约会网站的配对效果
示例:使用k-近邻算法改进约会网站的配对效果在约会网站上使用k-近邻算法: 1.收集数据:提供文本文件。 2.准备数据:使用Python解析文本文件。 3.分析数据:使用matplotlib画二维扩散图。 4.训练算法:此步骤不适用于k-近邻算法 5.测试数据:使用提供的部分数据作为测试样本。 测试样本与非测试样本的区别在于,测试样本是已经完成分类的数据,若果预测分类与实际不同,则标记为原创 2017-05-07 20:29:59 · 3899 阅读 · 2 评论 -
机器学习实战——k近邻算法(kNN)01
有监督的学习算法。简而言之,k-近邻算法采用测量不同特征之间的距离方法进行分类。工作原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。 一般来说,我们只选择样本数据集中前k个最相似的数原创 2017-05-02 01:52:06 · 859 阅读 · 0 评论 -
机器学习实战—k近邻算法(kNN)03-手写识别系统
使用k-近邻算法的手写识别系统 这里构造的系统只能识别数字0~9。 需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素×32像素的黑白图像。示例:使用k-近邻算法的手写识别系统步骤(1)收集数据:提供文本文件。 (2)准备数据:编写函数classify0(),将图像格式转换为分类器使用的list格式。 (3)分析数据:在Python命令提示符中检查数据,确保它原创 2017-05-08 23:14:16 · 1970 阅读 · 0 评论 -
django http请求request详解
转载于:https://blog.csdn.net/u011510825/article/details/50953416 Django 每一个view函数的第一个参数都是request,有没想过request里面到底有什么呢? Django使用request和response对象在系统间传递状态。当一个页面被请示时,Django创建一个包...转载 2019-02-23 21:16:04 · 3050 阅读 · 0 评论