Python
henreash
Think Differently.
展开
-
centos7 配置flask环境
首先需要安装python2.7,看一下系统是否已经安装,没有安装的话,用yum指令安装。下载python后,看一下是否安装pip,如果没有则需要安装pip安装virtualenv:pip install virtualenv;创建一个模拟目录:virtualenv /home/root/flaskenv切换到/home/root/flaskenv,执行指令:source bin/activate,原创 2017-08-11 19:43:55 · 1979 阅读 · 0 评论 -
Python机器学习----第1部分 环境安装及算法介绍
1、环境搭建 下载Python3.6版本后,双击安装程序,下一步,下一步完成安装。安装路径选择的简单些,直接C盘或D盘下即可。安装完毕后,用pip下载virtualenv后,建立虚拟环境“ScikitLearn”。在虚拟环境目录下,用pip下载NumPy、SciPy、scikit-learn、matplotlib、pandas。2、样本数据的准备 我们把数据存放在cvs文件中,使用pandas原创 2018-01-14 18:46:04 · 689 阅读 · 0 评论 -
Python机器学习----第2部分 样本数据预处理
上一章节中总结了scikit learn库中提供的机器学习算法。本节总结一下样本数据预处理相关知识。1、处理存在缺失特征的样本数据简单粗暴的方式是将含有缺失值得行或列删除:df.dropna() #删除含有缺失值的行df.dropna(axis=1) #删除含有缺失值的列df.dropna(how='all') #删除所有值都缺失的行df.dropna(thresh=原创 2018-01-15 21:53:57 · 1932 阅读 · 0 评论 -
Python机器学习----第3部分 特征抽取
上一篇文章讲解了几种特征选择方法进行降维。本篇讲解特征抽取技术,将原始数据集变换到维度更低的特征子空间。1、无监督数据降维---- 主成分分析PCA主成分分析PCA是一种无监督线性转换技术,用于降低维度。常用于股票交易数据的探索性分析和信号去燥。在高维数据中找到最大方差方向,将数据集映射到新的低维子空间上,新空间的正交坐标轴为原数据集的方差最大方向。from sklearn.decompositi原创 2018-01-16 21:16:46 · 5439 阅读 · 0 评论 -
Python机器学习----第5部分 集成学习
将不同的分类器组合成元分类器,得到更好的泛化性能,稳定性和准确性更好。在训练和预测中,最终结果采用多数投票原则。元分类器中每个子分类器都参与分类,最终结果采用少数服从多数的方式获取。集成学习可将决策树、支持向量机、逻辑斯蒂回归等方法集成在一起。1、多数投票分类器----VotingClassifierfrom xgboost.sklearn import XGBClassifierfrom sk原创 2018-01-18 17:02:05 · 1014 阅读 · 0 评论 -
Python脚本清理Winform项目下的临时文件及目录
import osimport os.pathimport shutilimport sysrootdir = sys.path[0]for parent, dirnames, filenames in os.walk(rootdir): for dirname in dirnames: pathName = os.path.join(parent, dirn原创 2018-01-26 21:46:52 · 479 阅读 · 0 评论 -
python excel操作
#coding=utf-8import osimport sysimport xlrd #pip install xlrdfrom xlrd import xldate_as_tupleimport jsonimport timefrom datetime import datetimereload(sys)sys.setdefaultencoding('utf8')relo原创 2018-01-28 19:05:47 · 413 阅读 · 0 评论