Python
文章平均质量分 73
Carolinedy
这个作者很懒,什么都没留下…
展开
-
在 Windows 中通过 pip 安装 Numpy,Scipy,Matplotlib,Pandas,StatsModels,Scikit-Learn,PyWavelets,Graphviz,TSNE
NumpyNumpy 提供数组支持,以及相应的高效处理函数。由于 Numpy 还是很多高级扩展库的依赖库,通常在安装其他扩展库之前,需要完成 Numpy 的安装。Downloads:点击打开链接 https://pypi.org/project/numpy/#files在 Windows 中,可以通过 pip 安装:在 pi...原创 2018-05-22 10:45:27 · 4191 阅读 · 0 评论 -
如何查找python模块放在计算机的什么位置
如何查找python模块放在计算机的什么位置在IDLE中运行以下命令:import sys;sys.path如何获取当前工作目录:导入 OS 模块,并运行以下命令:import osos.getcwd()如何切换目录:import osos.chdir('要切换的目录,相对于当前目录的相对路径')怎样在python代码中加入注释?使用三组双引号:""...原创 2018-11-08 15:51:56 · 1879 阅读 · 0 评论 -
PyMySQL 的依赖库
在 Python 中,Pandas 库本身可以利用 read_sql( ) 函数来读取数据库,但是它依赖于 SQLAlchemy, 而SQLAlchemy 又依赖于 PyMySQL。因此,安装 SQLAlchemy 前,需要安装 PyMySQL安装 PyMySQL 前,需要先安装依赖库:cryptography安装 cryptography 前,需要先安装以下依赖库: cffi. ...原创 2018-10-16 10:54:34 · 1614 阅读 · 0 评论 -
Python 访问数据库(Pandas)
若要使用 pandas 读取数据库文件 read_sql,需要知道以下依赖:依赖SQLAlchemy库,而SQLAlchemy库依赖于 PyMySQL。Pandas在读取数据(csv、xls、sql),都是将全部数据读入内存中,因此在数据量较大时难以实现。所以pandas提供了 chunksize参数,以分块读取大数据文件。import pandas as pdfrom sqlalch...原创 2018-09-04 15:28:36 · 1186 阅读 · 0 评论 -
关联规则——基于 Python 的 Apriori 算法实现
Apriori 核心思想:通过连接产生候选项与其支持度,然后通过剪枝生成频繁项集。关键概念:项集:项的集合。包含 k 个项的项集称为 k 项集,如{a,s,d}是一个3项集。 支持度:项集A、B同时发生的概率。 最小支持度:项集在统计意义上的最低重要性。 置信度:项集A发生,则项集B发生的概率。 最小置信度:关联规则的最低可靠性。 同时满足最小支持度阈值和最小置信度阈值的规则称作...原创 2018-07-12 16:59:25 · 3517 阅读 · 2 评论 -
基于 Python 的时序模型——AMIRA模型
时间序列分析的目的:给定一个已被观测了的时间序列,预测该序列的未来值ARIMA 模型:如果一个时间序列经差分运算后具有平稳性,则该序列为差分平稳序列,可以使用 ARIMA 模型进行分析。时间序列的预处理: 平稳性检验: 时序图检验:平稳序列的时序图显示该序列值始终在一个常数附近随机波动,而且波动范围有界; ...原创 2018-07-17 11:26:05 · 5873 阅读 · 2 评论 -
利用决策树 ID3 算法进行预测
决策树:决策树方法在分类、预测、规则提取等领域被广泛应用决策树是树状结构,它的每一个节点对应着一个分类,非叶节点对应着在某个属性上的划分,根据样本在该属性上的不同取值将其划分城若干个子集。构造决策树的核心问题是在每一步如何选择适当的属性对样本做拆分。对一个分类问题,从一直分类标价的训练样本中学习并构造出决策树是一个自上而下,分而治之的过程。ID3算法:基于信息熵来选择最佳测...原创 2018-06-20 15:22:16 · 4083 阅读 · 0 评论 -
K-Means 聚类算法分析客户群价值
K-Means 算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预订的类树 K,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度越大。度量样本之间的相似性最常用的是 欧几里得距离、曼哈顿距离和闵可夫斯基距离;(Scikit-Learn 中的 KMeans 算法仅仅支持欧氏距离,因为采用其他的距离并不一定能够保证算法的收敛性。)度量聚类质量的目标函数...原创 2018-06-22 17:30:18 · 5739 阅读 · 0 评论 -
使用随机逻辑回归进行特征筛选,并利用筛选后的特征建立逻辑回归模型
from sklearn.linear_model import LogisticRegression as LRfrom sklearn.linear_model import RandomizedLogisticRegression as RLRrlr=RLR() #建立随机逻辑回归模型,筛选变量rlr.fit(x,y) #训练模型rlr.get_support() #获取特征...原创 2018-06-14 14:51:54 · 10152 阅读 · 6 评论 -
关于Python函数传参误区的几点总结
Remeber that arguments are passed by assignment in Python Python 里的参数是通过赋值传递的 Since assignment just creates references to objects, there's no alias between an argument name in the caller and callee, ...原创 2018-06-14 10:55:16 · 831 阅读 · 1 评论 -
pandas中利用 .iloc 和 .loc 选取数据
Pandas 基本的数据结构是 Series(数组) 和 DataFrame(类似二维数组),Pandas 提供了 Index 对象,每个 Series 都会带有一个对应的Index,用来标记不同的元素,Index 的内容不一定是数字,也可以是字母、中文等,它类似于SQL中的主键Pandas 读取文件时候,注意文件的存储路径不能带有中文,否则读取可能出错。.iloc:根据标签的所在位置,从...原创 2018-06-13 17:24:18 · 31514 阅读 · 1 评论 -
使用 Python 进行数据预处理中用到的各个扩展库及对应函数 拉格朗日插值法,主成分分析等
一、数据清洗 删除原始数据集中的无关数据、重复数据,平滑噪声数据,处理缺失值、异常值。缺失值处理 删除缺失值、数据插补、不处理 Scipy:拉格朗日插值法 from scipy.interpolate import lagrange#导入拉格朗日插值函数 ...原创 2018-06-12 11:51:50 · 1641 阅读 · 0 评论 -
Python 函数 lambda( ), map( ), reduce( ), filter( ) 举例详解
Python 支持用 lambda 对简单的功能定义 “行内函数”1.例如:f= lambda x: x+2 #定义函数 f(x)=x+2g= lambda x,y: x+y #定义函数 g(x,y)=x+y2.map( )函数用于逐一遍历a= [1,2,3]b=map(lambda x,y: x*y,a,b) #将a,b两个列表的元素对应相乘...原创 2019-09-25 14:17:00 · 270 阅读 · 0 评论