Python
memoryqiu
这个作者很懒,什么都没留下…
展开
-
[Python] 关联规则算法 Apriori
Apriori关联规则最常用也是最经典的挖掘频繁项集的算法,其核心思想是通过连接产生候选项及其支持度然后通过剪枝生成频繁项集。关联规则的一般形式(1)支持度 项集A、B同事发生的概率称为关联规则的支持度(相对支持度)P(AUB)。 (2)置信度 项集A发生,则项集B发生的概率为关联规则的置信度P(B|A)。数据示例已超市销售数据为例,提取关联规则的最大困难在于当存在很...原创 2018-06-18 23:58:47 · 4164 阅读 · 2 评论 -
[Python] 相关性分析
餐饮销量数据相关性分析分析菜品销售量之间的相关性得到不同菜品之间的关系,比如是替补菜品、互补菜品或者没有关系,为原材料采购提供参考。数据源示例: #-*- coding: utf-8 -*-#餐饮销量数据相关性分析import pandas as pdcatering_sale = '../data/catering_sale_all.xls' #餐饮数据,含有其他属性da...原创 2018-06-09 11:54:30 · 8730 阅读 · 0 评论 -
[Python] 贡献度分析
贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。对餐饮企业来讲,应用贡献度分析可以重点改善某菜系盈利最高的前80%的菜品。这种结果可以通过帕累托图直观地呈现出来。 如某月菜品盈利数据: 菜品盈利帕累托图代码#-*- coding: utf-8 -*-#菜品盈利数据 帕累托图import pandas as pd#初始化参数dish_profit =...原创 2018-06-09 11:31:11 · 6197 阅读 · 0 评论 -
[Python] Pandas安装与基本操作
安装安装完Numpy后,直接使用pip install pandas 进行安装支持excel读写,安装读取xlrd和写入xlwt库 pip install xlrd #为python添加读取excel功能 pip install xlwt #为python添加写入excel功能简单例子>>> import原创 2018-06-08 22:16:29 · 5170 阅读 · 2 评论 -
[Python数据预处理] 规范化(归一化)
数据规范化为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。数据规范化方法主要有: - 最小-最大规范化 - 零-均值规范化数据示例代码实现#-*- coding: utf-8 -*-#数据规范化import pandas as pdimport numpy ...原创 2018-06-20 21:51:00 · 7841 阅读 · 1 评论 -
[Python数据预处理] 异常值检测 (箱型图) & 统计量分析
1. 箱型图分析1、对数据没有作任何限制性要求(如服从某种特定的分布形式),它只是真实直观地表现数据分布的本来面貌; 2、判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的鲁棒性:多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响。数据示例代码实现#-*- coding: utf-8 -*-import pandas as ...原创 2018-06-20 21:31:30 · 15092 阅读 · 0 评论 -
[Python习题] 常见题系列三
1. 字典d={“k”:1,”v”:2},请写出d.items()的结果。d={"k":1,"v":2}print(d.items())dict_items([('k', 1), ('v', 2)])2.复杂列表[{“k”:1,”v”:2},{“k”:12,”v”:22},{“k”:13,”v”:32}],请用内置方法写出k的倒序排列的代码。li = [{&quot原创 2018-05-23 15:32:31 · 637 阅读 · 0 评论 -
[Python习题] 常见题系列二
1. python中tuple和list的转换tuple1 =(1,2,3)list1 = list(tuple1)list1[1, 2, 3]tuple2 = tuple(list1)tuple2(1, 2, 3)2. 介绍一下except的用法和作用 try: passexcept Exception as e: print(e)finall...原创 2018-05-23 15:08:55 · 719 阅读 · 0 评论 -
[Python作图] Matplotlib安装与基本作图
安装Matplotlib通过pip安装Matplotlib步骤: 进入到CMD窗口下,在命令提示符中依次输入python -m pip install -U pip setuptools python -m pip install matplotlib Matplotlib作图的基本代码>>> import numpy原创 2018-06-04 00:36:18 · 4578 阅读 · 0 评论 -
[Python] Numpy安装与基本操作
Numpy扩展包提供了数组功能,以及对数据进行快速处理的函数。Numpy基本操作实例>>> pip install numpy #通过pip安装numpy>>> import numpy as np #一般以np作为numpy的别名&原创 2018-06-04 00:05:49 · 625 阅读 · 0 评论 -
[Python习题] 常见题系列一
参考文章: https://blog.csdn.net/weixin_40862231/article/details/795044551. python中is和==的区别Python中的对象包含三要素:id、type、value。 其中id用来唯一标识一个对象,type标识对象的类型,value是对象的值。 is判断的是a对象是否就是b对象,是通过id来判断的。 ==判断的是...原创 2018-05-23 12:23:22 · 623 阅读 · 0 评论 -
[Python作图] 基本作图函数plot折线图 & pie饼图 & hist直方图 & boxplot箱型图
在作图之前,通常加载一下代码import matplotlib.pyplot as plt #导入图像库plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号plt.figure(figsize = (7,5)) #创建图像...原创 2018-06-09 13:34:33 · 2346 阅读 · 0 评论 -
[Python] 一元线性回归分析实例
本文通过一个简单的例子:预测房价,来探讨怎么用python做一元线性回归分析。1. 预测房价房价是一个很火的话题,现在我们拿到一组数据,是房子的大小(平方英尺)和房价(美元)之间的对应关系,如下(csv数据文件):No,square_feet,price 1,150,6450 2,200,7450 3,250,8450 4,300,9450 5,350,11450 6,...原创 2018-06-24 15:22:54 · 11489 阅读 · 0 评论 -
[Python聚类] 离散点检测 (K-Means聚类方法)
聚类分析用于发现局部强相关的对象组,而异常检测用来发现不与其他对象强相关的对象。 因此,聚类分析可以用于离散度检测。诊断步骤进行聚类。选择聚类算法(如K-Means算法),将样本集聚K簇,并找到各簇的质心。计算各对象到它的最近质心的距离。计算各对象到它的最近质心的相对距离。(相对距离是点到质心的距离与簇中所有点到质心的距离的中位数之比)与给定的阈值作比较。如果某对象距离...原创 2018-06-18 22:40:54 · 18014 阅读 · 5 评论 -
[Python聚类] 用TSNE进行数据降维并展示聚类结果
聚类结果可视化工具TSNE#-*- coding: utf-8 -*-#接博客[Python] K-Means聚类算法分类中的代码from sklearn.manifold import TSNEtsne = TSNE()tsne.fit_transform(data_zs) #进行数据降维tsne = pd.DataFrame(tsne.embedding_, index =...原创 2018-06-10 18:32:11 · 13199 阅读 · 1 评论 -
[Python聚类] K-Means聚类算法分类
根据数据将客户分类成不同客户群,并评价这些客户群的价值。数据示例部分餐饮客户的消费行为特征数据如下: 方法采用K-Means聚类算法,设定聚类个数为3,最大迭代次数为500次,距离函数取欧式距离。代码实现#-*- coding: utf-8 -*-#使用K-Means算法聚类消费行为特征数据import pandas as pd#参数初始化inputfil...原创 2018-06-10 15:01:11 · 8625 阅读 · 1 评论 -
[Python] 决策树算法分类
构建模型分析天气、是否周末和是否有促销活动对销量的影响。数据示例代码实现#-*- coding: utf-8 -*-#使用ID3决策树算法预测销量高低import pandas as pd#参数初始化inputfile = '../data/sales_data.xls'data = pd.read_excel(inputfile, index_col = u'...原创 2018-06-10 14:11:45 · 821 阅读 · 1 评论 -
[Python] 逻辑回归分析
数据示例以某银行贷款拖欠率数据进行逻辑回归建模,数据示例如下: 逻辑回归分析步骤特征筛选:本例采用稳定性选择方法中的随机逻辑回归建立模型:利用筛选后的特征建立逻辑回归模型输出平均正确率实现代码#-*- coding: utf-8 -*-#逻辑回归 自动建模import pandas as pd#参数初始化filename = '../data/ban...原创 2018-06-10 11:57:57 · 2036 阅读 · 0 评论 -
[Python] 直接赋值、浅拷贝和深度拷贝解析
Python 直接赋值、浅拷贝和深度拷贝解析参考文章链接: http://www.runoob.com/w3cnote/python-understanding-dict-copy-shallow-or-deep.html直接赋值:其实就是对象的引用(别名)。 浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象。 深拷贝(deepcopy): copy 模块的 deepcop...转载 2018-06-17 16:53:21 · 524 阅读 · 0 评论 -
[Python] 主成分分析降维
数据示例实现代码#-*- coding: utf-8 -*-#主成分分析 降维import pandas as pd#参数初始化inputfile = '../data/principal_component.xls'outputfile = '../tmp/dimention_reducted.xls' #降维后的数据data = pd.read_excel(in...原创 2018-06-09 23:34:12 · 14298 阅读 · 4 评论 -
[Python数据预处理] 缺失值处理
在训练一个模型之前需要做数据的预处理,因为模型的最终效果决定于数据的质量和数据中蕴含的有用信息的数量。 在实际的模型的训练样本数据中,样本可能会由于某些原因,造成一个或多个值的缺失。可能由于样本采集过程中的失误,或者度量方法对于某些特征不适用,或者数据未被填写等。在表格中缺失值通常是以空值的形式或者是NaN(Not A Number)存在的。如果我们直接忽视这些缺失值可能有些算法无法处理这些缺失...原创 2018-06-24 22:41:00 · 8706 阅读 · 2 评论 -
[Python数据预处理] 连续数据离散化:等宽法 & 聚类分析法
需要离散化的数据示例:实现代码#-*- coding: utf-8 -*-#数据规范化import pandas as pddatafile = '../data/discretization_data.xls' #参数初始化data = pd.read_excel(datafile) #读取数据data = data[u'肝气郁结证型系数'].copy()k = 4...原创 2018-06-09 18:11:21 · 9995 阅读 · 0 评论 -
[Python] pandas (ix & iloc &loc) 的区别
本文转载自:https://blog.csdn.net/hecongqing/article/details/61927615loc——通过行标签索引行数据 iloc——通过行号索引行数据 ix——通过行标签或者行号索引行数据(基于loc和iloc 的混合) 同理,索引列数据也是如此!举例说明: 1、分别使用loc、iloc、ix 索引第一行的数据: (1)loci...转载 2018-06-09 17:53:10 · 4719 阅读 · 0 评论 -
[Python函数] 内建函数map & reduce 与 匿名函数 lambda
mapmap() 会根据提供的函数对指定序列做映射。 map() 函数语法: map(function, iterable, ...)def square(x): return x ** 2print(map(square, [1,2,3,4,5]))[1, 4, 9, 16, 25]reducereduce()函数会对参数序列中元素进行累积。 函数将一个数据...原创 2018-05-14 11:10:43 · 397 阅读 · 0 评论 -
[Python] 循环与条件判断
1. while 循环#!/usr/bin/python# -*- coding: UTF-8 -*-import strings = input('请输入一个字符串:\n')letters = 0space = 0digit = 0others = 0i=0while i < len(s): c = s[i] i += 1 if c.isal...原创 2018-05-13 15:51:07 · 466 阅读 · 0 评论 -
[Python时间相关] 格式化当前时间 strftime
from datetime import *import timeprint(datetime.now())2018-05-13 15:32:58.690266tdate = datetime.now().strftime("%Y-%m-%d") #获取年月日thour = datetime.now().strftime("%H") #获取小时原创 2018-05-13 15:40:04 · 955 阅读 · 0 评论 -
[Python时间相关] 推迟调用线程的运行 time sleep()
Python time sleep() 函数推迟调用线程的运行,可通过参数secs指秒数,表示进程挂起的时间。 sleep()方法语法: time.sleep(t) 参数 t – 推迟执行的秒数。 返回值 该函数没有返回值。 实例 以下实例展示了 sleep() 函数的使用方法: 实例#!/usr/bin/pythonimport timeprint "Start ...原创 2018-05-13 15:37:12 · 4924 阅读 · 0 评论 -
[Python基础] 获取控制台的输入input( )
python3 input() 用来获取控制台的输入。 input() 将所有输入作为字符串看待,返回字符串类型。函数语法 input([prompt]) 参数说明: prompt: 可选,字符串,可作为一个提示语。实例>>>a = input("input:") input:123>&原创 2018-05-06 21:58:52 · 6079 阅读 · 0 评论 -
[Python函数] 创建整数列表 range( )
python range() 函数可创建一个整数列表,一般用在 for 循环中。>>>range(10) # 从 0 开始到 10[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]>>> range(原创 2018-05-06 21:40:14 · 13634 阅读 · 0 评论 -
[Python字符串] 字符串分割 split()
Python split()通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串 str.split(str="", num=string.count(str)) 参数 str – 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。 num – 分割次数。#!/usr/bin/pythonstr = &a原创 2018-05-06 21:33:17 · 3047 阅读 · 0 评论 -
[Python字符串] 移除字符串头、尾指定的字符strip() rstrip()
1. Python strip() 方法用于移除字符串头尾指定的字符(默认为空格)#!/usr/bin/python# -*- coding: UTF-8 -*-str = "0000000 Runoob 0000000"; print str.strip( '0' ); # 去除首尾字符 0str2 = " Runoob ";原创 2018-05-06 20:26:28 · 13093 阅读 · 0 评论 -
[Python字符串] 字符串连接、重复和格式化
1. 字符串加号(+)是字符串连接运算符,星号(*)是重复操作。如下实例: str = ‘Hello World!’ print str # 输出完整字符串 print str[0] # 输出字符串中的第一个字符 print str[2:5] # 输出字符串中第三个至第五个之间的字符串 print str[2:] # 输出从第...原创 2018-05-06 20:21:08 · 16117 阅读 · 1 评论 -
[Python基础] 环境变量中添加Python目录 & pip目录
在 Windows 设置环境变量1. 在环境变量中添加Python目录在命令提示框中(cmd) : 输入 path=%path%;C:\Program Files\Python36 C:\Program Files\Python36是Python的安装目录。 可在控制台出入命令:Python2. 在环境变量中添加pip目录用CD命令进入 pip 解压目录,输入 pyth...原创 2018-05-06 20:14:51 · 1872 阅读 · 0 评论 -
[Python基础] 语法知识点
Python 中的标识符是区分大小写的。Python 可以同一行显示多条语句,方法是用分号 ; 分开Python 的代码块不使用大括号 {} 来控制类,函数以及其他逻辑判断。python 最具特色的就是用缩进来写模块。 缩进相同的一组语句构成一个代码块,我们称之代码组。 像if、while、def和class这样的复合语句,首行以关键字开始,以冒号( : )结束,该行之后的一行或多行代码...原创 2018-05-06 20:07:24 · 194 阅读 · 0 评论 -
[Python字符串] 将序列中的元素以指定的字符连接 join( )
Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。 join()方法语法: str.join(sequence)#!/usr/bin/python# -*- coding: UTF-8 -*-#例子1 str = "-";seq = ("a", "b",原创 2018-05-13 15:57:11 · 6419 阅读 · 0 评论 -
[Python基础] Python程序执行方式
1. 在Python交互式模式下:(它的提示符是>>>)可以直接输入代码,然后执行,并立刻得到结果。 exit()退出交互模式2. 在命令行模式下:在Windows开始菜单选择“命令提示符cmd”,它的提示符类似C:\>:可以直接运行.py文件。必须先把当前目录切换到hello.py所在的目录下,python h原创 2018-05-13 16:08:12 · 2578 阅读 · 0 评论 -
[Python函数] 格式化函数format
Python 格式化函数format 基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数,位置可以不按顺序。实例>>>"{} {}".format("hello", "world原创 2018-05-14 10:56:49 · 858 阅读 · 0 评论 -
[Python函数] 函数的可变参数
可变参数在Python函数中,还可以定义可变参数。顾名思义,可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,还可以是0个。 我们以数学题为例子,给定一组数字a,b,c……,请计算a2 + b2 + c2 + …… 我们把函数的参数改为可变参数:def calc(*numbers): sum = 0 for n in numbers: s...原创 2018-05-14 10:53:48 · 258 阅读 · 0 评论 -
[Python函数] 函数作为参数传入
把函数作为参数传入,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式。def add(x, y, f): return f(x) + f(y)print(add(-5,6,abs))原创 2018-05-14 10:47:04 · 698 阅读 · 0 评论 -
[Python] 列表生成式
列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。>>> [x * x for x in range(1, 11)] #一定要有[] ,因为是列表,否则报错[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]写列表生成式时,把要生成的元素x * x放到前面,后面跟for...原创 2018-05-14 10:44:24 · 579 阅读 · 0 评论