自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

转载 读取指定文件夹里多个excel表,并将所有excel表数据整合到一个excel中

1、找出指定文件夹里的所有文件#-*- encoding: utf-8 -*-# 找出指定文件夹里的所有文件import osfilePath = 'C:\\Users\\lzk\\Desktop\\H_totall_data\\data\\'filearray=os.listdir(filePath)print(filearray)2、读取指定文件夹里多个ex...

2019-03-25 11:23:36 13551 2

原创 Python全局变量和局部变量

#names = ['laowang', 'laozhao', 'laoliu']student = {'name':'xiaoming'}a = 'laowang'b = 100# 在函数中修改全局变量:# 1、如果是可变类型(列表、字典)(不可变类型是指其值不可变,改变的只是标签指引的对象,对于没被引用的值,python会自动回收)可以执行修改变量的值;# 2、如果全局变量是不...

2019-03-22 09:37:25 458

转载 关联规则—Apriori算法实现

1、Apriori算法函数#-*- coding: utf-8 -*-from __future__ import print_functionimport pandas as pd#自定义连接函数,用于实现L_{k-1}到C_k的连接def connect_string(x, ms): x = list(map(lambda i:sorted(i.split(ms)), x)...

2019-02-22 10:13:56 1398

转载 Python基础——pandas常用函数

大神博客:https://blog.csdn.net/luanpeng825485697/article/details/805330031、Series()一个series是一个一维的数据类型,其中每一个元素都有一个标签。类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。如:import pandas as pds = pd.Series([1, 2...

2019-02-18 16:21:54 433

转载 Python基础——格式化

一、格式化我们经常会输出类似'亲爱的xxx你好!你xx月的话费是xx,余额是xx'之类的字符串,而xxx的内容都是根据变量变化的,所以,需要一种简便的格式化字符串的方式。 在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:你可能猜到了,%运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者...

2019-01-23 17:23:36 89

原创 Logistic回归分析

逻辑回归分析1、代码import pandas as pdimport numpy as np#import xlwtimport xlrdfilename = 'E:/data/chapter5/demo/data/bankloan.xls' #文件路径#outputfile= r'E:\data\chapter4\demo\data\output_principal_co...

2019-01-23 17:21:11 901

转载 《Python数据分析与挖掘实战》学习笔记主成分分析(PCA)

一、简介主成分分析是一种用于连续属性的数据降维方法,它构造了原始数据的一个正交变换,新空间的基底去除了原始空间基底下数据的相关性,只需使用少数新变量就能够解释原始数据中的大部分变异。在应用中,通常是选出比原始变量个数少,能解释大部分数据中的变量的几个新变量,即所谓主成分,来代替原始变量进行建模。 二、Python程序实现在Python中,主成分分析的函数位于Scikit-Learn...

2019-01-22 10:50:50 1069

转载 《Python数据分析与挖掘实战》学习笔记之数据离散化

数据离散化1、等宽离散化:将属性的值域分为具有相同宽度的区间。        采用pandas.cut()函数,cut有三个参数,第一个是数据,第二个参数表示分为k份,第三个参数为标签labels。 pandas.cut(data,3,labels=["便宜","适中","贵"])#将数据data分为3等份,标签为便宜、适中、贵如: 2、等频率离散化:将相同数据的记录放进每...

2019-01-21 16:07:24 646

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除