自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 资源 (4)
  • 收藏
  • 关注

原创 Origin非线性拟合选项

Origin Basic Functions 原点基本功能allometric1 异速生长BetaBoltzmanndHyperblExpAssocExpDec1ExpDec2ExpDec3ExpGrow1ExpGrow2GaussGaussAmpHyperblOrigin Basic Functions 原点基本功能Convolution 卷积Exponential 指数的Growth/Sigmoidal 生长/ S形Hy

2022-04-21 08:47:35 4140

原创 python 基础

# s= string 字符串# d= digital 数字# f= float 小数点name = 'molly'age = 25friend = 'tony'city = 'zhengzhou'credit = 16.6weight = 10.299print('我的名字是%s, 我的年龄是%d, 我的朋友是%s, 我的城市是%s, 我的信用是%f, 我的体重是%.2f kg'%(name,age,friend,city,credit,weight))print(f'我的名字是{na

2021-05-14 11:06:52 115

原创 获取百度网盘提取码的两种方法

法1import stringimport randomcode = ''.join(random.sample((string.digits + string.ascii_lowercase), 4)) #sample组合随机4个print(code)法2import randomall_raw_code = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd',

2021-05-14 09:07:22 28775 2

原创 混淆矩阵

《python机器学习实例》混淆矩阵(confusion matrix)是理解分类模型性能的数据表,它有助于我们理解如何把测试数据分成不同的类。当想对算法进行调优时,就需要在对算法做出改变之前了解数据的错误分类情况。有些分类效果比其他分类效果更差,混淆矩阵可以帮助我们理解这些问题。先看看如图2-8所示的混淆矩阵。在图2-8中,我们可以看出不同类型的分类数据。理想情况下,我们希望矩阵非对角线元素都是0,这是最完美的分类结果。先看看class 0,一共52个样本属于class 0。如果对第一行数据求和,.

2021-04-26 14:06:19 1754

原创 带AdaBoost算法的决策树回归器(decision tree regressor)

Python机器学习经典实例准备工作决策树是一个树状模型,每个节点都做出一个决策,从而影响最终结果。叶子节点表示输出数值,分支表示根据输入特征做出的中间决策。AdaBoost算法是指自适应增强(adaptive boosting)算法,这是一种利用其他系统增强模型准确性的技术。这种技术是将不同版本的算法结果进行组合,用加权汇总的方式获得最终结果,被称为弱学习器(weak learners)。AdaBoost算法在每个阶段获取的信息都会反馈到模型中,这样学习器就可以在后一阶段重点训练难以分.

2021-04-26 11:14:56 1368 2

原创 预处理和特征提取1

数据预处理归一化处理可统一数据量纲,便于不同单位和量级数据进行计算。常用方法:0-1标准化Z_score标准化sigmoid标准化其中0-1标准化方法如果在有新值加入的时候,可能会改变值域区间的最大值和最小值。当训练数据集中含有过大异常值,会使得原有的正常值非常小,不便于模型训练。而sigmoid标准化可能会使得原有传感器数值过大的数据全都变化为同一数值,使得数据信息丢失。解决数据延迟相关问题若数据之间存在延迟相关,使用曲线排齐算法使得原有数据重新拥有相关性。基本思路:计算两个

2021-04-25 11:05:33 945

原创 python 使用Kmeans进行图像压缩

from skimage import iofrom sklearn.cluster import KMeansimport numpy as npimage = io.imread('企鹅.png')io.imshow(image)io.show()rows = image.shape[0]cols = image.shape[1]image = image.reshape(image.shape[0]*image.shape[1],3)Kmeans = KMeans(n_clus

2021-04-20 13:51:58 378

原创 python设置数据透视表

import pandas as pdimport numpy as npdf = pd.DataFrame([ ['张三','语文',98.], ['张三','体育',60.], ['李四','数学',60.], ['李四','语文',100.], ['王五','数学',89], ['王五','体育',98.]

2021-04-20 13:50:05 135

原创 决策树

决策树(Decision Tree)决策树学习是根据数据的属性采用树状结构建立的一种决策模型,可以用此模型解决分类和回归问题。常见的算法包括 CART(Classification And Regression Tree), ID3, C4.5等。我们往往根据数据集来构建一棵决策树,他的一个重要任务就是为了数据中所蕴含的知识信息,并提取出一系列的规则,这些规则也就是树结构的创建过程就是机器学习的过程。学习地址:http://pytlab.github.io/2017/07/09/%E6%9C%BA%E

2021-04-14 17:04:29 113

转载 数学建模七日谈

非原创非原创非原创,很有道理所以分享过来转载于 http://www.madio.net/forum-160-1.html分享一共分为七个部分,分七天写给大家,下面是第一个部分:参加全国大学生数学建模比赛前你需要积累哪些。1 参加全国大学生数学建模需要积累大家知道,数学模型是一个庞大的议题,关于它的各种资料、知识点也是浩如烟海,难免会让很多初学者不知所措,很多同学在准备过程中觉得无从下手,因为感觉到学过的东西比赛中好像都没有用,然而比赛的时候又没有自己的思路,很是苦恼,导致很多同学中途放弃

2021-04-14 16:23:17 589

原创 决策树分支dot转存pdf

进入 Graphviz 安装的文件夹bin的目录在空白处右键,选择Git Bush Here,出现黑框$ ./dot.exe -Tpdf /c/exp.dot -o /c/exp.pdf/c/exp.dot __dot文件地址/c/exp.pdf __准备输出的pdf文件地址

2021-04-14 14:49:32 254

原创 生成100行 50列的随机浮点数,浮点数范围 : (0,1)

np.random.random((100, 50))

2021-03-23 10:44:34 296

转载 python 数据转矩阵

在用sklearn进行模型预测时发现了几次同样的报错:ValueError: Expected 2D array, got 1D array instead:array=XXXXXReshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.这是因为在新版sklearn中,所有数.

2021-03-12 14:58:18 363

转载 python数据标准化简单处理、归一化、正态化

# 导入归一化方法from sklearn.preprocessing import MinMaxScalermms = MinMaxScaler()# 调用方法对数据进行归一化处理data['X_train'] = mms.fit_transform(data['X_train'])X_train :需要做归一化处理的数据列、或者数据框2 正态标准化使用环境:线性回归需要数据呈现正态分布趋势、其他的聚类等及机器学习的场景from sklearn.preprocessing i

2021-03-12 14:56:50 2155 1

原创 python 色彩盘

from bokeh.palettes import Dark2_5 as palette# itertools handles the cyclingimport itertoolscolors = itertools.cycle(palette)

2021-03-11 19:52:22 172

原创 python 删除某行、某一列

data_a =pd.DataFrame(data[:-1])#删除最后一行print(data_a)

2021-03-11 19:31:46 924

原创 滑动滤波并填充空值

ymean =y.rolling(window=12).mean()#滑动窗口取平均值,我取了12个ymean[ymean.isnull()] = y[ymean.isnull()]#a列中的空值用b列中的对应值填充print(ymean)

2021-03-10 17:05:31 194

原创 删除空行和含有特定数值的行

df = pd.read_csv(r'C:\Users\user\pythonProject\venv\2021数据\工作簿1.csv')print(df.head())df.dropna(axis=0, how='any', inplace=True)#删除空行a = df[df['log_time'].isin(['log_time'])]# 找出包含数值"log_time“的所有行(要删除的行)print(a)data = df[~(df['log_time'].isin(['log_ti

2021-03-10 11:42:59 153

原创 生成for循环填充列表

newlist = [list(range(4)) for _ in range(2)]newlistA = sum(newlist, [])print(newlistA)> [0, 1, 2, 3, 0, 1, 2, 3]newlist = []for x in range(2): newlist.append(list(range(4)))newlistA1 = sum(newlist, [])print(newlistA1)> [0, 1, 2, 3, 0,

2021-03-09 17:05:04 274

转载 列表含有子列表展开成一个列表,列表的扁平化

元素都为列表listA = [[‘a’], [‘b’], [‘c’, ‘d’]] 展开成:listA1 = [‘a’, ‘b’, ‘c’, ‘d’]方法1:listA1 = sum(listA, []) 方法2:listA1 = [x for j in listB for x in j]方法3:from functools import reducea=[[1,2,3],[4,5,],[6]]a=reduce(lambda x,y:x+y,a)a = [1, 2, 3, 4,

2021-03-09 16:54:24 94

转载 python常用标准库sys和os

https://cloud.tencent.com/developer/article/1559758?from=article.detail.1640799

2021-03-09 08:37:56 113

原创 删除指定列的重复项所在行并保留第一次出现的项

data.drop_duplicates('长度实际值', keep='first', inplace=True)#删除指定列的重复项所在行并保留第一次出现的项,默认是所有列;inplace :直接在原来数据上修改还是保留一个副本

2021-03-08 09:18:06 523

原创 提取同一文件夹下所有文件的同一列

import pandas as pdimport osfrom pandas import Series, DataFramedir =r'C:\Users\user\pythonProject\venv\数据\Raw data'#设置工作路径#新建列表,存放文件名(可以忽略,但是为了做的过程能心里有数,先放上)filename_excel = []#新建列表,存放每个文件数据框(每一个excel读取后存放在数据框)frames = []af = pd.DataFrame()for

2021-03-05 11:02:43 230 1

原创 StratifiedKFold交叉验证使用举例

import numpy as npfrom sklearn.model_selection import StratifiedKFoldx = np.array([[1,2], [3,4], [1,2], [3,4],[5,6],[7,8]])y = np.array([0, 0, 1, 1,1,0])#n_splits代表几折交叉,要能被样本个数整除才行,返回的是所有的分割结果的下标,分别轮着做测试集skf = StratifiedKFold(n_splits=3).split(x, y)f

2021-03-04 09:00:00 876 2

原创 DOT可视化

import graphvizwith open("CCF6460Y副本22.dot") as f: dot_graph = f.read()dot=graphviz.Source(dot_graph)dot.view()#dot文件可视化,哪里需要放哪里

2021-02-22 16:39:12 1297

原创 python 学习笔记(一)20201103

数学操作符的操作顺序与数学中类似。若需要,可使用括号改变优先级。在用于两个整型或浮点型值时,* 操作符表示乘法。但 * 操作符用于一个字符串值和一个整型值时,它变成了“字符串复制”操作符。print('alice'*5)alicealicealicealicealice变量用小写字母开头时Python的惯例,具有描述性的名字有助于提高代码可读性。Numpy库Numpy.array()中类型需一致,若不一致numpy会自动统一格式Import numpy as npPrint(np.ara

2020-11-04 09:23:18 101

原创 python 记录loc和iloc提取行列

import pandas as pddf = pd.DataFrame(data=[[1,2,3,3],[2,3,4,5],[5,5,8,9]],index=[0,'c','可爱'],columns=['a','b','c','d'])print(df)print(df.loc[0])# loc索引行,label是整型数字print(df.loc['c'])# loc索引行,label是字符型(loc索引行,label是整型数字或字符型都可)print(df.loc['c':])# loc索引多

2020-10-15 15:46:19 5151

上海第二工业大学--鸡蛋餐餐见,品牌谁优选——上海市正大品牌鸡蛋消费驱动与障碍研究.pdf

上海第二工业大学--鸡蛋餐餐见,品牌谁优选——上海市正大品牌鸡蛋消费驱动与障碍研究.pdf

2021-05-07

“爸爸妈妈,我从哪里来?”---基于五地家庭性教育现状及差异调查分析报告.pdf

“爸爸妈妈,我从哪里来?”---基于五地家庭性教育现状及差异调查分析报告.pdf

2021-05-07

“轻食主义,精致生活”——关于北京市消费者轻食消费的调查与分析.pdf

“轻食主义,精致生活”——关于北京市消费者轻食消费的调查与分析.pdf

2021-05-07

同一文件夹下所有文件间隔取值并合并.txt

python 快速合并同一文件夹下相同类型的文件,且可以以间隔距离采点合并

2021-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除