大熊M-CSDN博客

原创 Origin非线性拟合选项

Origin Basic Functions 原点基本功能allometric1 异速生长BetaBoltzmanndHyperblExpAssocExpDec1ExpDec2ExpDec3ExpGrow1ExpGrow2GaussGaussAmpHyperblOrigin Basic Functions 原点基本功能Convolution 卷积Exponential 指数的Growth/Sigmoidal 生长/ S形Hy

2022-04-21 08:47:35 4144

原创 python 基础

# s= string 字符串# d= digital 数字# f= float 小数点name = 'molly'age = 25friend = 'tony'city = 'zhengzhou'credit = 16.6weight = 10.299print('我的名字是%s, 我的年龄是%d, 我的朋友是%s, 我的城市是%s, 我的信用是%f, 我的体重是%.2f kg'%(name,age,friend,city,credit,weight))print(f'我的名字是{na

2021-05-14 11:06:52 115

原创获取百度网盘提取码的两种方法

法1import stringimport randomcode = ''.join(random.sample((string.digits + string.ascii_lowercase), 4)) #sample组合随机4个print(code)法2import randomall_raw_code = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd',

2021-05-14 09:07:22 28854 2

原创混淆矩阵

《python机器学习实例》混淆矩阵（confusion matrix）是理解分类模型性能的数据表，它有助于我们理解如何把测试数据分成不同的类。当想对算法进行调优时，就需要在对算法做出改变之前了解数据的错误分类情况。有些分类效果比其他分类效果更差，混淆矩阵可以帮助我们理解这些问题。先看看如图2-8所示的混淆矩阵。在图2-8中，我们可以看出不同类型的分类数据。理想情况下，我们希望矩阵非对角线元素都是0，这是最完美的分类结果。先看看class 0，一共52个样本属于class 0。如果对第一行数据求和，.

2021-04-26 14:06:19 1756

原创带AdaBoost算法的决策树回归器（decision tree regressor）

Python机器学习经典实例准备工作决策树是一个树状模型，每个节点都做出一个决策，从而影响最终结果。叶子节点表示输出数值，分支表示根据输入特征做出的中间决策。AdaBoost算法是指自适应增强（adaptive boosting）算法，这是一种利用其他系统增强模型准确性的技术。这种技术是将不同版本的算法结果进行组合，用加权汇总的方式获得最终结果，被称为弱学习器（weak learners）。AdaBoost算法在每个阶段获取的信息都会反馈到模型中，这样学习器就可以在后一阶段重点训练难以分.

2021-04-26 11:14:56 1369 2

原创预处理和特征提取1

数据预处理归一化处理可统一数据量纲，便于不同单位和量级数据进行计算。常用方法：0-1标准化Z_score标准化sigmoid标准化其中0-1标准化方法如果在有新值加入的时候，可能会改变值域区间的最大值和最小值。当训练数据集中含有过大异常值，会使得原有的正常值非常小，不便于模型训练。而sigmoid标准化可能会使得原有传感器数值过大的数据全都变化为同一数值，使得数据信息丢失。解决数据延迟相关问题若数据之间存在延迟相关，使用曲线排齐算法使得原有数据重新拥有相关性。基本思路：计算两个

2021-04-25 11:05:33 947

原创 python 使用Kmeans进行图像压缩

from skimage import iofrom sklearn.cluster import KMeansimport numpy as npimage = io.imread('企鹅.png')io.imshow(image)io.show()rows = image.shape[0]cols = image.shape[1]image = image.reshape(image.shape[0]*image.shape[1],3)Kmeans = KMeans(n_clus

2021-04-20 13:51:58 379

原创 python设置数据透视表

import pandas as pdimport numpy as npdf = pd.DataFrame([ ['张三','语文',98.], ['张三','体育',60.], ['李四','数学',60.], ['李四','语文',100.], ['王五','数学',89], ['王五','体育',98.]

2021-04-20 13:50:05 135

原创决策树

决策树(Decision Tree)决策树学习是根据数据的属性采用树状结构建立的一种决策模型，可以用此模型解决分类和回归问题。常见的算法包括 CART(Classification And Regression Tree), ID3, C4.5等。我们往往根据数据集来构建一棵决策树，他的一个重要任务就是为了数据中所蕴含的知识信息，并提取出一系列的规则，这些规则也就是树结构的创建过程就是机器学习的过程。学习地址：http://pytlab.github.io/2017/07/09/%E6%9C%BA%E

2021-04-14 17:04:29 113

转载数学建模七日谈

非原创非原创非原创，很有道理所以分享过来转载于 http://www.madio.net/forum-160-1.html分享一共分为七个部分，分七天写给大家，下面是第一个部分：参加全国大学生数学建模比赛前你需要积累哪些。1 参加全国大学生数学建模需要积累大家知道，数学模型是一个庞大的议题，关于它的各种资料、知识点也是浩如烟海，难免会让很多初学者不知所措，很多同学在准备过程中觉得无从下手，因为感觉到学过的东西比赛中好像都没有用，然而比赛的时候又没有自己的思路，很是苦恼，导致很多同学中途放弃

2021-04-14 16:23:17 589

原创决策树分支dot转存pdf

进入 Graphviz 安装的文件夹bin的目录在空白处右键，选择Git Bush Here，出现黑框$ ./dot.exe -Tpdf /c/exp.dot -o /c/exp.pdf/c/exp.dot __dot文件地址/c/exp.pdf __准备输出的pdf文件地址

2021-04-14 14:49:32 254

原创生成100行 50列的随机浮点数，浮点数范围 : (0,1)

np.random.random((100, 50))

2021-03-23 10:44:34 296

转载 python 数据转矩阵

在用sklearn进行模型预测时发现了几次同样的报错：ValueError: Expected 2D array, got 1D array instead:array=XXXXXReshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.这是因为在新版sklearn中，所有数.

2021-03-12 14:58:18 363

转载 python数据标准化简单处理、归一化、正态化

# 导入归一化方法from sklearn.preprocessing import MinMaxScalermms = MinMaxScaler()# 调用方法对数据进行归一化处理data['X_train'] = mms.fit_transform(data['X_train'])X_train ：需要做归一化处理的数据列、或者数据框2 正态标准化使用环境：线性回归需要数据呈现正态分布趋势、其他的聚类等及机器学习的场景from sklearn.preprocessing i

2021-03-12 14:56:50 2156 1

原创 python 色彩盘

from bokeh.palettes import Dark2_5 as palette# itertools handles the cyclingimport itertoolscolors = itertools.cycle(palette)

2021-03-11 19:52:22 173

原创 python 删除某行、某一列

data_a =pd.DataFrame(data[:-1])#删除最后一行print(data_a)

2021-03-11 19:31:46 924

原创滑动滤波并填充空值

ymean =y.rolling(window=12).mean()#滑动窗口取平均值，我取了12个ymean[ymean.isnull()] = y[ymean.isnull()]#a列中的空值用b列中的对应值填充print(ymean)

2021-03-10 17:05:31 196

原创删除空行和含有特定数值的行

df = pd.read_csv(r'C:\Users\user\pythonProject\venv\2021数据\工作簿1.csv')print(df.head())df.dropna(axis=0, how='any', inplace=True)#删除空行a = df[df['log_time'].isin(['log_time'])]# 找出包含数值"log_time“的所有行（要删除的行）print(a)data = df[~(df['log_time'].isin(['log_ti

2021-03-10 11:42:59 154

原创生成for循环填充列表

newlist = [list(range(4)) for _ in range(2)]newlistA = sum(newlist, [])print(newlistA)> [0, 1, 2, 3, 0, 1, 2, 3]newlist = []for x in range(2): newlist.append(list(range(4)))newlistA1 = sum(newlist, [])print(newlistA1)> [0, 1, 2, 3, 0,

2021-03-09 17:05:04 274

转载列表含有子列表展开成一个列表，列表的扁平化

元素都为列表listA = [[‘a’], [‘b’], [‘c’, ‘d’]] 展开成：listA1 = [‘a’, ‘b’, ‘c’, ‘d’]方法1：listA1 = sum(listA, []) 方法2：listA1 = [x for j in listB for x in j]方法3：from functools import reducea=[[1,2,3],[4,5,],[6]]a=reduce(lambda x,y:x+y,a)a = [1, 2, 3, 4,

2021-03-09 16:54:24 95

转载 python常用标准库sys和os

https://cloud.tencent.com/developer/article/1559758?from=article.detail.1640799

2021-03-09 08:37:56 113

原创删除指定列的重复项所在行并保留第一次出现的项

data.drop_duplicates('长度实际值', keep='first', inplace=True)#删除指定列的重复项所在行并保留第一次出现的项，默认是所有列；inplace ：直接在原来数据上修改还是保留一个副本

2021-03-08 09:18:06 524

原创提取同一文件夹下所有文件的同一列

import pandas as pdimport osfrom pandas import Series, DataFramedir =r'C:\Users\user\pythonProject\venv\数据\Raw data'#设置工作路径#新建列表，存放文件名（可以忽略，但是为了做的过程能心里有数，先放上）filename_excel = []#新建列表，存放每个文件数据框（每一个excel读取后存放在数据框）frames = []af = pd.DataFrame()for

2021-03-05 11:02:43 230 1

原创 StratifiedKFold交叉验证使用举例

import numpy as npfrom sklearn.model_selection import StratifiedKFoldx = np.array([[1,2], [3,4], [1,2], [3,4],[5,6],[7,8]])y = np.array([0, 0, 1, 1,1,0])#n_splits代表几折交叉，要能被样本个数整除才行，返回的是所有的分割结果的下标，分别轮着做测试集skf = StratifiedKFold(n_splits=3).split(x, y)f

2021-03-04 09:00:00 876 2

原创 DOT可视化

import graphvizwith open("CCF6460Y副本22.dot") as f: dot_graph = f.read()dot=graphviz.Source(dot_graph)dot.view()#dot文件可视化，哪里需要放哪里

2021-02-22 16:39:12 1297

原创 python 学习笔记（一）20201103

数学操作符的操作顺序与数学中类似。若需要，可使用括号改变优先级。在用于两个整型或浮点型值时，* 操作符表示乘法。但 * 操作符用于一个字符串值和一个整型值时，它变成了“字符串复制”操作符。print('alice'*5)alicealicealicealicealice变量用小写字母开头时Python的惯例，具有描述性的名字有助于提高代码可读性。Numpy库Numpy.array()中类型需一致，若不一致numpy会自动统一格式Import numpy as npPrint(np.ara

2020-11-04 09:23:18 101

原创 python 记录loc和iloc提取行列

import pandas as pddf = pd.DataFrame(data=[[1,2,3,3],[2,3,4,5],[5,5,8,9]],index=[0,'c','可爱'],columns=['a','b','c','d'])print(df)print(df.loc[0])# loc索引行，label是整型数字print(df.loc['c'])# loc索引行，label是字符型(loc索引行，label是整型数字或字符型都可)print(df.loc['c':])# loc索引多

2020-10-15 15:46:19 5153

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_44441926的博客