机器学习
大佬喝可乐
这个作者很懒,什么都没留下…
展开
-
【特征工程-时序(时间)特征处理方法汇总】
【代码】【特征工程-时许(时间)特征处理方法汇总】原创 2023-10-18 14:45:17 · 380 阅读 · 0 评论 -
fusai数据
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2022-02-25 17:27:27 · 688 阅读 · 0 评论 -
R+产品流水
流水+R的特征流水更新流水旧的流水R点击流水更新流水dict_ = {'2021-07-01':'202106', '2021-08-01':'202107', '2021-09-01':'202108', '2021-10-01':'202109'}dict_1 = {'2021-07-01':['202105', '202106'], '2021-08-01':['202106', '202107'], '2021-09-01':['202107', '202108'],原创 2022-01-19 17:20:32 · 223 阅读 · 0 评论 -
特征处理+frequency
产品+产品流水产品产品流水R点击表产品加(#############)是更改过的product = pd.read_pickle('product.pkl')#产品的再次分类product['prod_4'] = product['prod_code'].apply(lambda x:x[:4])product['prod_3'] = product['prod_code'].apply(lambda x:x[:3])product['prod_1'] = product['prod_cod原创 2022-01-18 15:19:53 · 211 阅读 · 0 评论 -
pearson相关性
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningsimport scipy.stats as stimport osimport rewarnings.filterwarnings('ignore')pd.set_option('display.max_rows', None)pd.set_option('display.max原创 2021-09-26 16:53:51 · 236 阅读 · 0 评论 -
集成学习task1—数学基础(极值点的寻找)
实验目的1、理解等高线的几何含义、如何发现一个函数的最小解;掌握一门绘制函数图形的编程工具;实验内容给定下述Rosenbrock函数,f(x)=(a-x1)*2+b(x2-x1*x1)**2。试编写程序完成下述工作:1)为不同的a,b取值,绘制该函数的3D表面。请问 a,b取值对该表面形状有大的影响吗?,所谓大影响就是形状不再相似。对a,b的取值区间,能否大致给出一个分类,像下面这样给出一张表:b=[b1,b2]b=[b3,b4]…a=[a1,a2]a=[a3原创 2021-07-13 23:54:09 · 275 阅读 · 2 评论 -
百面机器学习:特征工程、模型评估
1. 特征工程定义:对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。1.1 特征归一化归一化就是把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。分为:线性函数归一化:最大值最小值归一化 这种归一化适合数值比较集中情况,如果max和min不稳定,很容易使得归一化结果不稳定; 实际应用中可以用经验常量值来替代max和min。标准差归一化(零均值归一化):标准正态分布非线性归一化:log、指数、正切等变换经常用在数据分化比较大的原创 2020-09-07 17:31:21 · 419 阅读 · 0 评论 -
异或1的好处:力扣540. 有序数组中的单一元素
如果是一个偶数^1,那么答案是偶数+1;如果是一个奇数^1,那么答案是奇数-1。1^1=02^1=33^1=24^1=55^1=4-1^1=-2-2^1=-1-3^1=-4-4^1=-3力扣给定一个只包含整数的有序数组,每个元素都会出现两次,唯有一个数只会出现一次,找出这个数。示例 1:输入: [1,1,2,3,3,4,4,8,8]输出: 2示例 2:输入: [3,3,7,7,10,11,11]输出: 10注意: 您的方案应该在 O(log n)时间复杂度原创 2020-09-04 10:02:50 · 184 阅读 · 0 评论 -
力扣149. 直线上最多的点数
力扣本题的方法就是查找,但是测试用例中会有很多坑[[0,0],[94911150,94911151],[94911151,94911152]];这两个不是一个点,但由于浮点数的精度问题,导致一直计算为1个斜率。处理方法:dy X 1000 / dx X 1000或者利用最简分数:9/18=3/6=1/2给定一个二维平面,平面上有 n 个点,求最多有多少个点在同一条直线上。示例 1:输入: [[1,1],[2,2],[3,3]]输出: 3解释:^|| o|原创 2020-09-03 11:39:00 · 250 阅读 · 0 评论 -
列表元组字符串:力扣852
列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>x = [a] * 4操作中,只是创建4个指向list的引用,所以一旦a改变,x中4个a也会随之改原创 2020-07-28 23:55:14 · 245 阅读 · 0 评论 -
程序异常处理
异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivision原创 2020-07-25 23:10:03 · 402 阅读 · 0 评论 -
力扣136、137、260以及取模、位运算
python取模所谓取模运算,就是计算两个数相除之后的余数,符号是%。如a % b就是计算a除以b的余数。用数学语言来描述,就是如果存在整数n和m,其中0 <= m < b,使得a = n * b + m,那么a % b = a - n * b = m.在MATLAB中为mod;取模运算的两个操作数都必须是整数,可以是负整数,但是b不可以是0.当a和b中存在负整数时,先放python运行的结果print(7 % 3,3 % 7)print(-7 % 3,-3 % 7)print(7原创 2020-07-22 00:50:04 · 487 阅读 · 0 评论 -
特征筛选
@[数据挖掘](特征筛选)特征筛选常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式: log[(1+x)/(1+median)]数据分桶:等频分桶;等距分桶;Best-KS 分桶...原创 2020-03-22 12:31:43 · 592 阅读 · 0 评论 -
机器学习数学基础(考研)高数、线代、概率论
机器学习的数学基础-(三、概率论和数理统计) - 黄海广的文章 - 知乎https://zhuanlan.zhihu.com/p/36584335转载 2019-08-02 11:18:13 · 318 阅读 · 0 评论