自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 收藏
  • 关注

原创 时间序列处理方法

对于时间序列数据进行多分类任务,RNN对于顺序建模不理想,可以考虑以下模型和改进方法:

2024-09-09 14:20:06 385

原创 【无标题】

【代码】【无标题】

2024-04-19 21:01:01 182

原创 【Transformer框架代码实现】

单头注意力机制/自注意力机制实现。词嵌入层+位置编码层。

2023-12-20 17:03:24 1367 2

原创 特征工程-类别特征处理方法汇总

类别特征处理方法汇总

2023-10-19 14:42:01 190

原创 【特征工程-时序(时间)特征处理方法汇总】

【代码】【特征工程-时许(时间)特征处理方法汇总】

2023-10-18 14:45:17 393

原创 Untitled555555555

%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as stimport osimport reimport gcimport warningswarnings.filterwarnings('ignore')plt.rcParams['font.sans-serif']=['Si

2022-03-03 02:52:57 279

原创 33333333333333333

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport osimport reimport warningsimport seaborn as snsimport scipy.stats as stimport gcwarnings.filterwarnings('ignore')pd.set_option('display.max_columns', None)pd.set_option

2022-03-02 17:42:57 335

原创 【无标题】22222

%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as stimport osimport reimport gcimport warningswarnings.filterwarnings('ignore')plt.rcParams['font.sans-serif']=['Si

2022-03-01 22:59:30 340

原创 111111111111

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport osimport reimport warningsimport seaborn as snsimport scipy.stats as stimport gcwarnings.filterwarnings('ignore')pd.set_option('display.max_columns', None)pd.set_option

2022-03-01 18:03:35 670

原创 fusai数据

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2022-02-25 17:27:27 694

原创 【无标题】房价的预测

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport osimport reimport warningsimport seaborn as snsimport scipy.stats as stimport gcwarnings.filterwarnings('ignore')pd.set_option('display.max_columns', None)pd.set_option

2022-02-16 17:15:36 789

原创 B产品的分析

%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as stimport osimport reimport gcimport warningswarnings.filterwarnings('ignore')plt.rcParams['font.sans-serif']=['Sim

2022-01-28 17:22:59 3199

原创 tezheng

id 390977core_cust_id 212637prod_code 2a2 1a3 4y

2022-01-24 08:08:50 116

原创 R+产品流水

流水+R的特征流水更新流水旧的流水R点击流水更新流水dict_ = {'2021-07-01':'202106', '2021-08-01':'202107', '2021-09-01':'202108', '2021-10-01':'202109'}dict_1 = {'2021-07-01':['202105', '202106'], '2021-08-01':['202106', '202107'], '2021-09-01':['202107', '202108'],

2022-01-19 17:20:32 225

原创 特征处理+frequency

产品+产品流水产品产品流水R点击表产品加(#############)是更改过的product = pd.read_pickle('product.pkl')#产品的再次分类product['prod_4'] = product['prod_code'].apply(lambda x:x[:4])product['prod_3'] = product['prod_code'].apply(lambda x:x[:3])product['prod_1'] = product['prod_cod

2022-01-18 15:19:53 211

原创 产品表的删填情况

2022-01-06 11:32:54 71

原创 【无标题】

产品表#!/usr/bin/env python# coding: utf-8# In[75]:import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')pd.set_option('display.max_columns', None)pd.set_option('display.max_rows', None)pd.set_option('max_colwidth

2021-12-30 20:24:41 167

原创 2021-11-10

%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport warningsimport seaborn as snsimport scipy.stats as stimport osimport rewarnings.filterwarnings('ignore')pd.set_option('display.max_rows', None)pd.set

2021-11-10 23:49:46 582

原创 2021-10-27

镇街/单位:万元2015年GDP增速2016年GDP增速2017年GDP增速2018年GDP增速2019年GDP增速莞城街道14524794.02%162025411.55%180758211.56%206113214.03%21595004.77%石 龙 镇8352984.37%9057418.43%9604026.03%108800213.29%11618896.79%虎 门 镇43637786.41%486...

2021-10-27 17:47:58 175

原创 2021-10-25

行业类别

2021-10-25 21:14:28 133

原创 pearson相关性

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningsimport scipy.stats as stimport osimport rewarnings.filterwarnings('ignore')pd.set_option('display.max_rows', None)pd.set_option('display.max

2021-09-26 16:53:51 237

原创 MySQL练习题-决战面试

SQL-练习题练习一: 各部门工资最高的员工(难度:中等)练习二: 换座位(难度:中等)练习三: 分数排名(难度:中等)练习四:连续出现的数字(难度:中等)练习五:树节点 (难度:中等)练习六:至少有五名直接下属的经理 (难度:中等)练习七:查询回答率最高的问题 (难度:中等)练习八:各部门前3高工资的员工(难度:中等)练习九:平面上最近距离 (难度: 困难)练习十:行程和用户(难度:困难)练习一:行转列练习二:列转行练习三:带货主播练习四:MySQL 中如何查看sql语句的执行计划?可以看到哪些信息?练

2021-08-27 20:14:56 699 1

原创 SQL-窗口函数

SQL高级查询-窗口函数第五章:SQL高级处理5.1 窗口函数5.1.1 窗口函数概念及基本的使用方法5.2 窗口函数种类5.2.1 专用窗口函数5.2.2 聚合函数在窗口函数上的使用5.3 窗口函数的的应用 - 计算移动平均5.3.1 窗口函数适用范围和注意事项5.4 GROUPING运算符5.4.1 ROLLUP - 计算合计及小计练习题**5.1****5.2****5.3**第五章:SQL高级处理5.1 窗口函数5.1.1 窗口函数概念及基本的使用方法窗口函数也称为OLAP函数。OLAP 是

2021-08-27 10:55:59 1265

原创 SQL-内、外、全连接--集合运算

SQL-内、外、全连接第四章:集合运算4.1 表的加减法4.1.1 什么是集合运算4.1.2 表的加法--UNION4.1.2.1 UNION4.1.2.2 UNION 与 OR 谓词4.1.2.3 包含重复行的集合运算 UNION ALL4.1.2.4 隐式数据类型转换4.1.3 MySQL 8.0 不支持交运算INTERSECT4.1.4 差集,补集与表的减法4.1.4.1 MySQL 8.0 还不支持 EXCEPT 运算4.1.4.2 EXCEPT 与 NOT 谓词4.1.4.3 INTERSECT

2021-08-24 20:47:49 2855

原创 SQL-复杂一点的查询--case

SQL-查询第三章 复杂一点的查询3.1 视图3.1.1 什么是视图3.1.2 视图与表有什么区别3.1.3 为什么会存在视图3.1.4 如何创建视图3.1.5 如何修改视图结构3.1.6 如何更新视图内容3.1.7 如何删除视图3.2 子查询3.2.1 什么是子查询3.2.2 子查询和视图的关系3.2.3 嵌套子查询3.2.4 标量子查询3.2.5 标量子查询有什么用3.2.6 关联子查询小结练习题-第一部分3.13.23.33.43.3 各种各样的函数3.3.1 算数函数3.3.2 字符串函数3.3.3

2021-08-20 20:44:44 960

原创 SQL-运算符、真值表、where、group by、having、order by、聚合函数的用法

SQL-运算符、真值表、where、group by、having、order by、聚合函数的用法第二章:基础查询与排序2.1 SELECT语句基础2.1.1 从表中选取数据SELECT语句2.1.2 从表中选取符合条件的数据WHERE语句2.1.3 相关法则2.2 算术运算符和比较运算符2.2.1 算术运算符2.2.2 比较运算符2.2.3 常用法则2.3 逻辑运算符2.3.1 NOT运算符2.3.2 AND运算符和OR运算符通过括号优先处理2.3.3 真值表含有NULL时的真值练习题-第一部分2.12

2021-08-18 20:34:50 1495

原创 初见数据库-SQL

小白操作SQL1.1 初识数据库1.1.1 DBMS的种类1.1.2 RDBMS的常见系统结构1.2 初识 SQL1.2.1 SQL的基本书写规则1.2.2 数据库的创建( CREATE DATABASE 语句)1.2.3 表的创建( CREATE TABLE 语句)1.2.4 命名规则1.2.5 数据类型的指定1.2.6 约束的设置1.2.7 表的删除和更新1.2.8 向 product 表中插入数据1.2.9 索引练习题1.11.21.3 填空题1.4 判断题# 第一章:初识数据库本章主要讲解数据

2021-08-17 11:08:56 160

原创 SQL数据库的安装

初见数据库-安装SQLSQL数据库的安装第0章:环境搭建本章重点:1. MySQL 8.0 的安装1.1 windows 下 MySQL 8.0 的下载安装1.1.1 下载1.1.2 安装1.2 Linux 下 MySQL 8.0 的下载安装1.2.1 安装步骤:1.2.2 MySQL 数据库设置1.2.3 设置远程连接:2. 连接 MySQL 并执行 SQL 查询2.0 使用命令行方式连接MySQL服务2.1 使用 MySQL Workbench 连接 MySQL2.2 [选学]使用 HeidiSQL 连

2021-08-17 10:32:50 6545 1

原创 集成学习task1—数学基础(极值点的寻找)

实验目的1、理解等高线的几何含义、如何发现一个函数的最小解;掌握一门绘制函数图形的编程工具;实验内容给定下述Rosenbrock函数,f(x)=(a-x1)*2+b(x2-x1*x1)**2。试编写程序完成下述工作:1)为不同的a,b取值,绘制该函数的3D表面。请问 a,b取值对该表面形状有大的影响吗?,所谓大影响就是形状不再相似。对a,b的取值区间,能否大致给出一个分类,像下面这样给出一张表:b=[b1,b2]b=[b3,b4]…a=[a1,a2]a=[a3

2021-07-13 23:54:09 277 2

原创 百面机器学习:特征工程、模型评估

1. 特征工程定义:对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。1.1 特征归一化归一化就是把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。分为:线性函数归一化:最大值最小值归一化 这种归一化适合数值比较集中情况,如果max和min不稳定,很容易使得归一化结果不稳定; 实际应用中可以用经验常量值来替代max和min。标准差归一化(零均值归一化):标准正态分布非线性归一化:log、指数、正切等变换经常用在数据分化比较大的

2020-09-07 17:31:21 423

原创 异或1的好处:力扣540. 有序数组中的单一元素

如果是一个偶数^1,那么答案是偶数+1;如果是一个奇数^1,那么答案是奇数-1。1^1=02^1=33^1=24^1=55^1=4-1^1=-2-2^1=-1-3^1=-4-4^1=-3力扣给定一个只包含整数的有序数组,每个元素都会出现两次,唯有一个数只会出现一次,找出这个数。示例 1:输入: [1,1,2,3,3,4,4,8,8]输出: 2示例 2:输入: [3,3,7,7,10,11,11]输出: 10注意: 您的方案应该在 O(log n)时间复杂度

2020-09-04 10:02:50 186

原创 力扣149. 直线上最多的点数

力扣本题的方法就是查找,但是测试用例中会有很多坑[[0,0],[94911150,94911151],[94911151,94911152]];这两个不是一个点,但由于浮点数的精度问题,导致一直计算为1个斜率。处理方法:dy X 1000 / dx X 1000或者利用最简分数:9/18=3/6=1/2给定一个二维平面,平面上有 n 个点,求最多有多少个点在同一条直线上。示例 1:输入: [[1,1],[2,2],[3,3]]输出: 3解释:^|| o|

2020-09-03 11:39:00 254

原创 查找力扣练习

力扣

2020-08-28 22:32:50 84

原创 查找

文章目录一.查找表考虑的基本数据结构算法应用LeetCode 349 Intersection Of Two Arrays 1题目描述分析实现LeetCode 350 Intersection Of Two Arrays 2题目描述分析实现LeetCode 242 Intersection Of Two Arrays 2题目描述分析实现LeetCode 202 Happy number题目描述分析实现tipsLeetCode 290 Word Pattern题目描述分析实现tipsLeetCode 205

2020-08-25 09:26:58 208

原创 动态规划力扣

动态规划动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题,我们需要解其不同部分(即子问题),再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题,例如斐波那契数列,如果运用递归的方式来求解会重复计算很多相同的子问题,利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次,具有天然剪枝的功能,从而减少计算量,一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。

2020-08-22 17:25:35 251

原创 力扣4:寻找两个有序数组的中位数

来源:力扣给定两个大小为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出这两个正序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。你可以假设 nums1 和 nums2 不会同时为空。示例 1:nums1 = [1, 3]nums2 = [2]则中位数是 2.0示例 2:nums1 = [1, 2]nums2 = [3, 4]则中位数是 (2 + 3)/2 = 2.5分析1、暴力解法:调包加排序合并数组

2020-08-19 11:13:18 318

原创 分治算法(1)

引文MapReduce(分治算法的应用) 是 Google 大数据处理的三驾马车之一,另外两个是 GFS 和 Bigtable。它在倒排索引、PageRank 计算、网页分析等搜索引擎相关的技术中都有大量的应用。尽管开发一个 MapReduce 看起来很高深,感觉遥不可及。实际上,万变不离其宗,它的本质就是分治算法思想,分治算法。如何理解分治算法?为什么说 MapRedue 的本质就是分治算法呢?1.主要思想分治算法的主要思想是将原问题分成若干个子问题,解决这些子问题再最终合并出原问题的答案。在计

2020-08-16 15:32:57 257

原创 文件与文件系统

1. 文件与文件系统打开文件open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。mode: 可选,文件打开模式buffering: 设置缓冲encoding: 一般使用utf8errors: 报

2020-08-09 00:06:14 79

原创 datetime模块

datetime模块datetime 是 Python 中处理日期的标准模块,它提供了 4 种对日期和时间进行处理的类:datetime、date、time 和 timedelta。1. datetime类class datetime(date): def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo) pass def now(cls, tz=None):

2020-08-08 10:41:05 179

原创 类与对象

类与对象1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。【例子】class Turtle: # Python中的类名约定以大写字母开头 """关于类的一个简单例子""" # 属性 color = 'green' weight = 10

2020-08-05 22:32:35 104

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除