自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 python中正则表达式 .*?的使用

python中re正则表达式.*?

2022-08-08 16:33:45 546

原创 异常检测-datawhale学习

异常检测概述什么是异常检测,适用场景异常检测:对不匹配预期模式或数据集中其他项目的项目、事件或观测值的识别。异常项目包含:信用卡欺诈、结构缺陷、故障检测、医疗问题、文本错误等类型的问题异常类别点异常(point anomalies)指的是少数个体实例是异常的,大多数个体实例是正常的,例如正常人与病人的健康指标;条件异常(conditional anomalies),又称上下文异常,指的是在特定情境下个体实例是异常的,在其他情境下都是正常的,例如在特定时间下的温度突然上升或下降,在特定场景

2021-05-10 13:15:34 178

原创 树模型特征重要性,特征选择-原理

基于袋外数据误差,对特征X给于扰动,得到特征重要性评分参考:https://www.cnblogs.com/justcxtoworld/p/3447231.html#3975497

2021-02-04 10:43:18 1454

原创 数据结构--排序算法(理解+实现)

数据结构排序算法排序算法有很多,下文列出常见排序算法的理解与实现(持续更新~)冒泡排序-o(n²)选择排序-o(n²)插入排序-o(n²)希尔排序-o(nlogn)快速排序-o(nlogn) (★)希尔排序-o(nlogn)1.冒泡排序:从前往后遍历,比较相邻两个数值大小并将大值放在后边(交换位置),一次遍历使得最大值放在了最后一位;进行n-1次冒泡遍历~选出每次的最大值放到后边def bubble_sort(alist): n=len(alist) f

2021-01-08 14:59:08 249 1

原创 数据结构--递归(新手理解)

递归一看就会,一写就废?以下两个链接,帮助新手理解递归问题写递归时,仅考虑本级,一定不要去考虑内部循环过程!!!递归解题三部曲:解决递归问题https://lyl0724.github.io/2020/01/25/1/https://leetcode-cn.com/problems/invert-binary-tree/solution/di-gui-han-shu-zen-yao-xie-ben-wen-bang-zhu-ni-li-/...

2021-01-07 11:13:05 125

原创 树遍历(BFS+DFS(递归+非递归))-python代码整理

数据结构算法-树最近再刷leetcode的树,整理了常用遍历代码包含树的层次遍历(广度优先遍历)与前中后序遍历(深度优先遍历):#########################################层次遍历(广度优先遍历)★★★★★#BFS通用模板,层次遍历通用:#使用队列实现def levelOrder(root): if not root: return [] queue=[root] ans=[] while queue: a=[] #方便保存每一层的

2021-01-05 11:37:21 1192

原创 python中字符串基本操作以及位运算

string.capitalize() 把字符串的第一个字符大写string.count(str, beg=0, end=len(string)) 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数string.endswith(obj, beg=0, end=len(string)) 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.st

2020-09-29 23:24:24 1133

原创 解决python安装opencv速度慢

官方pip install opencv-python使用清华镜像(速度快)pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python

2020-05-16 16:40:42 7507 7

原创 LeetCode刷题--简单组

1.两数之和#缩进可能有点问题,不知道如何简便的调整。-。-##最基本的,两个for循环##提交时间超出限制class Solution: def twoSum(self,nums,target): n = len(nums) for x in range(n): for y in range(n): if (nums[x]+nums[y]==target)&(x<y): return x,y #两层for循环#第二层循环遍历x之后的数据

2020-05-15 17:06:21 360

原创 数据挖掘-Datawhale学习笔记-04-模型融合

常见模型融合方式有blending,bagging ,加权融合stacking模型融合class StackingAveragedModels(BaseEstimator, RegressorMixin, TransformerMixin): def __init__(self, base_models, meta_model, n_folds=10): self.ba...

2020-04-04 20:46:32 187

原创 机器学习-Catboost

详解参考:https://blog.csdn.net/weixin_43317015/article/details/90212867

2020-04-01 18:20:57 142

原创 数据挖掘-Datawhale学习笔记-03-建模调参

学习题目:https://tianchi.aliyun.com/competition/entrance/231784/information数据挖掘-建模调参:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12281897.0.0.502039a9sMPoZZ&postId=95460...

2020-03-31 17:52:46 149

原创 数据挖掘--树模型融合特征选择

from sklearn.ensemble import RandomForestRegressorfrom sklearn.ensemble import AdaBoostRegressorfrom sklearn.ensemble import ExtraTreesRegressorfrom sklearn.ensemble import GradientBoostingRegresso...

2020-03-28 18:18:20 623

原创 数据挖掘-Datawhale学习笔记-02-特征工程

学习题目:天池-二手车价格预测 https://tianchi.aliyun.com/competition/entrance/231784/information 数据挖掘-特征工程 https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.12.1cd81b438QtUxo&...

2020-03-27 17:42:55 178

原创 数据清洗处理-常用操作

# 数据清洗常用操作# 重复值处理print('存在' if any(train_data.duplicated()) else '不存在', '重复观测值')train_data.drop_duplicates()#缺失值处理print('存在' if any(train_data.isnull()) else '不存在', '缺失值')train_data.dropna() # ...

2020-03-24 15:31:30 998

原创 pandas压缩csv数据-节省空间

做项目或做竞赛中,会遇到很大的数据集,几十个G以上,若是直接保存csv,则会浪费本地磁盘空间。偶然看到一篇pandas使用小技巧,实现csv文件压缩与读取,对我这样的小白很实用。首先创建一个数据集 300M左右df = pd.DataFrame(pd.np.random.randn(50000,300))df.to_csv(‘random_data.csv’, index=False)...

2020-03-24 11:55:40 3800

原创 数据挖掘-Datawhale学习笔记-01-数据分析EDA

前沿: 数据挖掘小白一个,之前也被师兄带着参加过一次数据竞赛,也拿了全国top10,但是多半在划水,对于一个数据挖掘流程还不是特别清晰,通过Datawhale的系统学习,希望可以学到完成的解题流程,为下次比赛打基础。 学习题目:天池-二手车价格预测 数据挖掘-数据分析EDA数据探索性分析EDA通过探索性分析,寻找变量与变量,变量与预测值之间的一些关系分布,为特征工程及...

2020-03-23 14:53:42 259

原创 如何在CSDN博客中插入mathtype公式

由于csdn公式仅支持LaTex版本,然而很多人却没有使用过,常用公式编辑器mathtype。下文将介绍如何将mathtype公式插入csdn。ps:你要是说直接截图插入,那我无话可说哈哈哈1.在mathtype中编写公式2.在mathtype中点击参数-转换-转换为Tex-。。选项3.将mathtype中编辑好的公式复制,新建一个txt文本文档,复制到里边,选中LaTex其中的公式...

2020-03-22 17:51:29 573 2

原创 机器学习评价指标

机器学习中,模型评估指标是指对于一个模型结果的数据型量化分类算法常见评估指标:对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,Recall,F-score,Pr曲线],ROC-AUC曲线。对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。回归预测类常见的评估指标:平均绝对误差(Mean Absolute Er...

2020-03-22 15:18:07 230

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除