自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 leetcode一天一个小技巧--双指针--左右指针

左右指针主要解决的是数组、字符串的问题,比如二分查找左右指针的实际就是 left = 0, right = len(nums) -1通过不断右移left和左移right知道left和right相遇为结束。1、二分查找二分查找框架def binarySearch(int[] nums, int target) { int left = 0, right = len(nums) -1; while(left <= right) { int mid = le

2022-02-21 21:26:18 167

原创 leetcode一天一个小技巧---双指针--快慢指针

双指针双指针分为左右指针和快慢指针快慢指针主要解决的是链表中的问题,典型的是链表中是否有环。初始化指向的链表头结点head 前进时快指针fast在前,慢指针slow在后面1、判断链表中是否有环链表中没有环指针最后会指向null表示链表到头了,采用快慢指针,如果不含有环,fast最终会等于null,表示其不含环;如有环,fast最后会超过慢指针一圈,即fast==slow,表示有环。leetcode141环形链表class Solution: def hasCycle(self, h

2022-02-20 02:17:05 260

原创 shell编程(上)

一、简析shellshell是一个命令行解释器,接收应用程序、用户命令,调用操作系统内核。1、Linux提供的shell解释器:输入 cat /etc/shells /bin/sh/bin/bash/sbin/nologin/usr/bin/sh/usr/bin/bash/usr/sbin/nologin/bin/tcsh/bin/csh2、bash和sh的关系sh是bash的软连接,bash和sh是同一个解释器3、centos默认的解析器是bash二、shell

2022-02-20 00:40:53 147

原创 leetcode刷题----一天一个刷题套路

leetcode刷题

2022-02-18 18:09:24 433

原创 开发项目的环境搭建

一、REST简介rest是表述性状态传递,不是框架,是前后端交互的规范约定,简化了前后端的通行,有无状态和前后端分离的特性,可在官网中查看其相关的操作信息:Django REST framework中文的官方文档翻译版本:Django REST framework中文文档前后端分离和交互约定RESTful API 实现前后端独立开发,并保证接口不变的情况下替换前后端的实现语言,一般情况下RESTful系统有静态的前端资源和服务器,不是会单独部署前端服务(Nginx和CDN)使用反向代理将前端请求转发

2021-05-07 16:04:58 147

原创 task5 模型融合

零基础入门金融风控Task5 模型融合内容介绍模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大幅提升,以下是模型融合的方式。平均:简单平均法加权平均法投票:简单投票法加权投票法综合:排序融合log融合stacking:构建多层模型,并利用预测结果再拟合预测。blending:选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。boo

2020-09-27 21:57:41 123

原创 task4 建模调参

一、模型原理介绍1、逻辑回归模型逻辑回归是分类机器学习算法,它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。逻辑回归的本质是为解决线性回归的预测结果是一个连续值而存在的,它将线性回归无法限定的结果创造性地用sigmoid函数,映射到0-1之间,如此就能轻松解决二分类问题了。2、 树模型决策树(decision tree):是一种基本的分类与回归方法,决策树构建3个步骤:特征选择、决策树的生成和决策树的修剪。而通常特征选择的标准是信息增益(i

2020-09-24 22:09:26 98

原创 task3 特征工程

一、数据预处理分析之前先打入需要的一些第三方库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt import datetimefrom tqdm import tqdm import seaborn as snsimport warningswarnings.filterwarnings('ignore')%matplotlib inline#导入数据集train = pd.read_csv

2020-09-21 23:06:20 183

原创 task2 数据分析

一、数据总体了解在进入数据了解之前先导入数据分析和可视化需要的库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningsimport datetimewarnings.filterwarnings('ignore')%matplotlib inline 1、读取数据集并了解数据集大小,原始特征维度读取数据库train = pd.r

2020-09-18 23:18:16 1791

原创 task1 赛题理解

TASK1 赛题理解本次组队学习的任务是典型的贷款违约问题,即通过所给的关与贷款者的各项字段特征去判断该客户是否是潜在的违约客户,这类题在各类风控问题中常常出现,因为不同银行或机构所掌握的客户信息不同,每个特征也不同,所以如何利用字段特征,成为了是否能拿高分的关键因素先来看一下题目简介:赛题以预测用户贷款是否违约为任务,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为

2020-09-15 22:38:52 220

原创 task5基于深度学习的文本分类2

基于深度学习的文本分类本章将继续学习基于深度学习的文本分类。学习目标 学习Word2Vec的使用和基础原理 学习使用TextCNN、TextRNN进行文本表示 学习使用HAN网络结构完成文本分类文本表示方法 Part3词向量本节通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并基于这个中心词去预测窗口里其他词出现的概率。因此,word2vec模型可以方便地从新增语料中学习到新

2020-07-31 23:50:15 265

原创 Task3 基于机器学习的文本分类

文本表示方法 Part1在机器学习算法的训练过程中,假设给定 N个样本,每个样本有 M个特征,这样组成了 N×M的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×width×3的特征图,一个三维的矩阵来进入计算机进行计算。但是在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Embedding)方法。词嵌入将不定长的文本转换到定长的空间内,是文本分类的第一步。one-hot

2020-07-25 23:27:46 168

原创 task6 异常处理

一、异常和错误part1:程序中难免出现错误,而错误分成两种1.语法错误(这种错误,根本过不了python解释器的语法检测,必须在程序执行前就改正)#语法错误示范一if#语法错误示范二def test: pass#语法错误示范三print(haha2.逻辑错误(逻辑错误)#用户输入不完整(比如输入为空)或者输入非法(输入不是数字)num=input(">>: ")int(num)#无法完成计算res1=1/0res2=1+'str'part2:什

2020-07-25 23:18:04 112

原创 NLP新闻文本分类 Task2 数据读取与数据分析

一、数据读取根据之前的数据下载后了解到数据是使用CSV格式存储,使用pandas库实现数据的读取。(实验环境为anaconda下,下面数据读取的地址应该为自己数据集所在的绝对路径)import pandas as pd train = pd.read_csv('./train_set.csv',sep = '\t')#sep是分隔字符的train.head()#查看前5行数据根据图中信息知道,第一列label是新闻类别,第二列text为新闻字符。二、数据分析当我们刚拿到数据的时候看到数据里

2020-07-22 23:57:42 220

原创 零基础⼊⻔门NLP- 新闻⽂本分类task1 赛题理解

新闻文本分类是基于天池官网的比赛,数据来源于此:训练集数据测试集数据1、赛题数据数据集:新闻文本数据,按照字符级别进行过匿名处理。训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。候选分类类别:财经财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐,共14个。在数据集中标签的对应关系如下:{‘科技’:0,‘股票’:1,‘体育’:2,‘娱乐’:3,‘时政’:4,‘社会’:5,‘教育’:6,‘财经’:7,‘家居’:8,‘游戏’:9,‘房产’:10,

2020-07-21 18:05:57 141

原创 二手车交易

导入库import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snsfrom operator import itemgetter%matplotlib inline查看并删除异常值此处对于异常列power进行处理def ou...

2020-03-27 21:15:27 316

原创 二手车交易价格预测-Day2

1.1EDA的目标 EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。1.2内容介绍载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy;可视化库 matplotlib、seabon;其...

2020-03-23 19:48:45 220

原创 mac使用pip导入lightgbm报错解决方案(不知道适不适合你们的)

本人小白一枚,在使用jupyter notebook时导入lightgbm出现如下错误:pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out.解决方案:如下pip install --defaul...

2020-03-19 00:07:20 304

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除