自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(262)
  • 收藏
  • 关注

原创 机器学习——笔记整理(原理、python代码)——反反复复,出精活!

回顾知识,检查自我,开拓新域。机器学习1.监督学习机器学习简介:机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。 多领域交叉,涉及概率论、统计学,算法复杂度理论等多门学科广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用。机器学习分类: 机器学习一般分为下面几种类别监督学习 ( Supervised Learning)无监督学习 ( Unsupervised Learning)强化学习(

2020-06-07 20:57:29 4832 1

原创 打通数据结构与算法

算法时间复杂度与空间复杂度近期,在学习算法,将自己所学习的知识点总结下来,方便以后的复习。时间复杂度与空间复杂度

2020-04-15 10:12:58 445

原创 【Python】AttributeError: module lib has no attribute X509_V_FLAG_CB_ISSUER_CHECK

运行脚本报错:module lib has no attribute X509_V_FLAG_CB_ISSUER_CHECK。

2023-10-21 13:53:41 3068

原创 SQL——连续登陆天数、点击次数

数据: 现有用户登录记录表user_log用户id 登录日期userid log_dateu0001 2019-10-10u0001 2019-10-11u0001 2019-10-12u0001 2019-10-14u0001 2019-10-15u0001 2019-10-17u0002 2019-10-20u0002 2019-10-211、 找出连续N天登陆的用户id思路:窗口函数(1)首先按用户登录时间升序排序select userid,login_data,ro

2022-04-13 20:41:45 6993 2

原创 安装CUDA和CUDNN_WIN10

安装CUDA和CUDNN1、前言2、官方安装教程及软件包2.1 官方教程1、前言\quad \quad安装之前先查看显卡是否支持CUDA,以及查看CUDA的版本查看方法2、官方安装教程及软件包2.1 官方教程CUDA:https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.htmlcuDNN:https://docs.nvidia.com/deeplearning/sdk/cudnn-install

2021-08-03 10:34:56 781

原创 NVIDIA_CUDA版本查看方法_WIN10

CUDA版本环境:win10查看电脑显卡CUDA有以下两种方法:方法一:使用CMD查看打开电脑程序“命令提示符”,或者搜索框输入“CMD”。在命令行中输入 nvidia-smi方法二:在NVIDIA中查看1、打开NVIDIA控制面板点击“系统信息”,在弹出界面中点击“组件”,如图:...

2021-08-03 10:20:17 4503 2

原创 Word2Vec TypeError: __init__() got an unexpected keyword argument ‘size‘

问题在引用 Word2Vec 出现以下错误TypeError: __init__() got an unexpected keyword argument 'n_iterations'原代码:model = word2vec.Word2Vec(sentences=texts, size=200, window=3, workers=2)解决方法\quad \quad根据官方手册将size改为vector_size即model = word2vec.Word2Vec(sentences=t

2021-08-02 19:53:23 1043

原创 数据分析之回归分析

回归分析1、概述2、分类3、线性回归3.1 单变量线性回归3.2 多变量线性回归3.3 线性回归分析的步骤:3、评价回归算法的指标1、概述\quad \quad 回归分析(Regression)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法,它主要研究一个随机变量 Y 对另一个变量(X)或一组(X1,X2,…,Xk)变量的相依关系。2、分类按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系

2021-07-03 12:19:04 21948 2

原创 数据分析之描述性统计分析

描述性统计分析1、概述2、数据的集中趋势分析2.1 定量数据:平均数2.2 顺序数据2.2.1.描述性统计分析1、概述\quad \quad描述性统计分析(Description Statistics)是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间的关系进行估计和描述的方法。\quad \quad描述性统计分析分为集中趋势分析和离中趋势分析和相关分析三大部分。2、数据的集中趋势分析\quad \quad集中趋势是指一组数据向某一中心值靠拢的程度,它反映

2021-07-02 17:04:59 21891 1

原创 数据分析入门

数据分析1、概述1.1 定义1.2 模块1.3 作用1.3.1 现状分析2、描述性数据分析1、概述1.1 定义\quad \quad数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。1.2 模块\quad \quad数据分析主要包括以下几个部分描述性数据分析(初级数据分析):使用几个关键数据来描述整体的情况。指标:平均数,众数常见的分析方法包括:对比分析法、平均分析法、交叉分析法等。Excel可以实现。探索性

2021-07-02 11:58:00 1051

原创 【python】错误:UnboundLocalError: local variable ‘XXX‘ referenced before assignment

topNSuccessor=Nonedef reverseTopN(self, head: ListNode, right: int) -> ListNode: if right==1: topNSuccessor=head.next return head执行此代码报错:UnboundLocalError: local variable ‘XXX’ referenced before assignment错误: UnboundLocalError:在赋值之前引用了局部

2021-05-06 18:56:25 34565 1

原创 Python之jieba包(中文分词最好的组件)之详细攻略

jieba1、简介2、安装3、使用方法3.1 直接进行分词3.2 添加自定义词典 +分词1、简介1、文本分析中,分词是必不可少的一个环节。而jieba可以说是分词领域的佼佼者,是我们经常用到的一个python分词库。2、模式(1)支持三种分词模式:精确模式:试图将句子最精确的切开,适合文本分析。全模式:把句子中所有可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。(2)支持繁体分词(3)支持自定义

2021-05-04 19:37:11 5845 3

原创 NLP文本相似度系列算法

NLP文本相似度1、前言2、余弦相似度3、TF-IDF4、1、前言\quad \quadNLP、数据挖掘领域中,文本分析是一个很重要的领域,这有助于我们去让计算机理解语言的作用和使用。文本分析也是数据挖掘的重要手段,利用文本分析,我们将很快的读取到一本书、一篇文章、一段话中的关键词和核心思想,而文本相似度就是我们用来剔除无用信息或者重复信息的重要手段。要让计算机去找文本中的不同。\quad \quad我们在比较事物时,往往会用到“不同”,“一样”,“相似”等词语,这些词语背后都涉及到一个动作——双方的

2021-05-04 10:34:15 1358

原创 Leetcode之螺旋矩阵(54)、螺旋矩阵II(59)、跳跃游戏(55)、跳跃游戏II(45)

1、螺旋矩阵(54)题目描述:【中等】给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。示例1:输入:matrix = [[1,2,3],[4,5,6],[7,8,9]]输出:[1,2,3,6,9,8,7,4,5]题目链接思路分析:1、按照层数来走圈(从左到右,从上到下,从左到右,从下到上)2、那走多少层呢?层数=(min(行数,列数)+1)// 23、每一层循环的开始位置和结束位置是关键4、当某一层只有一行 或者 一列的时候(有可能

2021-04-28 18:56:17 279

原创 记录修改Anaconda 3中jupyter notebook文件的保存位置

安装完anaconda,在jupyter notebook中创建的文件的默认保存位置为你所安装anaconda3的安装位置,要想将文件保存在其他位置,可进行以下步骤以修改保存位置:1、打开anaconda3 prompt2、输入jupyter notebook --generate-config3、按照上图中的路径,找到jupyter_notebook_config.py文件,找到 c.NotebookApp.notebook_dir 这个变量,将你设置的路径写在这里,用引号引起来,并删除这一行前

2021-04-04 22:29:41 477

原创 数据分析实践——AB测试【python】

实战AB测试1、项目简介2、数据集简介3、实践3.1 导入相关库3.2 数据处理3.3 假设检验4、总结1、项目简介\quad \quad我们现在网站也给开通了,然后我们给网站投放广告的时候,一开始给大家看到的落地页是访问课程资料,现在我们又推出了开始免费试学这个落地页,要求检测两个落地页的转化效果了,下面是测试的24天,看数据会有24天的。AB测试理论2、数据集简介\quad \quad本数据集来源AB测试\quad \quad本数据集包含了测试时长24天内的数据。user_id:用户id

2021-03-24 19:56:52 1358

原创 数据分析——AB测试

AB测试1、定义2、应用场景3、测试流程1、定义\quad \quad将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本并正式采用。2、应用场景\quad \quadAB测试的主要应用场景一共有两个:界面设计、算法设计界面设计:调整界面颜色、按钮颜色、界面外观等因素,通过视觉效果达到吸引用户的作用例如:在界面设计方面,早期推荐的是写实风格,即页面中的元素更逼真化,而近几年的界面设计更偏向于扁平风格,

2021-03-24 17:00:48 2046

原创 数据挖掘天池竞赛——心电图心跳信号多分类预测Task3特征工程

特征过程详细部分,后续再补记录代码部分#导包import pandas as pdimport numpy as npimport tsfresh as tsffrom tsfresh import extract_features, select_featuresfrom tsfresh.utilities.dataframe_functions import impute数据之前已经导入过# 对心电特征进行行转列处理,同时为每个心电信号加入时间步特征timetrain_hear

2021-03-22 21:50:36 390

原创 数据分析之实战项目——电商用户行为分析【python】

电商用户行为分析1、项目背景和目的2、数据集简介3、数据处理3.1 加载数据1、项目背景和目的\quad \quad随着互联网和电商的发展,人们习惯于网上购物。在国内,电商平台深受欢迎,每年的双11,双12活动,大量的用户在淘宝平台浏览商品,或收藏或加入购物车或直接购买。通过对用户的行为分析,探索用户购买的规律,了解商品的受欢迎程度,结合店铺的营销策略,实现更加精细和精准的运营,让业务获得更好的增长。2、数据集简介\quad \quad本数据集来源:阿里天池数据集\quad \quad本数据集包含

2021-03-21 16:03:55 7596 3

原创 数据挖掘天池竞赛——心电图心跳信号多分类预测Task2数据分析

数据分析1、 EDA目标2、 内容介绍3、代码实践3.1 载入各种库3.2 加载训练集和测试集3.3 初看数据1、 EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。2、 内容介绍载入各种数据科学以及可视化库:数据科学库

2021-03-20 10:02:57 1048

原创 SQL——关键字作为列名的处理方法

今天在刷Leetcode题时,明明语法没有错误(如下),但是一直出错,郁闷select Score,dense_rank() over(order by Score desc) as Rankfrom Scores;想了很久,原来是关键字作为列名时需要加上引号select Score,dense_rank() over(order by Score desc) as 'Rank'from Scores;加上引号就对了附Mysql常用关键字...

2021-03-17 17:08:05 1681

原创 数据挖掘天池竞赛——心电图心跳信号多分类预测Task1赛题理解

心电图心跳信号多分类预测11、赛题理解1.1 赛题概括1.2 数据概括1.3 预测指标2、多分类评价指标1、赛题理解\quad \quad 2016年6月,国务院办公厅印发《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,文件指出健康医疗大数据应用发展将带来健康医疗模式的深刻变化,有利于提升健康医疗服务效率和质量。\quad \quad 赛题以心电图数据为背景,要求选手根据心电图感应数据预测心跳信号,其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例,这是一个多分类的问题。

2021-03-16 14:12:39 1370 2

原创 LeetCode之二分查找之旋转数组系列题

旋转数组1、旋转数组(189)1、旋转数组(189)题目描述:【中等题】给定一个数组,将数组中的元素向右移动 k 个位置,其中 k 是非负数。进阶:1、尽可能想出更多的解决方案,至少有三种不同的方法可以解决这个问题。2、你可以使用空间复杂度为 O(1) 的 原地 算法解决这个问题吗?示例一:输入: nums = [1,2,3,4,5,6,7], k = 3输出: [5,6,7,1,2,3,4]解释:向右旋转 1 步: [7,1,2,3,4,5,6]向右旋转 2 步: [6,7,1,

2021-03-02 20:26:26 1855

原创 LeetCode之回溯1——电话号码的字母组合(17)、括号生成(22)、复原IP地址(93)

递归1、电话号码的字母组合(17)1、电话号码的字母组合(17)题目描述:【中等】给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。示例一:输入:digits = "23"输出:["ad","ae","af","bd","be","bf","cd","ce","cf"]题目链接思路分析...

2021-02-14 11:25:23 353

原创 『算法』——回溯算法

回溯算法

2021-02-14 09:26:18 627

原创 『算法』——递归算法

递归算法1、递归的概念2、递归的特点3、递归过程3.1 “递”3.2 “归”1、递归的概念递归,顾名思义,有递有归才叫递归。若一个对象部分地包含它自己,或用它自己给自己定义,则称这个对象是递归的;若一个过程直接地或间接地调用自己,则称这个过程是递归的过程。说白了,递归就是一个函数:在函数中,调用函数自身,我们把这样的函数叫做递归函数。2、递归的特点递归的基本思想是"自己调用自己”适合用递归方法求解的场景:有一个初始状态后续的情况可以由前面的状态推出例

2021-02-06 13:54:43 955 1

原创 LeetCode之动态规划2之不同路径(62)、不同路径II(63)、最小路径和(64)

矩阵路径1、最小路径和(64)2、不同路径(62)1、最小路径和(64)题目描述:【中等】给定一个包含非负整数的 m x n 网格 grid ,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。说明:每次只能向下或者向右移动一步。示例一输入:grid = [[1,3,1],[1,5,1],[4,2,1]]输出:7解释:因为路径 1→3→1→1→1 的总和最小。题目链接思路分析1、爬楼梯往上爬的方法只有两种:要么一个台阶,要么两个台阶。2、因此走到第 i 个楼梯的方法

2021-02-01 12:11:35 231

原创 LeetCode之对称二叉树(101)、左叶子之和(404)、最长同值路径(687)

1、对称二叉树(101)题目描述:【简单】给定一个二叉树,检查它是否是镜像对称的。例如,二叉树 [1,2,2,3,4,4,3] 是对称的。 1 / \ 2 2 / \ / \3 4 4 3 题目链接思路分析:2、左叶子之和(404)题目描述:【简单】计算给定二叉树的所有左叶子之和。 3 / \ 9 20 / \ 15 7在这个二叉树中,有两个左叶子,分别是 9 和 15,所以返回 24题目链接思路分析:

2021-01-30 17:29:20 112

原创 LeetCode之相交链表(160)、分割链表(725)

1、相交链表(160)题目描述:【简单题】编写一个程序,找到两个单链表相交的起始节点。如下面的两个链表:在节点 c1 开始相交。示例一:输入:intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA = 2, skipB = 3输出:Reference of the node with value = 8输入解释:相交节点的值为 8 (注意,如果两个链表相交则不能为 0)。从各自的表头开始算起,链表 A 为

2021-01-28 16:17:30 147 1

原创 LeetCode之相同的树(100)、另一树的子树(572)、合并二叉树(617)

1、平衡二叉树(110)题目描述:【简单】给定两个二叉树,想象当你将它们中的一个覆盖到另一个上时,两个二叉树的一些节点便会重叠。你需要将他们合并为一个新的二叉树。合并的规则是如果两个节点重叠,那么将他们的值相加作为节点合并后的新值,否则不为 NULL 的节点将直接作为新二叉树的节点。示例 1:输入: Tree 1 Tree 2 1 2

2021-01-28 11:39:28 173 2

原创 LeetCode之平衡二叉树(110)、翻转二叉树(226)

1、平衡二叉树(110)题目描述:【简单】给定一个二叉树,判断它是否是高度平衡的二叉树。本题中,一棵高度平衡二叉树定义为:一个二叉树每个节点 的左右两个子树的高度差的绝对值不超过 1 。示例 1:输入:root = [3,9,20,null,null,15,7]输出:true题目链接思路分析:这是求树的高度的延伸版, 我们只要求左右子树相差的高度是否超过 1,就可以了!题解一:自顶向下的递归1、首先我们需要定义一个高度函数,用于计算二叉树中的任意一个节点 p 的高度2、我们

2021-01-27 11:20:25 312

原创 Leetcode之颠倒二进制位(190)、2的幂(231)、4的幂(342)

1、颠倒二进制位(190)题目描述:【简单】颠倒给定的 32 位无符号整数的二进制位。示例一:输入: 00000010100101000001111010011100输出: 00111001011110000010100101000000解释: 输入的二进制串 00000010100101000001111010011100 表示无符号整数 43261596, 因此返回 964176192,其二进制表示形式为 00111001011110000010100101000000。来源

2021-01-23 14:09:39 235 1

原创 Leetcode之丢失的数字(268)、只出现一次的数字III(260)

1、丢失的数字(268)题目描述:【简单】给定一个包含 [0, n] 中 n 个数的数组 nums ,找出 [0, n] 这个范围内没有出现在数组中的那个数。进阶:你能否实现线性时间复杂度、仅使用额外常数空间的算法解决此问题?示例 1:输入:nums = [3,0,1]输出:2解释:n = 3,因为有 3 个数字,所以所有的数字都在范围 [0,3] 内。2 是丢失的数字,因为它没有出现在 nums 中。示例 2:输入:nums = [0,1]输出:2解释:n = 2,因为有 2

2021-01-23 13:59:32 221

原创 Leetcode之汉明距离:两个数字对应二进制位不同的位置的数目(461)、只出现一次的数字(136)

1、汉明距离(461)题目描述:【简单】两个整数之间的汉明距离指的是这两个数字对应二进制位不同的位置的数目。给出两个整数 x 和 y,计算它们之间的汉明距离。注意:0≤x,y<231.0 ≤ x, y < 2^{31}.0≤x,y<231.示例:输入: x = 1, y = 4输出: 2解释:1 (0 0 0 1)4 (0 1 0 0) ↑ ↑题目链接思路分析:1、首先是二进制2、想到二进制的按位异或运算:当两个对应位不同时结

2021-01-23 12:24:55 1123

原创 二进制算术、逻辑运算

二进制算术1、逻辑运算1.1 加法运算规则1.2 减法运算规则1.3 乘法运算规则1.4 除法运算规则2、逻辑运算\quad \quad二进制是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一”,借位规则是“借一当二”,由18世纪德国数理哲学大师莱布尼兹发现。当前的计算机系统使用的基本上是二进制系统,数据在计算机中主要是以补码的形式存储的.二进制数的运算包括算术运算、逻辑运算。1、逻辑运算1.1 加法运算规则规则:逢二进一例子:1.2 减

2021-01-23 11:43:27 5788

原创 IDEA中Maven项目打包方式

方式一:只打包程序包,包括类的方法。在其他应用中运行时,必须保证其上面有相应的依赖包,才能运行。maven——》Lifecyle——》Clean——》Package打包成功后就会出现target文件夹方式二:打包两个jar包:一个是架包(只包含程序包即方式一打的包一个是全包(包含程序包、依赖包)一般都会选择方式二进行打包,这样可以直接在其他应用中调用maven——》Plugins——》assembly——》assembly:assembly打包成功后就会出现targ

2021-01-19 14:32:09 29341 2

原创 windows10修改hosts文件

1、以管理员身份运行cmd命令提示符2、在命令行中输入:notepad %windir%\system32\drivers\etc\hosts3、hosts文件就打开了,修改完直接ctrl+s保存即可。

2021-01-19 13:35:42 1371

原创 Spark之IDEA创建基于Scala语言的Spark Maven项目

创建MVN1、创建Maven工程1.1 新建一个工程1.2 设置Maven配置指向2、首先我们需要搭建好相关的环境,包括:IntelliJ IDEA(官网上下载最新的就行了)、JDK(1.8)、Scala(2.12.12)、Spark(3.0.1)、Hadoop(2.7.4)Maven(如果你下载的是最新版的IDEA的话就不用下载了,因为IDEA里面已经自带了)(安装完后记得添加环境变量)1、创建Maven工程1.1 新建一个工程创建出来就是这样的1.2 设置Maven配置指向Fi

2021-01-17 18:58:00 1598

原创 Spark之【运行模式、环境搭建】

运行模式1、 Local模式1.1 环境搭建1.2 启动spark-shell1.3 读取文件1.4 应用场景1.2、Spark Standalone模式1.2 启动Local模式\quad \quadSpark注重建立良好的生态系统,它不仅支持多种外部文件存储系统,也提供了多种多样的集群运行模式。部署在单台机器上时,既可以用本地(Local)模式运行,也可以使用伪分布式模式来运行;当以分布式集群部署的时候,可以根据自己集群的实际情况选择Standalone模式(Spark自带的模式)、Spark on

2021-01-16 21:38:02 1020

原创 Spark之Spark任务的提交方式【Spark-shell、Spark-submit】

spark-shell1、概述2、启动1、概述\quad \quadSpark-shell 是 Spark 给我们提供的交互式命令窗口(类似于 Scala 的 REPL)2、启动直接启动bin目录下的spark-shell:./spark-shell<1>直接使用 ./spark-shell表示使用local 模式启动,在本机启动一个SparkSubmit进程<2>还可指定参数 --master,如:spark-shell --master local[

2021-01-16 20:45:09 11769

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除