自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Lollipop66的博客

IT 技术/笔记

  • 博客(47)
  • 收藏
  • 关注

原创 简单易懂——决策树

一、废话(可不看)最近在复习整理(重学)一些算法的相关知识,最先看的那肯定就是决策树了,而很多人就在第一个决策树这放弃了,当然是少数奥,我就是为了拯救那少数而生的!(我的废话好多)二、啥是决策树?首先说啥玩意是决策树,英文名叫Decision Tree(DT),你第一眼看决策树这几个字,肯定知道它就是个树模型。那么说到树模型你又会想到根节点、内部节点、叶子节点。在DT中,而我们的目标就是选择一个很好的属性对样本进行划分,保证其准确率。根节点包含了所有样本,内部节点代表用哪个属性去分裂,或者说代表

2021-07-22 23:27:50 720 2

原创 二分查找的边界确定

根据区间来定义,看是左闭右开还是左闭右闭https://www.lagou.com/lgeduarticle/124998.html

2020-07-29 11:43:12 201

原创 RNN(循环神经网络)学习资料整理

最近在仔细研究RNN(循环神经网络)的一些基础知识,看了一些blog,整理在这里,都是同一个作者的一些列文章,感觉写的深入浅出。建议按照顺序阅读:没有BP神经网络基础的可以查看:https://zhuanlan.zhihu.com/p/248018141. RNN基础知识:https://zhuanlan.zhihu.com/p/308449052.RNN为什么可以记忆历史信息:https://zhuanlan.zhihu.com/p/315980543.RNN的2种应用场景:https

2020-07-06 20:13:13 320

原创 Error running 'xxxxx': No jdk for module XXXXXXX

写完一个文本之后发现不能运行,右键没有run的选项强行运行会报:Error running 'xxxxx': No jdk for module XXXXXXX查了一些blog解决办法:IntelliJ IDEA->Preferences->左侧搜索栏->jdk将use....换成1.8(java version...)即可!...

2019-10-22 15:03:22 2301 2

转载 BP神经网络算法推导/激活函数文章推荐(开头)

本篇文章为转载,真的觉得这篇文章写的详细易懂,推导也写的很清晰,怕之后删除掉,所以复制过来原文地址:https://zhuanlan.zhihu.com/p/38006693另外还有一篇专门写激活函数的文章:https://blog.csdn.net/tyhj_sf/article/details/79932893首发于腾讯技术已关注写文章AI从入门到放弃...

2019-09-26 15:29:05 2338 1

原创 python爬虫新技能(反爬虫机制)

最近在做nlp,然后需要一些语料作为字典,所以就进行了一些爬虫,但是很多网站会有反爬虫机制其实维基百科也是很好的中文语料库,但是问题是现在国内需要翻墙才可以访问维基百科在我进行爬虫的过程中,遇到的问题是网页中有<input type="hidden">所以导致我用python的requests去请求之后,在用html.xpath()得不到我所需要的内容。于是请教大神,...

2019-09-25 14:17:16 613 1

原创 python笔记--XML解析(xml转成txt或者pkl)

一、python对XML的解析主要有三种方式,分别如下:1.SAX (simple API for XML )Python 标准库包含 SAX 解析器,SAX 用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。2.DOM(Document Object Model)将 XML 数据在内存中解析成一个树,通过对树的操作来操作XML。...

2019-09-25 13:09:20 1011

转载 人工智能 之 自然语言处理(NLP)算法分类总结

目录文章目录目录 〇、推荐 一、人工智能学习算法分类 1. 纯算法类 2.建模方面 二、详细算法 1.分类算法 2.回归算法 3.聚类算法 4.降维算法 5.概率图模型算法 6.文本挖掘算法 7.优化算法 8.深度学习算法 三、建模方面 1.模型优化· 2.数据预处理 〇、推荐无意中发现了一个巨牛的人工智能教程,...

2019-09-18 16:43:01 607

原创 NLP粗浅知识

一、总体介绍1.NLP = NLU+NLGNLP:Natural Language Processing(自然语言处理)NLU: Natural Language Understanding(自然语言理解)NLG:Natural Language Generation(自然语言生成)2.分为四个维度:1)Semantic(语义) : NLU2)Syntax(...

2019-09-11 20:21:32 490

原创 DNS/HTTP/Session/cookie/Aname/CName/根服务器/URL/header

2019.7.22讲http 和 dns 分别是什么.考点:1.http协议头中都有哪些内容, 这些内容是用来做什么的?https://blog.csdn.net/u010429424/article/details/780320062.cookie 和 session 是什么3.header 用来做什么4.HTTP 和 TCP 的关系是什么?5.URL 由哪些...

2019-07-23 19:13:41 364

原创 Python笔记--第3章字符串(Python基础教程)

一、字符串基本操作索引、切片、乘法、成员资格检查、长度、长度、最小值、最大值字符串不可变,因此元素赋值和切片赋值是非法的、二、设置字符串的格式>>> "{3} {0} {2} {1} {3} {0}".format("be","not","or","to")'to be or not to be'三 设置字符串长度>>> "{foo}...

2019-07-18 20:25:46 148

原创 Python笔记--第2章元组和列表

python有一种数据结构叫做容器,容器就是可包含其他对象的对象。二种主要对的容器就是序列(eg:列表和元组)和映射(eg:字典)一、列表列表是可以修改的二、元组元组不可以修改,元组可以用作字典键三、通用序列操作(索引、切片、相加、相乘、成员资格检查)1. 索引、>>>greeting='Hello'>>>gr...

2019-07-18 01:00:11 397

原创 python笔记--运算符整除/取余/除法小技巧(7.15)

1. 整除 //10 //3 = 310//-3 = -4-10//-3 = 3对于整除运算,需要明白重点是向下圆整。因此结果为负数的情况下,圆整将离0更远。2. 取余数%公式:x%y = x - ((x//y) * y)10%-3 = 10-((10//-3)*-3)=-23.除法/得到的是小数1/2 = 0.54. input...

2019-07-16 00:10:03 6585

转载 特征选择常用算法

特征选择常用算法综述特征选择的一般过程:1.生成子集:搜索特征子集,为评价函数提供特征子集2.评价函数:评价特征子集的好坏3.停止准则:与评价函数相关,一般是阈值,评价函数达到一定标准后就可停止搜索4.验证过程:在验证数据集上验证选出来的特征子集的有效性 1.生成子集搜索算法有 完全搜索、启发式搜索、随机搜索 三大类。(1)完全搜索&lt;1&gt;宽搜(B...

2019-01-09 21:51:00 3932

原创 随机森林

1.随机森林的生成过程每棵树的按照如下规则生成:  1)如果训练集大小为N,对于每棵树而言,随机且有放回地从训练集中的抽取N个训练样本(这种采样方式称为bootstrap sample方法),作为该树的训练集;  从这里我们可以知道:每棵树的训练集都是不同的,而且里面包含重复的训练样本(理解这点很重要)。  为什么要随机抽样训练集?  如果不进行随机抽样,每棵树的训练集都一样,...

2018-10-07 21:26:01 1289

原创 shell 批量改变文件名

改变某个字段的名字,改变一部分 for file in `ls | grep .sh`donewfile=`echo $file |sed 's/wyy/lwn/g'`mv $file $newfiledone

2018-08-03 15:26:09 411

原创 剑指Offer——队列和栈

9.用两个栈实现队列思路:         栈:先进后出            队列:先进先出         二个栈stack1和stack2,当进队列时候,就是让其进入stack1,当出队列的时候,如果stack2不为空,则直接stack2出栈即可,如果stack2为空,则让stack1中所有的元素均进入stack2,然后在出栈        因为stack1中最先进去的是我们想要的最先出来的...

2018-07-16 12:59:14 191

原创 剑指Offer——19 正则表达式匹配

之前做这个题的时候特别凌乱,但这次会好很多,把思路分享出来,以及边界的确定​思路:我们用俩个索引来控制字符串和模式串已经匹配到达的位置,index1和index2,​ 这个问题就难在有*的位置,我们需要考虑下一个位置为*时候怎么处理​ 1.模式串的index2下一个位置为*​ 1)字符串的index1位置与模式串index2位置是匹配的或者index2位置为...

2018-07-16 11:17:23 190

转载 21个数据科学家面试必须知道的问题和答案

21个数据科学家面试必须知道的问题和答案转载请注明! KDnuggets 编辑提供了用以斟辨“假”数据科学家之二十问的答案,包括什么是正则化(regularization),我们喜爱的数据科学家,模型验证等等。作者:Gregory Piatetsky,KDnuggets近期发布在KDnuggets上的一篇文章:《检测“假”数据科学家的二十问》非常热门,获得了1月阅读排行榜第一名。然而,这些问题并没...

2018-07-11 09:28:47 2783

原创 剑指Offer分类——字符串(4,20,43,50,58,67)

43.1~n 整数中1出现的次数思路1:正常可以从1遍历到n,然后统计每个数字中出现的1的次数思路2:eg:21345,我们将其分为1-1345,和1346-21345,万位出现1的次数为10000,之后我们考虑其余四位数出现1的次数,可以将其分为1346-11345和11346-213456,我们可以将剩余的看成是四个位置的全排列,并且去一位为1,而有二组这样的排列,所以,2*4*10^3,然后...

2018-07-09 19:17:49 251

转载 CNN笔记:通俗理解卷积神经网络

 通俗理解卷积神经网络(cs231n与5月dl班课程笔记)转自:https://blog.csdn.net/v_july_v/article/details/518124591 前言    2012年我在北京组织过8期machine learning读书会,那时“机器学习”非常火,很多人都对其抱有巨大的热情。当我2013年再次来到北京时,有一个词似乎比“机器学习”更火,那就是“深度学习”。    ...

2018-07-09 09:44:20 232

原创 剑指Offer分类——链表(6,24,22,23,25,35,52,18)

链表:我觉得链表在做题的时候一个很好的方法就是画图,通过画图将指针不断变化,这样可以很好的将指针指来指去!!!6. 从尾到头打印链表思路1(不改变链表结构):从尾到头打印链表,我们知道链表是一个只能向后不能向前的结构(单链表),那我们想从后向前打印,就可以想到一个结构叫做栈,栈结构是后进先出,也就是说,我们可以让链表的每一个元素一次进栈,然后出栈的时候就是从链表的末尾先出栈,所以我们可以采用栈结构...

2018-07-08 14:46:31 344

转载 支持向量机通俗导论(理解SVM的三层境界)

支持向量机通俗导论(理解SVM的三层境界)作者:July 。致谢:pluskid、白石、JerryLead。说明:本文最初写于2012年6月,而后不断反反复复修改&amp;优化,修改次数达上百次,最后修改于2016年11月。声明:本文于2012年便早已附上所有参考链接,并注明是篇“学习笔记”,且写明具体参考了pluskid等人的文章。文末2013年的PDF是为证。前言    动笔写这个支持向量机(...

2018-07-02 21:13:24 174

转载 BAT机器学习面试1000题系列

BAT机器学习面试1000题系列整理:July、元超、立娜、德伟、贾茹、王剑、AntZ、孟莹等众人。本系列大部分题目来源于公开网络,取之分享,用之分享,且在撰写答案过程中若引用他人解析则必注明原作者及来源链接。另,不少答案得到寒小阳、管博士、张雨石、王赟、褚博士等七月在线名师审校。说明:本系列作为国内首个AI题库,自2017年9月28日开始,每周持续更新。首发于七月在线实验室公众号上:julyed...

2018-06-30 21:10:48 1346

原创 剑指offer ——具体分类

一、线性表1、数组思路总结:点击打开链接面试题3:数组中重复的数字面试题4:二维数组中的查找面试题11. 旋转数组的最小数字面试题21:调整数组顺序使得奇数位于偶数前面面试题39:数组中出现超过一半的数字面试题40:最小的k个数面试题42:连续子数组的最大和面试题45:把数组排成最小的数面试题51:数组中的逆序对面试题53:数字在排序数组中出现的次数...

2018-06-29 11:33:24 1748 2

原创 剑指offer——数组归类(3, 3_1, 4,11,21,39,40,42,45,51,53,56,66)

最近根据专题更新一些剑指offer的一些思路(如果有需要剑指offer代码(java)可以评论,然后可以分享给大家)3.找出数组中重复数字思路1,排序之后,然后依次查找当前与下一个是否一致(时间复杂度O(nlogn), 空间复杂度O(1))思路2,使用HashTree,依次存入,然后判断是否存在与其一致的值(时间复杂度O(n), 空间复杂度O(n...

2018-06-26 16:11:18 591

原创 剑指Offer,面试题19,正则表达式匹配

面试题19请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配解析:本题用java写要考虑数组越界的问题,然后分为几种情况去讨论首先说跳出递归的条件:1. ...

2018-05-20 13:54:24 200

转载 逻辑回归的常见面试点总结

1.简介      逻辑回归是面试当中非常喜欢问到的一个机器学习算法,因为表面上看逻辑回归形式上很简单,很好掌握,但是一问起来就容易懵逼。所以在面试的时候给大家的第一个建议不要说自己精通逻辑回归,非常容易被问倒,从而减分。下面总结了一些平常我在作为面试官面试别人和被别人面试的时候,经常遇到的一些问题。2.正式介绍     如何凸显你是一个对逻辑回归已经非常了解的人呢。那就是用一句话概括它!逻辑回归...

2018-04-26 19:55:49 276

转载 判断单链表是否相交

转自:https://blog.csdn.net/jiqiren007/article/details/6572685二个单链表相交只能是Y,不能是X,因为单链表每个节点只有一个指针问题描述:一个比较经典的问题,判断两个链表是否相交,如果相交找出他们的交点。思路:1、碰到这个问题,第一印象是采用hash来判断,将两个链表的节点进行hash,然后判断出节点,这种想法当然是可以的。2、当然采用暴力的方...

2018-04-19 16:43:46 247

原创 LeetCode3.最长无重复子串/阿里面试题手写代码(2018春招实习)

给定一个字符串,找出不含有重复字符的 最长子串 的长度。示例:给定 "abcabcbb" ,没有重复字符的最长子串是 "abc" ,那么长度就是3。给定 "bbbbb" ,最长的子串就是 "b" ,长度是1。给定 "pwwkew" ,最长子串是 "wke" ,长度是3。请注意答案必须是一个子串,"pwke" 是 子序列 而不是子串。详解:这个题其实很简单,但是之前也是因

2018-04-11 21:04:54 668

原创 剑指Offer——跳台阶、变态跳台阶(青蛙)

跳台阶:一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。递归法(剑指offer解释的很明白):public class Solution {    public int JumpFloor(int target) {        if(target==1)            return 1;        if(target ==2)       ...

2018-04-01 19:10:59 223

原创 网易2018,第四题,游历魔法王国

这个题自己做的时候遇到点困难,所以做下笔记(其他题可以给我留言,有源代码)[编程题] 游历魔法王国时间限制:1秒空间限制:32768K魔法王国一共有n个城市,编号为0~n-1号,n个城市之间的道路连接起来恰好构成一棵树。小易现在在0号城市,每次行动小易会从当前所在的城市走到与其相邻的一个城市,小易最多能行动L次。如果小易到达过某个城市就视为小易游历过这个城市了,小易现在要制定好的旅游计划使他能游历...

2018-03-21 18:25:52 811

原创 java中String,StringBuffer

1,String是不可以改变的,而StringBuffer是可以改变的2,方法charAt()返回的是一个char类型3,将char类型转换成String类型,eg:char a = ‘a’;String aa = a+"";这样就可以将char转换成String4,将StringBuffer转换成String可以使用toString()方法5,使用ASCII码,可以将字符进行转换,但前提是字符型...

2018-03-19 15:59:18 169

原创 神经网络——学习笔记

神经网络是用来解决分类问题的模型。他与感知机有着紧密的联系。神经网络中,神经元接收到的总输入将与神经元的阈值进行比较,然后通过“激活函数”处理以产生神经元的输出。最理想的激活函数是阶跃函数,但是他不连续,不光滑,所以,采用Sigmoid函数来进行替代。        感知机只有输出层神经元进行激活函数处理,即只拥有一层功能神经元。        多层神经网络的学习能力比多层感知机强的多。误差逆传播...

2018-03-13 15:43:00 256

原创 感知机(perceptron)学习——学习笔记

一、感知机 \quad感知机是二分类线性分类模型,输入为实例的特征向量,输出为+1,或者-1.由输入到输出函数为f(x) = sign(w*x+b),w为权值(weight),b叫做偏置(bias)。sign为符号函数。(w是超平面的法向量,b是超平面的截距)。\quad感知机是通过确定一个超平面来将样本分成两类,也就是说我们通过不断调整w和b来确定这个超平面,直到找到这个超平面为止。简...

2018-03-11 16:09:53 2297

原创 LeetCode719. Find K-th Smallest Pair Distance (hard)

Given an integer array, return the k-th smallest distance among all the pairs. The distance of a pair (A, B) is defined as the absolute difference between A and B.Example 1:Input:nums = [1,3,1]k = 1...

2018-03-09 17:46:03 275

原创 决策树

       决策树模型呈现树结构,在分类问题中表示基于特征进行分类的过程,可以看成if-then规则的集合,也可以认为是定义在特征空间和类空间的条件概率分布。决策树分类学习包括了:特征选择,决策树的生成和决策树的修剪。       1.为什么说是条件概率分布?       决策树可以看成是由各个单元给定条件下类的条件概率分布组成的。       2. 特征选择和生成       ...

2018-03-08 16:15:01 304

原创 剑指offer,面试题4,二维数组中的查找

题目描述在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。选取右上角的解答方法,如果目标比这个数小,则减少一列,如果目标比这个数大,则减少一行public class Solution {    public boolean Find(int target, int [][] arr...

2018-03-07 16:49:16 213

原创 leetcode45. Jump Game II

Given an array of non-negative integers, you are initially positioned at the first index of the array.Each element in the array represents your maximum jump length at that position.Your goal is to rea...

2018-02-01 20:10:07 204

原创 leetcode41. First Missing Positive

Given an unsorted integer array, find the first missing positive integer.For example,and [3,4,-1,1] return 2.Your algorithm should run in O(n) time and uses constant space.找到第一个缺失的正整数,这个题首先要讲第i个位置放上值为...

2018-01-28 22:31:03 153

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除