自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 使用ItelliJ IDEA构建Spark项目(Windows)

最近实习需要用到Graphx, 但是之前没有接触过Spark的相关知识,于是开始自学Spark。首先环境搭建就是一道坎,折腾来折腾去花了两天的时间才终于成功基于Scala和Maven 实现了WordCount,也算是Spark中的HelloWorld了吧。环境搭建首先我们需要搭建好相关的环境,包括:IntelliJ IDEA(官网上下载最新的就行了)、JDK(1.8)、Scala(2.12.12)、Spark(3.0.1)、Hadoop(2.7.4)Maven(如果你下载的是最新版的IDEA的话就不用下

2020-12-30 18:21:57 1376

原创 Neo4j环境配置-windows

安装JDK环境参考:JDK下载链接安装Neo4j下载Neo4j下载链接:Neo4j的下载链接(这里我用的是社区版)解压Neo4j并运行到解压的文件夹下的空白处按住“Shift”键并单击右键打开Powershell, 输入 ***.\neo4j.bat console***回车运行。运行效果如下:运行Neo4j浏览器在完成上述步骤后,在浏览器输入Neo4j浏览器运行如下图所示这里用户名和密码默认的都是***neo4j***到这里Neo4j的安装流程就介绍完了。...

2020-12-21 19:16:51 229 1

转载 求第n个丑数

求第n个丑数题目描述把只包含质因子2、3和5的数称作丑数(Ugly Number)。例如6、8都是丑数,但14不是,因为它包含质因子7。 习惯上我们把1当做是第一个丑数。求按从小到大的顺序的第N个丑数例如:前20个丑数为:1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 15, 16, 18, 20, 24, 25, 27, 30, 32, 36。方法一最容易想到的就是从1开始往上遍历各个整数,然后分别判断其是不是丑数,如果是的话数量加1,不是的话跳过。最后输出第N个丑数就行了。代码

2020-12-01 20:56:03 387

转载 复杂链表的复制

复杂链表的复制题目描述输入一个复杂链表(每个节点中有节点值,以及两个指针,一个指向下一个节点,另一个特殊指针random指向一个随机节点),请对此链表进行深拷贝,并返回拷贝后的头结点。(注意,输出结果中请不要返回参数中的节点引用,否则判题程序会直接返回空)思路本体的难点在于特殊指针的复制,解决方法是先将每个原节点复制一遍放在对应原节点的后面,原节点之间的相对位置和新节点之间的相对位置是一致的,这样以来就能很容易的将特殊指针也复制到新节点上了。最后再将原链表拆分成一老一新两个链表。第一步:复制原节

2020-11-24 16:40:35 102

原创 剑指OFFER23-二叉树中和为某一值的路径

二叉树中和为某一值的路径输入一颗二叉树的根节点和一个整数,按字典序打印出二叉树中结点值的和为输入整数的所有路径。路径定义为从树的根结点开始往下一直到叶结点所经过的结点形成一条路径# -*- coding:utf-8 -*-# class TreeNode:# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution:

2020-10-23 14:46:31 107

原创 剑指OFFER-21栈的压入、弹出序列

题目描述输入两个整数序列,第一个序列表示栈的压入顺序,请判断第二个序列是否可能为该栈的弹出顺序。假设压入栈的所有数字均不相等。例如序列1,2,3,4,5是某栈的压入顺序,序列4,5,3,2,1是该压栈序列对应的一个弹出序列,但4,3,5,1,2就不可能是该压栈序列的弹出序列。(注意:这两个序列的长度是相等的)使用辅助栈# -*- coding:utf-8 -*-class Solution: def IsPopOrder(self, pushV, popV): # write

2020-10-21 13:54:35 116

转载 为什么说随机最速下降法(SGD)是一个很好的方法?

确实在实际实验中我也发现,很多时候在**充分调参**后采用SGD得到的最终效果反而是最好的

2020-10-08 14:55:32 169

原创 剑指OFFER-10矩阵覆盖

剑指OFFER-10矩阵覆盖我们可以用21的小矩形横着或者竖着去覆盖更大的矩形。请问用n个21的小矩形无重叠地覆盖一个2*n的大矩形,总共有多少种方法?这道题的要点就是对于题干的理解和转换,可以看到大矩形的行上的长度是固定的(2)唯一的变化在于列上的长度(n)而列上的填充方式:1.2 * 1的小矩阵竖着去覆盖(相当于前进一格) 2.2个2 * 1的小矩阵横着去覆盖(相当于前进两格)于是这个问题就转换成了青蛙跳格的问题了定义数组元素的含义:dp[i] 当n为i时的覆盖方法数组元素之间的关系式:dp

2020-09-24 12:57:45 100

原创 根据先历和中历结果构建二叉树

根据先历和中历结果构建二叉树例子:先历[1,2,3,4],中历[1,2,3,4]二叉树[1 # 2 # 3 # 4 #] def reConstructBinaryTree(self, pre, tin): # write code here head = TreeNode(pre[0]) if len(pre) == 1: return head temp = tin.index(pre[0]) if t

2020-09-22 19:18:59 97

原创 直接选择排序(python)

直接选择排序'''平均时间复杂度 O(n^2)最好情况时间复杂度 O(n^2)最坏情况时间复杂度 O(n^2)空间复杂度O(1)不稳定举个例子 (5) 4 3 [5] 1当1和(5)交换时,(5)和[5]之间的位置关系改变'''def straight_select(l): for j in range(len(l)): min = j for i in range(j+1,len(l)): if l[i] < l[

2020-09-19 12:21:15 222

原创 直接插入排序(python)

直接插入排序'''最好的情况O(n^2)最坏的情况O(n^2)平均情况O(n^2)'''def insert_sort(l): for i in range(1, len(l)): temp = l[i] j = i - 1 while l[j] > temp and j >= 0: l[j+1] = l[j] j -= 1 l[j+1] = temp...

2020-09-18 21:51:30 125

原创 堆排序(python)

堆排序def heap_adjust(heap,heap_size,p): largest = p left_child = 2*p + 1 right_child = 2*p + 2 if left_child < heap_size and heap[left_child] > heap[largest]: largest = left_child if right_child < heap_size and heap[righ

2020-09-18 13:58:01 87

原创 优化冒泡排序(python)

#优化冒泡排序(python)'''记录交换操作发生的位置,如果没有发生交换操作,则代表排序已经可以终止这样一来冒泡排序最好的情况下,时间复杂度就从O(n^2)优化到了O(n)'''def imroved_bubble_sort(l): length = len(l) swaplast = length - 1 for i in range(len(l)): sign = swaplast for j in range(swaplast):

2020-09-16 21:13:14 131

原创 快速排序(python)

#快速排序python实现参考:挖坑填数+分治法def quick_sort(l,left,right): tail = left head = right pivot = l[left] if left >= right: return while tail < head: while tail < head and l[head] >= pivot: head -= 1

2020-09-16 20:15:33 69

原创 关系抽取数据集介绍

最近由于实验需要,收集整理了关系抽取方向的数据集,主要包括SemEval、Wiki80、NYT10。目前来说全监督的关系抽取任务一般在SemEval上做,远程监督的关系抽取任务一般在NYT10上做。SemEval数据集来源SemEval数据集来自于2010年的国际语义评测大会中Task 8:” Multi-Way Classification of Semantic Relations Be...

2020-03-05 16:55:24 12752 5

原创 尝试将BERT应用于IMDB情感分类任务

前言之前在学习《Python深度学习》这本书的时候记得在书中有一个 使用GloVe词嵌入的方式进行IMDB数据集的情感分类任务,而最近在网上学习了一个使用BERT进行关系抽取的项目,于是乎考虑尝试用BERT来再次尝试对IMDB数据集的情感分类任务。同样的这次也是采取随机的200个数据集作为训练集,10000个数据集作为测试集。全部代码在github上已经给出。步骤本次实验的大致步骤同书中的例...

2020-02-25 12:04:34 2526 4

原创 SGDClassifier() predict_proba()失败

今天在使用SGDClassifier()的时候发现,其无法使用predict_proba()这个方法,然后查阅Sklearn的中文文档发现如下解决方法:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDClassifier.html#sklearn.linear_model.SGDClass...

2019-09-30 21:02:54 2424

原创 Keras 分词器 Tokenizer大小写问题

今天在使用 Keras 中的 Tokenizer 进行分词 one-hot的过程中发现了一个问题:在对特征进行向量化之后,查阅索引字典的时候发现有一些词的索引无法查看,错误提示:“KeyError”。例子:data = ["I am a student"]tokenizer1 = Tokenizer()tokenizer1.fit_on_texts(data)one_...

2019-09-15 17:50:40 849

原创 吴恩达机器学习笔记

机器学习笔记1.吴恩达机器学习笔记(一)——线性回归2.吴恩达机器学习笔记(二)——逻辑回归3.吴恩达机器学习笔记(三)——矩阵运算4.吴恩达机器学习笔记(四)——神经网络5.吴恩达机器学习笔记(五)——机器学习拓展6.吴恩达机器学习笔记(六)——支持向量机7.吴恩达机器学习笔记(七)——无监督学习8.吴恩达机器学习笔记(八)——异常检测及推荐系统9.吴恩达机器...

2019-08-21 20:45:05 2408

原创 吴恩达机器学习笔记(九)——大规模机器学习

大规模机器学习1 大规模机器学习可行性 由之前机器学补充里的知识可知,有的时候并不是数据越多对算法越好,当方差偏小的时候,说明此时的拟合度会比较大,数据缺乏泛性,这个时候使用更大的数据集可能会对算法有帮助。 这个时候,我们可以绘制学习曲线,根据学习曲线判断是否需要更...

2019-08-21 20:25:24 2001

原创 吴恩达机器学习笔记(八)——异常检测及推荐系统

异常检测与推荐系统1 异常检测 例:假想你是一个飞机引擎制造商,当你生产的飞机引擎从生产线上流出时,你需要进行QA(质量控制测试),而作为这个测试的一部分,你测量了飞机引擎的一些特征变量,比如引擎运转时产生的热量,或者引擎的振动等等。 当以前看到这样的问题时,我首先想到的应该是...

2019-08-21 20:25:17 2056

原创 吴恩达机器学习笔记(七)——无监督学习

无监督学习1 概述 与监督学习不同,在无监督学习中我们所拥有的数据集是不带有标签的。我们需要做的是将一系列无标签的训练数据代入到算法当中,让算法告诉我们这组数据的一些内在结构特点。2 K-MEANS2.1 主要目的 K-均值是最普及的聚类算法...

2019-08-21 20:25:11 2052

原创 吴恩达机器学习笔记(六)——支持向量机

支持向量机1 概述 支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边...

2019-08-21 20:25:04 2253

原创 吴恩达机器学习笔记(五)——机器学习拓展

机器学习拓展1 主要内容 这一周的学习内容主要是在上面所学习到的机器学习算法基础上,如何选择对算法进一步优化的方向以及如何对算法更合理的进行评估。2 优化算法的几个方向(1).获得更多的训练样本(2).尝试减少特征的数量(3).尝试获得更多的特征(4)....

2019-08-21 20:24:57 1965

原创 吴恩达机器学习笔记(四)——神经网络

神经网络学习笔记1 为什么选择神经网络 无论是线性回归还是逻辑回归,当特征太多时计算的负荷会变得很大。例如当我们的训练对象是一组50X50分辨率的图片时,我们将会有2500个特征,当我们进一步将其构成一个两两组合的多项式模型时就会有2500的平方个特征。因此我们需要更适合的模型。2 神经...

2019-08-21 20:24:48 2426

原创 吴恩达机器学习笔记(三)——矩阵运算

矩阵运算1 主要内容 在目前所学习到的算法里,当具体实现的时候很多情况下都会用到数学公式转矩阵运算的应用,在这里我以一个2X3维的特征矩阵和一个对应的目标值矩阵,以及一个参数向量来推导一遍,加深对于这方面的理解。2 代价函数矩阵运算转换 首先我们将假设函...

2019-08-21 20:24:37 2745

原创 吴恩达机器学习笔记(二)——逻辑回归

逻辑回归学习笔记1 主要内容 由于上周学习了线性回归的内容,因此这次回顾我想从两者之间的不同以及新学习到的通用知识来进行。2 应对问题不同 在所研究的问题上,线性回归要做的是得出拟合度高且具有泛型的回归线,最终能对给定特征值做出预测;逻辑回归要做的是分类,要做...

2019-08-21 20:24:25 2190

原创 吴恩达机器学习笔记(一)——线性回归

线性回归学习笔记1.线性回归概述 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。其在金融、医疗等领域有着广泛的应用。y=ax+b 一元线性回归可以看作是多元线性回归的一个特例,因此只要分析多元线性回归的特性。2.算法...

2019-08-21 20:24:18 2318 1

原创 c语言小游戏实践-贪吃蛇

今天无意间翻以前的代码时看到了当初写的贪吃蛇,改了改几处bug,增加了一个记录得分的模块。感觉自己最多只能拿到55分。有兴趣的小伙伴可以看看。/*名称:贪吃蛇 作者:tedist 基本实现方法:链表表示蛇体,在while循环以及Sleep函数下用printf函数实现游戏的动态化。(在没有吃到食物的时候用增头去尾的方法表示移动,吃到食物的时候不去掉尾) 1.定义蛇体的每一个结...

2019-02-27 21:31:27 2266

原创 DELL VENUE 11 7130解锁功耗墙总结

  18年3月份呢入手v11,刚开始使用的时候由于天气并不高,没有出现很严重的降频现象所以整体来看使用的感觉还不错。到了暑假的时候,由于天气炎热,开始频频撞到功耗墙,频率大幅下降到1.0ghz以下,这个时候的电脑基本上就处于很卡很卡的状态了(看个弹幕都和ppt一样)。这时候就开始在网上查攻略解锁温度墙了。经过很长时间的摸索,我总结了一下解锁方案,目前本人一直在时候用,解锁后功率设到9w,降频现象明...

2019-02-08 12:48:48 21758 5

原创 二叉树结点深度(C语言)

  在每个结点中储存其深度。在二叉树的创建和遍历过程中可以发现,每次调用函数的时候都是前往左子树或者右子树,这个时候所前往的结点的深度都会增加一个,而当函数调用完成的时候会退出函数栈在此函数中的结点深度就会减少一个。因此可以设置一个全局变量deep来表示当前函数中的结点的深度,在创建二叉树的函数开头深度加1,当函数调用结束退栈前再将深度减1.如下图所示的二叉树下面是代码#include&lt;st...

2018-06-01 16:43:35 10907

原创 二叉树线索化及遍历(纯C语言)

  最近在学习数据结构(c语言),严老师内容很详细,但书中的语言为类C语言。即使弄清楚了算法的理论但当我在实际编程中却发现需要根据c语言的语法修改一些。主要感觉就是书中引用的c++中的引用“&amp;”。在C语言中我一般用函数返回值或者二重指针来进行替代。二叉树线索化及遍历中也运用了这些。分享出来希望能有所借鉴不足之处也希望指出。typedef enum pointertag{link,threa...

2018-04-09 17:16:35 2748 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除