自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 Factory method ‘tracer‘ threw exception; nested exception is java.lang.NoClassDefFoundErr

Factory method 'tracer' threw exception; nested exception is java.lang.NoClassDefFoundErr解决方法解决方法考虑sdk的版本以及下载源进行解决

2021-09-17 10:48:09 1456 1

原创 排序算法之-堆排序

之前有一篇文章是将十大排序算法的,但是之前在堆排序模块只是简单调用的python的库,并没有仔细讲解堆排序是怎么实现的,今天补一下~言归正传:堆排序的原理,在我的理解下,大意是运用大顶堆(堆顶的元素永远保持最大),每次弹出堆顶元素,生成排序序列。具体实现主要分成2部分:完全二叉树的性质,某一节点 的index 为i的话,则其左右子节点的index 分别为:2*i+1, 2*i+2调整堆- 入参 节点index, 数组 arr, 需处理的数组长度l- 自顶向下调整, 代码如下:d

2021-03-13 15:40:02 136

原创 《知识图谱》学习-概述

day 1 打卡~今天主要是看了下基本概念,大致画了下思维导图,欢迎留言交流参考文献:《知识图谱概念与技术》 肖仰华

2020-06-02 09:11:33 401

原创 NLP工程师需要掌握哪些知识???

提纲1、机器学习算法 LR SVM DT BOOST K-MEANS CRF。。。2、深度学习算法 CNN RNN LSTM attention transformer bert。。3、词向亮的表示方式:one-hot, 词袋 , w2v, fasttext, glove, elmo4、序列问题,包括:分词,词性标注,命名实体识别,依存句法分析5、其他:基于机器学习的预处理,基于深度学习...

2020-05-04 12:06:22 1172 1

原创 《西瓜书》- 第2章 模型评估与选择 习题答案整理

说明自己整理,欢迎交流~2.1 数据集包含1000个样本,其中500个正例、500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估计有多少种划分方式。答:30%用于测试集相当于要从正负样本各选500*30%=150个样本所以一共有 C500150⋅C500150C_{500}^{150}·C_{500}^{150}C500150​⋅C500150​2.2 ...

2020-05-02 20:08:18 10374

原创 pip安装tensorflow慢的问题【已解决】

使用豆瓣的镜像pip install tensorflow -i https://pypi.douban.com/simple

2019-11-30 21:40:04 3023

原创 pandas 聚合处理字符串,groupby, agg

pandas将属于同一个key的另一列字符串进行合并data2 = data2.groupby('url',as_index=False)['type'].agg(lambda x: x.str.cat(sep=','))结果显示: url type0 a 函电1 b 原文,活动2 c 活动3 d 原文,会议4 e 会议...

2019-03-20 15:18:53 3955

原创 记一次尴尬的经历---硅胶干燥剂颗粒堵住了耳机孔

这是什么样的神仙概率被我遇到了书包里恰好有一包忘记取出来的的干燥剂,恰好经过时间的洗礼,干燥剂的包装坏了,散落一包的干燥剂颗粒,书包里恰好有个电脑,耳机孔朝下,一颗硅胶干燥剂颗粒在书包里长期的晃荡恰好在某天遇到了电脑的耳机孔,于是成功相遇,卡的死死的~~~~慌张 & 想办法呀于是,开始百度,寻找同道中人。。原来我真的不是第一个呀~~~对此,广大网友也是群策群力,不排除有些...

2019-03-07 12:49:46 3293 6

原创 mac安装elasticsearch步骤

1. java环境安装包下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html下载对应的macos版本,按步骤安装即可。检查是否安装成功,命令行输入:java -version若输出对应的java版本号等信息即为安装成功。2. brew 安装elasticse...

2018-10-17 10:55:17 1277

原创 macos环境安装lightgbm 及主要问题解决

首先放一下官网教程的网址:https://github.com/Microsoft/LightGBM/blob/master/docs/Installation-Guide.rst#macos1. 安装brew检查电脑是否有brew,在终端输入brew help若输出:Example usage: brew search [TEXT|/REGEX/] brew info [F...

2018-10-16 11:18:51 549

原创 十大经典排序算法(Python语言描述)

本文主要参考下面这篇博客,感觉讲的很好。 https://www.cnblogs.com/onepixel/articles/7674659.html 记录这篇博客,一是想检验一下自己的学习效果,二是刚好借此机会锻炼一下自己Python编程能力。 下面就言归正传啦~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~...

2018-04-08 09:05:02 2293

原创 Python数据结构之复杂数据结构

目录Trie树的基础知识实现trie树 (LeetCode 208)添加与查找单词 (LeetCode 211)并查集的基础知识朋友圈 (LeetCode 547)线段树的基础知识区域和查询(LeetCode 307)逆序数 (LeetCode 315)1. Trie树的基础知识参考:https://blog.csdn.net/handsomekang/artic...

2018-03-25 13:36:05 4573

原创 Python 数据结构之动态规划

目录爬楼梯 (LeetCode 70)打家劫舍 (LeetCode 198)最大字段和(LeetCode 53)找零钱(LeetCode 322)三角形(LeetCode 120)最长上升子序列 (LeetCode 300)最小路径和(LeetCode 64)地牢游戏(LeetCode 174)1.动态规划的基本思想动态规划算法与分治法类似,其基本思想也是将待求解问题...

2018-03-24 17:59:31 535

原创 Python数据结构之宽度优先搜索

目录岛屿数量 (LeetCode 200)词语阶梯(LeetCode 127)词语阶梯2 (LeetCode 126)01矩阵 (LeetCode 542)太平洋与大西洋的水流 (LeetCode 417)收集雨水2 (LeetCode 407)1. 岛屿数量 (LeetCode 200 Number of Islands)1.1题目Given a 2d gr...

2018-03-24 15:06:21 660

原创 机器学习之Logistic Regression

目录原理,数学推导,优缺点?为什么要用logistic函数? 该函数优缺点?为什么不用其他函数?求解方法,目标函数(损失函数),手写代码?为什么使用似然估计?什么要用对数似然,不用平方损失和绝对值之类?平方损失是不是凸函数?几种优化算法,梯度下降的种类LR 正则化工程方面:并行化怎么做,有几种并行化方式,读过哪些开源的实现LR为什么要对特征进行离散化31Logistic回归和其他...

2018-03-20 10:10:15 439

原创 爬虫知识整理

目录HTML相关技术HTTP协议宽度与深度抓取的比较不重复抓取策略及BloomFilter 网站结构分析网页内容解析动态网页的解析网站登录多线程与多进程分布式应对网站的反爬技术1.HTML相关技术HTML:超文本标记语言,浏览器根据HTML语言规范来解析网页内容tag:<a><tr><p> a用于标记外链,tr、p用来...

2018-03-17 08:10:02 473

原创 Python数据结构之哈希表与字符串

目录哈希表的基础知识最长回文串(LeetCode 409)词语模式 (LeetCode 290)同字符词语分组 (LeetCode 49)无重复字符的最长子串 (LeetCode 3)重复的DNA序列 (LeetCode 187)最小窗口子串(LeetCode 76)1. 哈希表的基础知识哈希表是一种数据结构,其数据元素的地址或索引值由散列函数生成。这使得访问数据的...

2018-03-11 15:38:37 2424

原创 Python数据结构之图与二叉查找树

目录图的基础知识图的深度优先搜索与宽度优先搜索课程安排 (LeetCode 207,210,630)最小高度的树 (LeetCode 310)二叉查找(排序)树的基础知识二叉查找树中的第K小的数(LeetCode 230)二叉查找树编码与解码(LeetCode 449)逆序数 (LeetCode 315)1. 图的基础知识图是算法中最强大的框架之一,树结构只是图的...

2018-03-10 22:36:54 484

原创 Python数据结构之二叉树

目录二叉树基础知识路径之和2 (LeetCode 112,113,437)最近的公共祖先 (LeetCode 236)二叉树转链表(LeetCode 114)二叉树层次遍历侧面观察二叉树 (LeetCode 199)根据前序与中序遍历顺序构造二叉树(LeetCode 105)根据后续与中序遍历顺序构造二叉树(LeetCode 106)1. 二叉树基础知识二叉树是由n(...

2018-03-08 13:12:33 414

原创 python数据结构之二分查找与分治算法

目录二分查找的基础知识插入位置(LeetCode 35)区间查找(LeetCode 34)旋转数组查找(LeetCode 33)分治算法与归并排序K个排序链表的合并(LeetCode 23)逆序数计算 (LeetCode 315)不同的括号方法 (LeetCode 241)1. 二分查找的基础知识对有序列表进行查找,通过将查找值与列表候选区间中间位置的值比较,可以...

2018-03-07 11:05:43 987

原创 Python数据结构之递归与回溯搜索

目录递归函数与回溯深搜的基础知识求子集 (LeetCode 78)求子集2 (LeetCode 90)组合数之和(LeetCode 39,40)生成括号(LeetCode 22)N皇后(LeetCode 51,52)火柴棍摆正方形(LeetCode 473)1. 递归函数与回溯深搜的基础知识递归是指在函数内部调用自身本身的方法。能采用递归描述的算法通常有这样的特征:为求...

2018-03-06 08:18:40 2991

原创 python数据结构之贪心算法

目录贪心算法的基础知识分糖果 (LeetCode 455)摇摆序列(LeetCode 376)移除K个数字(LeetCode 402)跳跃游戏1 (LeetCode 55)跳跃游戏2 (LeetCode 45)射击气球(LeetCode 452)1. 贪心算法的基础知识贪心算法就是每次都贪心地选择当前最好的那个(局部最优解),不去考虑以后的情况,而且选择了就不能够“...

2018-03-05 20:17:12 1562

原创 python数据结构之栈、队列与堆

目录栈与队列的基础知识使用队列实现栈 (LeetCode 225)使用栈实现队列 (LeetCode 232)包含min函数的栈(LeetCode 155)合法的出栈序列堆的必备基础知识数组中的第K大的数 (LeetCode 215)寻找中位数(LeetCode 295)1. 栈与队列的基础知识栈(stacks)是一种只能通过访问其一端来实现数据存储与检索的线性...

2018-03-01 16:46:04 11707

原创 python数据结构之链表

目录(原来整理了部分,参考这篇博客http://blog.csdn.net/tinkle181129/article/details/79332331(博主知道啦),决定对这篇文章进行补充) 1. 链表的基础知识 2. 链表逆序 (LeetCode 206) 3. 链表中间段逆序(LeetCode 92) 4. 求两个链表的交点(LeetCode 160) 5. 排序链表的合并(Le...

2018-02-28 21:55:39 5881 1

原创 stacking学习笔记

1. stacking原理这里以2层stacking为例进行介绍 假设有3个基模型M1,M2, M3, 数据集: D={(x1→,y1),(x2→,y2),...,(xn→,yn)}D={(x1→,y1),(x2→,y2),...,(xn→,yn)}D = \{(\vec{x_1},y_1),(\vec{x_2},y_2),...,(\vec{x_n},y_n)\}划分数据集 ...

2018-02-28 14:54:53 2941

原创 算法编程整理1

一、题目列表寻找数组中出现次数超过一半的元素—>寻找数组中出现次数超过1/3的元素股票的买入卖出时间,一次买入卖出—>多次买入卖出寻找数组中的最长递增子序列,寻找最长长度—>输出最长递增子序列翻转链表画建最小堆的过程先序遍历二叉树,非递归链表的第一个公共节点,优化问题最大连续子数组和后缀子串手写数组旋转、不用额外的空间二、 解题思路2.1...

2018-02-27 19:49:09 213

原创 决策树、CART、GBDT、Xgboost学习笔记

一、决策树决策树由结点和有向边组成,结点又分为内部结点和叶结点。从本质上来看,决策树的学习过程包括特征选择,决策树生成和决策树剪枝3个部分。1.1决策树特征选择所谓决策树特征选择即选择合适的特征作为结点对训练样本进行划分,通常使用信息增益或者信息增益比作为特征选择的标准。信息增益 g(D,A)=H(D)−H(D|A)=−∑k=1K|Ck||D|log2|Ck||D|+∑i=1n|Di||D|H(

2017-11-24 11:07:02 2120

原创 Ensemble methods(集成方法)

一、目的集成方法是通过结合几个基学习器的预测结果来改善单个学习器的通用性和鲁棒性二、分类1、bagging与随机森林几个基学习的学习过程相互独立(并行式集成学习),将其预测结果进行结合 常用方法: a. 分类(投票法) b. 回归(平均法)2、boosting基学习器串行建立,目的是减小整体学习器的偏差,可以使用几个若学习器产生强学习器三、sklearn使用3.1 Bagging meta-e

2017-11-23 22:13:58 788

原创 pandas处理字符串1

pandas 序列字符串操作

2017-07-20 19:17:40 11862

原创 tortoisegit基本使用方法

一、安装tortoisegit下载链接tortoisegit官网,然后一步步安装就可以了。二、使用方法1.设置ssh key这个与使用gitbash生成sshkey有点不同 在安装完tortoisegit之后,安装目录如下图 单击PuTTYgen,弹出如下窗口 点击Generate,移动鼠标(这个我也不知道为什么#),会生成以ssh-rsa开头的一串码,将其复制到gitlab的ssh

2017-04-09 21:50:03 20886

原创 gitlab的简单使用

一、网页访问输入网址: http://搭建gitlab的服务器的IP地址 按照要求注册,即可生成自己的gitlab账号和登录密码二、简单操作登录成功后就可以对gitlab进行简单的操作了在所有的操作之前先进行全局设置,在git bash中输入git config --global user.name "用户名"git config --global user.email "注册账号的邮箱"1

2017-04-08 21:50:34 413

原创 本地服务器Gitlab的搭建及卸载---基于centos6.5

这篇文章主要参考的是官方文档,并将自己在安装过程中遇到的一些问题记录下来。一、安装首先贴上官方文档的网址Gitlab-centos 然后按照文档的步骤运行即可。问题:使用yum命令时可能会出现以下问题another app is currently holding the yum lock;waiting 解决:可以通过强制关掉yum进程:# rm -f /var/run/yum.pid二、访问如

2017-03-31 19:52:13 5946

原创 Python环境安装----Anaconda

一.Windows环境下下载地址anaconda下载地址,选择windows版本的Python主流分为2.7和3.5的,但是当前最新的anaconda支持的Python版本是2.7和3.6,所以要选择3.5版本的需要访问Anaconda installer archive下载之前的版本。目前用的比较多的还是2.7版本的,需要在windows环境下安装tensorflow的小伙伴可能需要到这个列表

2017-03-27 16:25:03 3808

原创 git基本操作

git init —初始化仓库 要使用git进行版本管理,必须先初始化仓库$ mkdir git-tutorial $ cd git-tutorial$ git init初始化之后,在当前目录下就会生成.git 目录,存储管理当前目录内容所需的仓库数据 2. git status —查看仓库状态 3. git add —向暂存区中添加文件,暂存区是提交之前的一个临时区域 4. git

2017-03-25 20:49:08 270

原创 windows7环境下使用github教程(1)

一、安装msysGit下载安装包,网址Git下载,这里我使用的是Git-2.12.1版本安装过程:双击.exe 文件,单击next,出现组件选择界面,由于所有默认组件都已勾选,可以直接进入next,选择Use Git Bash only , 点击 next ,直到程序安装。二、初始设置1. 设置姓名和邮箱地址:打开git bash 命令框,输入如下命令:$ git config --globa

2017-03-25 16:01:56 557 2

原创 修改VNC分辨率

查看当前分辨率:man vncserver修改分辨率:vncserver -geometry 800x600

2017-03-17 19:45:08 1127

原创 keras学习----SGD

keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)-lr : 学习率 - momentum : 参数根性冲量 - decay :每次更新时学习率衰减量 - nesterov :是否应用Nesterov momentum

2017-03-13 15:45:48 4373

原创 在Windows系统下安装tensorflow

基于anaconda的安装首先需要安装anaconda for Python3.5,当前anaconda官网最新的版本已经到Python3.6了,题主曾将尝试使用最新的版本,但是安装tensorflow的时候失败了。。所以又去anaconda官网找了之前的版本。就是下面这个啦打开cmd 输入>conda create -n tensorflow>activate tensorflow

2017-02-24 16:09:49 631

原创 windows7环境下xgboost的安装

安装git,下载链接git for windows安装mingw64,下载链接mingw64 直接在计算机中配置环境变量,添加名为PATH的环境变量,值为mingw64文件地址\bin\打开git bash,输入以下命令git clone --recursive https://github.com/dmlc/xgboostcd xgboostgit submodule initgit

2017-01-04 18:02:03 422

原创 python显示图形在终端还是在图片窗口

在终端窗口输出图片的命令:matplotlib inline在图片窗口表现图片的命令:matplotlib qt

2016-11-26 21:47:45 8733

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除