自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 资源 (2)
  • 收藏
  • 关注

原创 2021年总结及新年展望

文章目录2021年总结新年FLAG2021年总结首先是流水账经历。2021年直到9月28号之前一直在准备保研,并成功保送到了浙软读专硕。选到了一个羊导,虽然不放实习而且还得在他的公司打工做项目,但是据学长介绍该导分配的任务压力很小,平时做完之后可以做自己的事情。整个10月都在准备实习需要的八股文,虽然最后没用上。11月和12月在找好导师之后就去导师公司做毕设打工了。整体来讲今年的选择差强人意。其次是以后工作方向的选择。这一年我和AI说了再见,并且选择了大数据作为自己以后研究和工作的方向。想成为顶级AI

2022-01-15 22:04:33 1266

原创 HBase、Flume、Nginx、Redis、Kafka基础

HBase1. 概念建立在HDFS上,提供高可靠性、高性能、列存储、可伸缩、实时读写 的分布式数据库系统在需要实时读写随机访问超大规模数据集时,可以使用HBase2. HBase特点海量存储可以存储大批量数据列式存储HBase表的数据是基于列族进行存储的,列族是在列的方向上进行存储极易扩展底层依赖HDFS,当磁盘空间不足时,只需动态增加datanode结点就可可以通过服务器来对集群的存储进行扩容高并发支持高并发读写请求稀疏系统主要是针对HBase

2021-05-29 09:54:30 1227 4

原创 Day10 树---哈夫曼树 家谱处理 搜索树判断 目录树

#include<bits/stdc++.h>#include<map>#include<string>#include<queue>using namespace std;struct Node{ char val; int weight; Node*left=nullptr; Node*right=nullptr; Node(){ } Node(char val,int weight):val(val),weight(weight)

2021-05-14 22:45:23 222

原创 Day9 化学方程式配平

该题的难点在于括号的嵌套,如Na6((OH)(OH)2)3,比如OH在跳出嵌套之后需乘以紧接着其外的嵌套下标,我的解法是先一遍处理以下找到每个左括号和与之配置的右括号的位置,然后使用递归,每遇到左括号递归,遇到右括号返回map。#include<bits/stdc++.h> #include<string.h>using namespace std;//保存左括号和与之匹配的右括号的下标 map<int,int> bracket;//2H2+O2----&g.

2021-04-06 17:46:04 313

原创 Day8 栈的使用--计算面积 接雨水

题目→\rightarrow→计算面积输入为 “\///_//\\//\///__\_\//_/”输出总的积水面积和各积水处面积思路首先计算总面积如果是\,将坐标iii压入栈S1如果是/,取出S1中最近配对的/,算出两者距离 i−ipi-i_pi−ip​并累加到总面积中如果是_,不做处理然后计算各个积水处面积另建栈S2保存各积水处面积,栈S2中每个数据为最左边/的坐标和其对应的积水面积,如果新计算\对应的坐标小于S2栈顶的坐标,那么说明计算的\可以和S2中积水合并。//计算面积#

2021-03-03 12:46:18 172 1

原创 latex入门

安装Texlive并且链接texstudioLaTeX 入门文档

2021-02-12 18:15:28 97

原创 2020下半年总结

2020下半年总结文章目录2020下半年总结1. 下半年经历回顾2. 反思自己的stereotype3. 展望20211. 下半年经历回顾人的经历总是要总结的,因为总结,人才能在之前的基础上有所进步,才能不忘历史,不惧将来。很惭愧拖到现在才开始写2020年的下半年总结,因为太忙了(下半年没干什么没脸写)。下半年开始接触了hadoop,spark,j2ee,机器学习等大数据方向的专业课,还有编译、软工、网安等必修课。因为那些方向专业课是选修课,所以也没有学必修课的那么上心,害,用时再突击吧。这学期参加的

2021-02-09 23:59:33 153 1

原创 吴恩达机器学习笔记

文章目录Error analysisMethods to solve over fittingMethods to solve under fittingRecommend approachError metrics for skewed classesData for machine learningSupport Vector MachineK-meansPrinciple Component AnalysisData preprocessingChoosing the number of princi

2021-01-25 22:50:57 304

原创 Day7 除自身以外数组的乘积 最小栈 二叉树的最近公共祖先

除自身以外数组的乘积本题利用left数组存储左连乘积,left[i]=∏k=1inums[k]left[i]=\prod_{k=1}^i nums[k]left[i]=∏k=1i​nums[k];right数组存储右连乘积,right[i]=∏k=innums[k]right[i]=\prod_{k=i}^{n} nums[k]right[i]=∏k=in​nums[k];则不包括nums[i]的乘积为nums[i]=left[i−1]∗right[i+1]nums[i]=left[i-1]*righ

2021-01-23 16:07:53 65

原创 Day6 环形链表 II 买卖股票的最佳时机 不同路径

环形链表II和上一个环形链表I类似,设置一个快慢指针,设从head到环形入口有a个节点,环形入口到环形结尾有b个节点,首先快指针一次走两格,慢指针一次走一格,fast=2*slow;其次,fast指针在环形绕了n圈和slow指针相遇,则fast=slow+nb;由上面两个公式,则slow=nb;slow指针想再到环形入口,步数必定为a+nb;则slow指针再走a步就能到达环形入口;但是a不知。可将fast指针指向head,然后fast指针和slow指针都走一格,直到再次相遇时两者指向环形入口。# Def

2021-01-22 23:17:00 127 1

原创 Day5 排序链表 乘最多水的容器 合并K个排序链表

排序链表使用分治方法对链表排序,其中如何对链表进行分割成了问题,一开始的想法是先求出链表的总长度,然后再利用双指针求出中点;而有更巧妙的方法,设两个指针,l1和l2,一个走一步,一个走两步,正好一个到达末尾时另外一个到达中点,该法也曾用于判断链表是否有环(追及相遇问题);或者再推广,利用此法可以直接求链表的n分点,即设n个指针,依次每次走(i=1,2,⋯ ,n)(i=1,2,\cdots,n)(i=1,2,⋯,n)步。class Solution(object): def sortList(se

2021-01-21 20:29:48 93

原创 Day4 直线上最多的点数 循环链表 四数相加2

四数相加2对下一个题的方式有启发,使用dict存储后两个之和class Solution(object): def fourSumCount(self, A, B, C, D): Dict={} for i in range(len(C)): for j in range(len(D)): if C[i]+D[j] in Dict: Dict[C[i]+D[j]]+=1

2021-01-20 19:16:40 72

原创 pandas基础

文章目录1. pandas简介2. 选择数据3. 设置值4. 处理丢失数列5. 导入导出6. df合并7. plot画图import pandas as pdimport numpy as npimport matplotlib.pyplot as plt1. pandas简介s=pd.Series(data=[1,3,6,np.nan,44,1])dates=pd.date_range("20160101",periods=6)df=pd.DataFrame(data=np.random.

2021-01-19 17:48:56 95

原创 numpy基础

文章目录1. 创建array2. 基础运算3. 索引4. array合并5. array分割6. copy和deepcopyimport numpy as np1. 创建array# 创建array,dtype格式array = np.array( [[1, 2, 3], [2, 3, 4]], dtype=np.float)# shapeprint(array.shape)# 维数print(array.ndim)# 总数量print(array.size)(

2021-01-19 11:32:03 83

原创 Day3 最接近的三数之和

同样是双指针方法,在三数之和的基础上用一个变量附加保存了最接近target的ansclass Solution(object): def threeSumClosest(self, nums, target): nums.sort() global ans ans=-1<<32 for _ in range(len(nums)): i=_+1 j=len(nums)-1

2021-01-12 19:31:19 77

原创 从零编写一个简单神经网络框架

Build a neural network from Scratch文章目录Build a neural network from Scratch1. Node2. Variable3. Linear4. Relu5. Sigmoid6. MSE7. Session8. main1. Nodeclass Node: ''' name 该节点标识 inputs 指向该节点的节点 outputs 出节点 is_trainable 是

2021-01-12 01:14:48 250 2

原创 神经网络框架原理

文章目录1.建立计算图2.拓扑排序3.前馈计算4.反向传播1.建立计算图定义变量和使用各种算子的过程就是一个建立一个计算图的过程import networkx as nximport randomimport numpyfrom matplotlib.animation import FuncAnimation%matplotlib notebookseed=1random.seed(seed)np.random.seed(seed)sample_graph = { 'x'

2021-01-12 01:06:55 227

原创 Day2 格雷编码

格雷编码核心思想就是由列表前n个元素镜像生成后n个元素,列表第i个元素二进制前+1生成第n+i个元素例如00 100 01 11 10000 001 011 010 110 111 101 100.。。。。class Solution: def grayCode(self, n): ans=[0] for i in range(n): cnt=len(ans) for j in range(cnt-1,-

2021-01-11 00:17:39 111

原创 Day1 三数之和

三数之和class Solution: def threeSum(self, nums): n = len(nums) ans = [] # 数组为空或者长度小于3直接返回 if not nums or n<3: return [] nums.sort() for i in range(n): if nums[i]>0:

2021-01-09 21:33:53 98

原创 shell语法

shell语法文章目录shell语法1. 简介2. shell变量3. shell传递参数4. shell基本运算符5. echo命令6. `printf`功能7. test8. 流程控制9. shell函数10. shell输入输出重定向11. shell文件可以包含外部脚本1. 简介#!/bin/bash //告诉系统这个脚本需要什么解释器执行echo "hello world" //用于向窗口输出文本作为可执行程序chmod +x ./test.sh./test.sh //不加./,系

2021-01-01 21:14:30 247

原创 Spark基础知识

Spark文章目录Spark1. Spark简要介绍2. Spark结构设计3. RDD编程基础1. Spark简要介绍Spark是一个快速的、多用途的集群计算系统,是一个并行计算、开源计算框架。特点1、运行速度快 在磁盘中比hadoop快10倍,充分利用内存,循环数据流 DAG优化2、容易使用 支持java、python、r3、通用性4、兼容性历史1、2009年开始2、2013捐赠给Apache生态体系1、工具层 sparkSQL sparkStreaming MLlib Gra

2020-12-20 23:47:08 294

原创 Scala语法

Scala语法文章目录Scala语法1. 基础介绍2. 基础知识3. 面向对象编程基础4. 函数式编程基础1. 基础介绍编程范式{命令式编程(C++) 没办法充分利用多核CPU的并发特性函数式编程 变量不可变更,多线程并发处理编程范式\begin{cases}命令式编程(C++)\ 没办法充分利用多核CPU的并发特性\\函数式编程\ 变量不可变更,多线程并发处理\\\end{cases}编程范式{命令式编程(C++) 没办法充分利用多核CPU的并发特性函数式编程

2020-12-20 09:26:44 152 1

原创 hadoop笔记

文章目录1. 启停hdfs2. 启停yarn3. HDFS CLI1. 启停hdfsstart-dfs.sh|stop-dfs.sh在名称结点上启动|关闭namenode进程在所有数据结点启动|关闭datanode进程单独启停hdfs进程在namenode结点 hdfs --daemon start|stop namendoe在datanode结点 hdfs --daemon start|stop datanode2. 启停yarnstart-yarn.sh|stop-yarn.s

2020-10-05 20:38:53 149

原创 Python数据分析与挖掘实战笔记

文章目录1. 数据探索1.1 数据质量分析1.2 数据特征分析2. 数据预处理2.1 数据清洗2.2 数据集成2.3 数据变换2.4 数据规约3.挖掘建模1. 数据探索通过检测数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些由数据挖掘解决的问题。主要从数据质量分析和数据特征分析两个角度对数据进行探索。1.1 数据质量分析主要任务 检测原始数据是否存在脏数据,脏数据一般是指不符合要求,以

2020-10-04 15:59:55 787

原创 数据分析常用函数

文章目录1. 基本统计特征函数2. 统计作图函数pandas数据探索函数大致可以分为统计特征函数和统计作图函数,作图依赖matplotlib,所以说创建pandas的dataframe要求matplotlib必须没问题,否则可能有点懵。1. 基本统计特征函数可用于dataframe或者series普通统计特征函数#计算相关系数矩阵df.corr(method='pearson')#可使用spearman系数s1.corr(s2,method='pearson')#计算两个series的相关系数

2020-10-02 18:13:07 624 1

原创 线性代数基本概念

文章目录线性代数基本概念1. 矩阵基本概念2. 行列式3. 可逆矩阵4. 数量积、向量积5. 线性相关性和矩阵的秩6. 线性方程组7. 向量空间及向量的正交性8 方阵的特征值和相似对角化9. 二次型线性代数基本概念1. 矩阵基本概念m行n列矩阵 Am×nA_{m\times n}Am×n​n阶方阵 An×nA_{n\times n}An×n​,左上角到右下角为主对角线,右上角到左下角为副对角线,位于主对角线上元素称为对角元。对角矩阵 diag(a11,a22,a33,⋯ ,ann)diag(a_{

2020-09-14 23:18:49 1209

原创 Python语法学习

文章目录Python语法学习1. 序列1.1 list API1.2 序列统计函数1.3 str API1.4 dict API2. 函数2.1 zip函数2.2 内置函数对象API3. 模块3.1 `__init__.py`3.2 copy模块3.3 random模块3.4 创建虚拟环境3.5 模块打包3.6 模块发布4. 类和对象4.1 Python属性4.2 封装4.3 继承4.4 多态5. 特殊方法5.1 对象操作支持5.2 属性操作支持6. 异常处理7. 序列结构扩展7.1 set API7.2

2020-09-08 18:37:53 735

原创 大数据概论学习笔记

链接:https://pan.baidu.com/s/1twFM1vUrRF_qPnd1xcP3bQ提取码:slgt

2020-09-02 22:52:59 1365

原创 2020上半年总结

文章目录1. 上半年经历回顾2. 对冬季总结的反思3. 一些感悟1.学习方面2.生活方面3.情感方面1. 上半年经历回顾2020年上半年学期从今天起就结束了,只剩下4个必修的期末考试还有大作业的一小部分,不过对于我今天定义上半年学期结束也无伤大雅了。人要不断的总结经验才能不断前进,所以本文是笔者对2020上半年的各方面的一些感悟总结。本文当然不是鸡汤也不是无病呻吟,而是真实经历某件事之后的一些感悟。它们不一定是对的,但一定是经过思考的。回顾上半年学期内,笑着送走了思政和体育课,艰难的学着概率、OS、计

2020-07-30 12:20:46 436

原创 爬虫环境+基础+东方财富实战

也不知道为啥,Python创建多进程在我的win10上老是报错,比如下面这段代码import multiprocessing,timedef worker(delay,count): for num in range(count): print("【%s】进程ID:%s、进程名称:%s"%(num,multiprocessing.current_process().pid,multiporcessing.current_process.name())) time.

2020-06-16 09:23:36 1035 1

原创 概率论与数理统计学习笔记

链接:https://pan.baidu.com/s/1wudOuUwebXF01TcoVu6L_A提取码:giel

2020-04-16 17:11:30 453

原创 matplotlib绘图

→\to→​16个matplotlib绘图实用小技巧

2020-03-05 15:48:22 159

转载 LaTeX 各种命令,符号

→\to→ LaTeX 各种命令,符号

2020-03-02 22:07:18 227

原创 无监督学习

文章目录1. 无监督学习的特点2. PCA主成分分析2.1 PCA简介2.2 PCA思想3. k-means聚类3. 1 基本思想1. 无监督学习的特点监督学习输入数据中有标签或者目标值,但是在实际生活中很多数据是没有标签或者目标值的或者标签的代价很高对没有标签的数据涉及机器学习中的无监督学习,通过提取一般规律,或者通过数学处理系统地减少或者根据相似性组织数据,对应无监督学习的关联学习,降...

2020-03-01 16:18:07 876 4

原创 梯度下降与优化

文章目录1. 梯度下降简介2. 几种数据集训练方式2.1 批量梯度下降法 BGD2.2 随机梯度下降法 SGD2.3 小批量梯度下降法 MBGD3. 传统梯度优化的不足4. 对传统梯度下降的优化4.1 动量算法4.2 自适应算法4.2.1 AdaGrad4.2.2 RMSProps4.2.3 Adam4.3 有约束最优化4.3.1 等式约束最优化4.3.2 不等式最优化1. 梯度下降简介标量...

2020-03-01 16:15:39 302

原创 监督学习

文章目录1.监督学习特点2、线性模型2.1 线性回归2.2 逻辑回归3. 支持向量机 SVM3.1 最优间隔分类器3.2 核函数4.贝叶斯分类器4.1 极大似然估计 MLE4.2 朴素贝叶斯分类器5. 集成学习5.1 装袋算法bagging5.2 自适应分类器 Adaboost1.监督学习特点监督学习的数据集一般含有很多特征和属性,数据集中的样本都有对应标签或者目标值。监督学习的任务就是...

2020-03-01 16:10:30 1007

原创 概率图模型

文章目录1.概率图模型定义2. 有向概率图模型3. 无向概率图模型4. 隐马尔科夫模型简介4.1 参数介绍4.2 联合概率4.3 隐马尔科夫模型的三要素4.4 步骤4.5 一个简单的隐马尔科夫链简单实例4.6 隐马尔科夫模型一般用于解决三类问题6.1 评估问题6.2 解码问题6.3 学习问题5. 马尔科夫网络5.1 MRF 马尔科夫随机场5.1.1 全局马尔科夫性5.1.2 局部马尔科夫性5.1....

2020-03-01 11:54:31 384

原创 信息论

wwwww

2020-03-01 11:07:29 250

原创 迁移学习简介

迁移学习是一种机器学习方法,简单来说就是把任务A开发的模型作为初始点,重新用在任务B上。比如A任务是识别图片中的车辆,而B任务是识别卡车轿车和公交车。合理使用迁移学习,可以避免针对单个目标任务单独训练模型,从而极大节约计算资源。在cv和nlp处理任务中,将预先训练好的模型作为新模型的起点是一种常用的方法,通常预训练这些模型往往需要消耗大量的计算资源,迁移学习就是把预训练好的 模型迁移学习到新的...

2020-02-29 16:14:26 147

原创 LSTM算法

文章目录1.LSTM1.1 三个门1.2 LSTM单元细节2.LSTM变种2.1 GRU2.2 Bi-RNN (Bidirectional Recurrent Neural Network)3.RNN使用场景1.LSTM1.1 三个门forget gate 遗忘门 决定了上一个时刻的单元状态ct−1c_{t-1}ct−1​有多少保留到当前状态ctc_tct​input gate ...

2020-02-29 16:11:35 667

线性代数的本质.pdf

线性代数的本质

2020-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除