自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

胡椒

那么近,那么远

  • 博客(33)
  • 收藏
  • 关注

原创 win7旧版本`mongodb`安装

win7不支持最新版本的 mangodb 下载,安装旧版本mongodb百度云地址提取码:1234安装运行 MongoDB自选路径下载安装之后,进入 MongoDB 的安装目录,在 bin 目录下新建同级目录 data,如图然后进入 data 文件夹,新建子文件夹 db 来存储数据目录,如图之后打开命令行,进入 MongoDB 安装目录的 bin 目录下,运行 MongoDB 服务:mongod --dbpath "D:\Program Files\MongoDB\Server\3.4\b

2021-01-06 16:55:39 810

原创 SQL使用`full outer join` 并列关联多个表

`full outer join` 一般在 SQL 中用于关联两个表取两个表的并集,百度搜索出来的都是用三个表嵌套取并集,尝试如果关联三个表平行关联,得出:如果并列全关联,那么关键表与其他表如果关联主键相同的就会合并到同一行数据,如果不是关键表之间的关联,那么尽管主键相同,也会分散到不同行

2020-12-29 20:29:23 3210 1

原创 presto相关命令总结

presto常用命令总结导出数据、与hive一些不同之处,小众函数……

2020-08-18 11:17:20 2591

原创 windows下神经网络库`keras`安装

安装kerasconda install -c conda-forge keras=2.3.1使用conda安装可能网速太低会超时,可以添加清华镜像,或者设置超时时长处理安装之后import keras会报错,numpy版本太低了pip install --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple numpy...

2020-03-12 15:36:00 176

原创 hive相关命令总结

总结一些在hive里面常用的命令

2020-03-06 19:56:40 176

原创 python时间序列包`fbprophet`的安装

python3.6 利用anaconda安装 fbprophet 成功步骤conda install pystanconda install -c conda-forge fbprophetconda install plotly -y其中会遇到的报错ERROR:fbprophet:Importing plotly failed. Interactive plots will not work.

2020-02-15 13:09:36 1464 2

原创 利用`__init__.py`使代码更便捷

__init__.py简述一个目录如果包含了__init__.py文件,那么它就变成了一个包(package)。__init__.py可以为空,也可以定义包的属性和方法,但其必须存在,其它程序才能从这个目录中导入相应的模块或函数。优化一般可用语法例如在data/文件夹下的dataset.py中有关于DogCat的函数,则在新的脚本文件例如demo.py中就可以from data.datas...

2020-01-01 10:06:48 106

原创 面试 - 东方海外 - 数据分析

基本自我介绍项目简述自己的项目后续有没有什么成就项目负责的内容针对自己负责的数据探索是怎么样开展的针对自己负责的文档输出这个工作数据库表的统计筛选MySQL把日期转成文本用什么数据库数据分析觉得数据分析需要具备什么素质,条件一家公司中数据分析师发挥着什么样的作用数据结构讲一个自己最熟悉的数据结构python平常用python是...

2020-01-01 09:47:53 566

原创 笔试 - 深信服 - 大数据开发工程师

单选1. 高度为5,3阶B树的关键字2. Kafka不支持的特性3. 4个男和3个女,女生之间不相邻,多少排序结果4. 程序中“==”和“equal()”5. 列时存储数据库的特点6. public 和 static 输出区别顺序不定项1. 对数组的声明,合法的有2. hbase 中 menstore flush 出发条件3. 创建新线程4. switc...

2020-01-01 09:42:15 812 3

原创 笔试 - 京东 - 数据分析

X与Y的相关系数 excel的If判断语句 均值不同条件下的标准差代表的离散程度 距估计和极大似然估计,以及已知概率时所用哪种方法 大数据中的使用工具 排序的算法时间复杂度 算法,数据结构、程序之间的关系:程序 = 算法 + 数据结构 假设检验 大数据分析(大数据十大思维) 普查缺点:工作量大,花费大,组织工作复杂;调查内容有限;易产生重复和遗漏现象;由于工作量大而可能导致调查的...

2020-01-01 09:39:32 436

原创 python读取MySQL数据并追加存入csv中

需要通过`MySQL`查找`task_config`含有表与字段对应的`task_name`, 利用`python`实现自动化操作:python读取MySQL获取数据并追加存储到`csv`中。

2019-12-30 10:13:24 1549

原创 Windows下Linux子系统 - Hadoop配置

Windows下Linux子系统安装Hadoop的尝试,详情配置以及简单用例。

2019-12-15 10:28:45 657

原创 数据挖掘个人笔记

阶段性自己对于数据挖掘的想法和做法

2019-11-24 23:57:51 102

原创 电话面试 - 招银网络科技 - 数据研发工程师

投递岗位:数据研发工程师 地区:深圳没能进笔试前10%,收到电话面试。趁着热乎乎,写一下面经。面试我的面试官哥哥应该是计算机专业的,问了很多相关的东西,反而我熟悉的机器学习、python少问到电面内容1 自我介绍自我介绍中最后一句提到了数据结构,所以第一个问题方向有关于数据结构的2 数据结构讲一下快速排序 讲一下归并排序 对堆排序有没有了解 由于自己对...

2019-09-10 20:48:34 6499

原创 3.1.2 排序 - 外排序(归并排序)

外排序 - 归并算法大致思路流程以及代码实现

2019-09-05 10:09:25 345

原创 Windows下Linux子系统 - Ubuntu

电脑配置不高,运行虚拟机就卡,所以现在在用win10下的Linux子系统,能满足日常需要。介绍了在win10下面配置的无桌面的Linux,以及自己一些常用软件的安装步骤

2019-09-03 21:34:22 385 1

原创 3.1.1 排序 - 内排序

数据结构中基本排序(插入排序、冒泡排序……)的简单理解与C语言实现

2019-09-03 20:54:32 118

原创 2.1 二叉树的遍历

1 递归遍历1.1 先序遍历规则:根 -> 左 -> 右void travel_prev(linktree root){ // 跳出递归 if (root == NULL ){ return; } // 遍历 printf("%ld\t", root->data); // 访问根节点 travel_prev(root->lchild); // 先序...

2019-09-02 11:54:47 94

原创 1.3.2 线性表 - 队列

1 队列的定义限定在表尾进行插入和在表头删除的操作的线性表,又称先进先出的线性表。队列结点struct queue_node { QNdatatype data; struct queue_node *next;};队列管理者typedef struct{ struct queue_node *front; struct queue_node *tail; int siz...

2019-09-02 11:46:42 120

原创 1.3.1 线性表 - 栈

1 栈(stack)的定义限定在表尾进行插入和删除的操作的线性表,又称先进后出的线性表。栈管理者typedef struct stack{ struct node *Top; int Size;}maneger, *stackManeger;栈结点typedef struct node { int Data; struct node *Next;}node, *stack...

2019-08-28 23:52:47 84

原创 1.2.3 线性表 -双向链表

1 双向链表的定义在双向链表的界定中有两个指针域,其一指向直接后继,另一个指向直接前驱。typedef Node { ElementType Data; struct Node *Prev; struct Node *Next;}dlistnode, *dlinklist;2 双向链表主要操作的实现2.1 初始化一个空双向链表dlinklist init_l...

2019-08-28 15:35:44 110

原创 1.2.2 线性表 - 单循环链表

1 单循环链表的定义在单链表中,将终端结点的指针域NULL改为指向表头结点或开始结点,整个链表形成一个环。2 单循环链表与单链表的差异空链表的判断条件非空链表的循环条件3 单循环链表操作的实现初始化 插入 显示 释放4 带尾针的单循环链表5 题目据说着名犹太历史学家 Josephus有过以下的故事6 单循环链表的优缺点

2019-08-28 15:16:08 254

原创 1.2.1 线性表 - 单链表

1 单链表的定义单链表是一种链式存取的数据结构,用一组地址任意的存储单元存放线性表中的数据元素。链表中的数据是以结点(如图)来表示的,每个结点的构成:元素(数据元素的映象) + 指针(指示后继元素存储位置)。元素就是存储数据的存储单元,指针就是连接每个结点的地址数据。如果链表的每个结点中只包含一个指针域,那就叫做单链表单链表最后一个节点的指针指向NULL

2019-08-28 14:59:42 261

原创 1.1 线性表 - 顺序存储结构

1. 顺序存储结构的定义typedef struct seqence_list{ datatype *data; int last; int size;}sqlist;2 主要操作的实现2.1 初始化sqlist *init_sl(int size){ sqlist *sl = calloc(1, sizeof(sqlist)); // 分配顺序表 if( sl!=NU...

2019-08-28 12:33:14 236

原创 常用头文件 - common.h

如果有引用#include "common.h",报错的可以新建一个文本,复制以下代码,并保存名为common.h在执行代码的相同文件下。#ifndef __COMMON_H#define __COMMON_H// 基本常用头文件#include <time.h>#include <stdlib.h>#include <unistd.h>#inc...

2019-08-28 12:31:01 9012 1

原创 链家网爬取深圳租房信息并存入MySQL

考虑毕业后前往深圳工作,想要了解深圳的租房市场。通过结合网上对链家网爬取经验,开始自己的爬取工作,并且通过pymysql 存入数据库。

2019-08-26 21:05:30 1097

原创 链家网爬取深圳租房分析

基于爬去的链家网深圳租房信息进行的数据分析可视化

2019-08-26 21:05:06 1036

原创 C语言中的异或 - 运算符"^"

最近在完成程序设计入门-C语言中需要计算异或,查阅了很多资料终于明白计算计算原理,记录一下方便以后查询。流程举例为了方便理解,下面结合流程举例说明a1 = 6 , 转化成二进制 a2 = 0110b1 = 10,转化成二进制 b2 = 1010a2与b2每一位数相比较,相同为0不同为1,得到 c2 = 1100c2转成十进制输出得到 12代码#include&...

2019-08-19 21:33:07 10667

原创 编程练习——程序设计入门-C语言

week-11.1 逆序的三位数程序每次读入一个正三位数,然后输出逆序的数字。注意,当输入的数字含有结尾的0时,输出不应带有前导的0。比如输入700,输出应该是7。简单一点#include <stdio.h>int main(){ int a; scanf("%d", &a); int x100 = a/100; int x10 = (a-x100*100)...

2019-08-19 20:45:35 435

原创 异常检测(anomaly detection) - 吴恩达机器学习基于python

1 多元高斯分布模型1.1 算法步骤对于给定的数据集,针对每个特征计算μ\muμ(均值)和Σ\SigmaΣ(协方差)μj=1m∑i=1mxj(i)\mu_j=\frac{1}{m}\sum_{i=1}^{m}x_j^{(i)}μj​=m1​i=1∑m​xj(i)​Σ=1mXTX\Sigma=\frac{1}{m}X^TXΣ=m1​XTX根据获得的μ\muμ(均值)和Σ\SigmaΣ(协...

2019-05-19 22:05:16 1156

原创 PCA主成分分析 - 吴恩达机器学习基于python

1 2D PCA1.1 load dataimport scipy.io as siomat = sio.loadmat(r'D:\python_try\5. AndrewNg_ML\data\kmeans and pca\ex7data1.mat')# print(mat.keys()) # 查看数据组成成分X = mat.get('X')# X.shape # 查看数据维度1....

2019-04-21 15:49:52 530

原创 svm支持向量机-吴恩达机器学习基于python

导入包import numpy as npimport pandas as pdimport sklearn.svmimport seaborn as snsimport scipy.io as sio #读取matlab的mat数据import matplotlib.pyplot as plt 1 线性svm1.1 导入数据mat = sio.loadmat(r'D:\pyt...

2019-03-30 12:47:56 1065

原创 聚类(kmeans)-吴恩达机器学习基于python

这里写自定义目录标题visualize datadata1data22D Kmeans步骤编程调用函数进行聚类运用肘部法确定ktry sklearn kmeansKmeans for image compressionload imagedo kmeansvisualize dataimport scipy.io as sio # load matimport matplotlib.pypl...

2019-03-29 23:34:31 1023

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除