- 博客(35)
- 资源 (1)
- 收藏
- 关注
原创 数据分析之运营篇
文章目录前言1.指标体系定目标1.1根据运营的目的,选取不同的指标类型1.2.北极星指标1.3 用户留存指标2.数据分析找问题2.1.描述分析2.2多维分析2.3.相关性分析2.4.方差分析2.5 样本检验2.6 预测分析总结前言正值春招实习毕业就业季,第一份工作如同初恋般难忘!祝愿各位同行的伙伴成功拿到心满意足的offer!首先,什么是运营数据分析。运营数据分析是指利用数据分析手段,根据业务场景,有理有据地基于数据对业务中...
2021-03-26 16:02:52 3185
原创 基于R语言tidyverse包的数据分析实践
目录1.tidyverse包基础1.0 下载使用tidyverse1.1 数据清洗1.1.1 提取数据1.1.2 数据整理与采样1.1.3 缺省值处理1.1.4 重复值处理1.1.5 异常值处理1.2 数据预处理1.2.1 数据标准化1.2.2 数据编码1.tidyverse包基础1.0 下载使用tidyversetidyverse包有很多依赖,大概率在安装的时候,会报错如:这时不要惊慌,那是因为你没有安装libcurl4-op..
2021-04-06 22:18:01 1575
原创 最佳-解决pytorch docker shm share memory 不足问题
创建一个新的docker ,但如果想使用原docker环境,则先将docker 上传到docker hub 作为imagedocker run -it --shm-size=256m dockername /bin/bash# 登录docker hubdocker login# 打包本地docker 为镜像name ,tag:v1docker commit b508c427d8bb name:v1#查看name:v1的镜像存在于本地docker images#创建新do...
2021-03-11 15:21:01 1012
原创 数据分析-每日笔试真题-2019京东
京东数分2019知识点汇总1.软件开发的各种生命周期模型增量模型:并行开发的软件模型,在底层稳定的架构基础上,设计独立的软件模块,并行地对各个模块进行分析,设计,编码,测试。其内部是瀑布模型。瀑布模型要求软件开发严格按照需求->分析->设计->编码->测试的流程来进行,必须等上一阶段完成验证和评审,才能进行本阶段的工作。瀑布模型下,在架构设计完成后,系统被分为相关的子系统和功能模块,每个模块课并行执行,是一种增量开发模型。迭代模型:并行开发的软件模型,其并行是指基于角色的并行,
2021-03-02 18:56:32 703
原创 数据分析-春招求职知识点!干货
(不断更新中~如有出入,欢迎评论留言;如有前辈喜教乐导,欢迎私信~)现正值春招实习毕业就业季,很多人说第一份工作如同初恋般难忘,而初恋的品质大概率上决定了后续的选择。-by 杏子话不多说,上干货!一、数据分析的细分方向 运营/产品数据分析 如何发挥产品价值的问题。 商业数据分析 如何利用数据做商业决策的问题。 数据挖掘 如何从数据中获取到有价值的数据,偏向于方法论,比如机器学习方法等。 大数据开发 如何对海量数据进行存储、处理的问题。二、运营、产品
2021-02-27 23:03:07 584
原创 ssh远程连接
step1:确保被连接方已经开启ssh服务查看ssh服务状态service ssh statusstep2:端口映射被连接方的22端口映射到连接方的空闲端口Step3:连接方主动将公钥交给被连接方Step4:通过连接方端口 连接 被连接方ssh username@IP首次连接需要被连接方username用户的登录密码Note!!!查看sshd_config 文件中,是否禁用密码登录/etc/ssh/sshd_configPermitRootLogin yesPasswordAu
2020-08-06 11:32:48 116
原创 每日编程——最长子序列系列问题的求解
1.最长递增子序列该问题旨在求解序列中最长子序列,子序列不同于子串,没有连续性要求,显然最长子序列具备最优子结构性质。如何获取递推表达式呢?(1)状态是什么? 序列的长度,在序列长度由1~(1~len)变化过程中,最长子序列的长度怎么随之变化呢?(2)如何表示第i个状态和第i-1个状态之间的关系? opt(i)表示下标为0~i的序列的最长子序列,那么opt(i-1)表示下标为0~i-1的序列的最长子序列. opt(i)的大小取决于nums[i]与nums[0~i-1]的大小关系,可以写出递推表
2020-05-18 20:20:17 345
原创 Diaries Algorithm-零钱兑换
1 换硬币问题给定任意问题,我们总能找到该问题最简单的案例,针对简单的例子,我们往往能很快得到答案。再考虑难一些的例子,即更常规的例子,我们如何解决呢?显然,我们希望大事化小,小化了,因此,我们首先考虑原问题是否可分为子问题?显然该问题是由子问题amount-1的最优解组成。具备最优子结构性质的问题往往用动态规划解决。此外,另一个十分重要的问题就是如何确定递推表达式,也称为状态转移方程。如何确...
2020-05-02 23:43:36 172
原创 每日算法——动态规划之Fibonacci数列
OutlineFibonacci数列问题最优子结构和递推表达式Fib问题的各类变种青蛙跳-台阶跳硬币找零问题(敬请期待)一、Fibonacci数列1.1 最优子结构和递推表达式在很多生活场景中,我们都会遇到求解F(n) = F(n-1) + F(n-2)这类问题。它是一类非常重要的经典的简单的动态规划问题。首先F(n)的解是由F(n-1)和F(n-2)组成,而F(n-1)的解是由F...
2020-05-02 11:12:21 530
原创 0428HW技术面试算法题
问题:求一个集合的所有子集讨论:暴力情况下2n幂指数的复杂度,2n个子集。发现其中的规律:某一个元素存在与否可以作为选择子集的基本方法,元素存在和不存在为两者情况。值得注意的是,重复元素怎么办?先保留这个问题,从一般再到特殊。因此思路就出来了:对集合中的元素从头开始遍历,选该元素,进到子集集合中,不选该元素,开始考虑后一元素。为提高效率,选择Vector的 emplace_back更新子集,...
2020-04-29 23:14:24 235
原创 详细通俗易懂理解卷积神经网络CNN(下)
二、卷积神经网络2.1 卷积神经网络的基本结构所谓卷积神经网络,其基本网络结构包括:卷积层 ,Pooling层,全连接层。输入数据经过卷积后,得到特征map,特征map很大,直接进行全连接,消耗很大,经过pooling层后,起到特征选择的作用,降低维度,再进行全连接,最后经过非线性化(激励函数)和softmax得到输出。下面这张图清晰地展示了整个卷积神经网络的基本结构:卷积+Pooling+...
2020-04-29 18:16:31 1086
原创 详细通俗易懂理解卷积神经网络CNN(上)
Outline什么是卷积卷积怎么工作什么是卷积神经网络卷积神经网络怎么工作卷积神经网络怎样用一、卷积1 卷积的定义首先,卷积是一种运算法则,就像乘法加法,它规定了数据之间的运算规则。它是一种怎样的运算规则呢?定义如下:连续的定义:直白地说,是连续函数f和g的一种积分运算,其中,一个明显的特征就是两函数自变量之和为n,,tao是一个变量,将其记为x,n-tao 记为y,符合x ...
2020-04-29 00:00:42 915
原创 linux 安装miniconda jupyter 远程连接/ tensorflow-gpu 支持
系统环境1.下载与系统对应版本minicondawget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh2.运行miniconda安装程序bash Miniconda3-latest-Linux-x86_64.sh开始安装Miniconda3……3.source ~/.ba...
2019-08-01 14:54:03 426
原创 VScode Python 编程与virtualenv环境
1.项目跟目录下virtualenv venv2.选择venv中的python解释器3.删掉当前控制台,使用新的控制台4.导出环境依赖pip freeze > requirements.txt5.在项目目录下virtualenv env-name 默认不继承环境的库文件,建立虚拟环境;6.导入环境依赖pip install -r requirements.txt...
2019-07-29 14:38:40 563
原创 VScode User Settings
1.How to find setting?file->preference->setting2.find the "settings.json "3.pay attention to the character "," after each segment
2019-06-27 15:29:00 7674
原创 配置VMware Centos7 NAT虚拟网络模式 踩坑填坑
NAT 虚拟网络模式是指在本机基础上生成子网以供虚拟机使用在配置过程中,将虚拟机IP地址与本机虚拟网卡的IP设置在同一个子网中,并且必须配置DNS,否则无法上网。...
2019-03-26 15:16:12 328
原创 菌群多样性分析报告
参考链接https://www.docin.com/p-2107733531.html在开始实验项目之前,明确实验流程,一步一步获取实验结果,以可视化工具展现结果,并加以生物学意义上的分析,获取完整的分析报告。下面给出菌群多样性分析报告中应包含的大致内容,并对实验流程做出指导性的阐述。1.项目背景与概况简单阐述所研究项目的国内外现状,本项目的目的与意义。2.材料与方法(materi...
2019-03-16 23:01:32 10337
转载 数据分析图表解读——生信part
https://jingyan.baidu.com/article/0964eca212f6a88284f53675.html16SRNAV3-V4测序效果最佳1.柱状图横坐标:各样本,一个条形图代表一个样本;纵坐标:各分类层级(界门纲目科属种)的序列数目或者百分比,不同颜色表示不同层级,序列只计入分类得出的最低层级。2韦恩图一般只能表示五个样本或者分组3.稀释曲线...
2019-03-14 16:34:08 16097
转载 微生物组16S rRNA数据分析
原文链接:https://www.jianshu.com/p/920a5ce3a7a0微生物组16sRNA 数据分析常规流程:划分OTU , 构造距离矩阵,分析物种多样性指数,构建序列的进化树及物种注释信息。可以使用USEARCH、VSearch、Qiime来进行分析。1、划分OTUOTU为操作分类单元,基于序列相似度高于97%,将每个sample划分成不同OTU,每个OTU用一条...
2019-03-13 16:52:53 13025 2
原创 NCBI Genbank核苷酸序列数据库检索基因序列解读
核酸数据库Genbank数据库=Nucleotide数据库(一)基因序列注释内容解析以dut基因编码的大肠杆菌酶dutpase为例;在Nucleotide数据库search X01714或者dutpase,检索链接https://www.ncbi.nlm.nih.gov/nuccore/x01714;得到以下信息。1.LocusLocus:编号 长度 分子类别 基因拓扑类型...
2019-03-09 11:20:43 20155
原创 人类基因组计划成果
1.人类的蛋白编码基因只有2万~2.5万!基因是编码蛋白质的一段DNA序列,是遗传的基本功能单位。2万多个基因决定了一个人的外貌身高等,我想这应该是世界上总是会有人长得和你相似的原因吧!人类基因总数约为果蝇或者线虫的两倍,基因复杂度高得多。2.人类基因重复率达5.3%!人类基因的重复率显著大于鼠等生物,在进化历程中,人类的遗传物质经过了结构和功能上的变革,有别于其他灵长类动物。3....
2018-12-22 19:32:53 3339
原创 Bioinformatics 成长路线
人类基因组计划是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体中所包含的30亿个碱基对所组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。1985年,人类基因组计划由美国科学家率先提出,预算达30亿美金。主要由美国、法国、中国、日本、德国等国家通力合作研究,于2001年发表人类基因组工作草图,是人类基因组计划成功的里程...
2018-12-22 16:24:43 267
原创 细思极恐:无爱360 ----- 安装Tomcat9有感
如果您在安装Tomcat时,出现了以下问题,您务必要考虑您的安全管理软件:比如:360 专门去官网查文档https://tomcat.apache.org/tomcat-9.0-doc/introduction.html结果发现该配的环境变量也配了,Java版本在Java8及以上皆符合要求;百思不得其解,关闭360后: 真相大白于人间!回想起来真是细思极恐,360不...
2018-12-06 21:56:05 399
转载 Centos7 安装 Tomcat9
https://blog.csdn.net/stinkstone/article/details/78082725
2018-11-19 19:46:01 117
原创 Hadoop编程 实现统计单词词频并找出词频最高的单词(hadoop3.1.1 Centos7)
不能盲目寻找一些技术博文来浏览,非常浪费时间,最靠谱的方式莫过于官方文档hadoop3.1.1 运行词频统计的官方指导文档如下:https://hadoop.apache.org/docs/r3.1.1/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html按照文档所提示的内容主要可分...
2018-10-29 19:23:51 1546
转载 新概念,新平台:AI 技能的提供方和需求方
用算法匹配 AI 技能的提供方和需求方现在每一个行业可能都要思考,如果加上算法,加上 AI, 会变成什么样的一个形态?作为开发者,在 AI 时代要怎样做?你会发现你要学习很多新的知识、新的技能,而且出现了很多新的职位。你可以自学,也可以通过系统去学习,网上已经有极其丰富的课程。AI 也带来了开发者能力和收入的提升,而且每个行业里的大公司现在都需要 AI 专家。AI 的生产线要去实施,就需要算法的...
2018-10-27 14:59:21 277
转载 Linux Java 命令 Error: Could not find or load main class
https://www.cnblogs.com/mmnyjq/p/4065273.htmljavac :Java compiler 编译Java文件为字节码文件,实现跨平台java :于Java虚拟机运行字节码文件,Java [class文件名称]class后缀名文件无需加后缀,直接Java 文件名称...
2018-10-27 14:30:08 1585
原创 Centos7 安装JDK1.8.0
方法有如下三种,从易至难如下:1.yum install java-1.8.0-openjdk* -y命令只能安装开源jdk2.wget 命令或者官网下载https://www.oracle.com/technetwork/java/javase/downloads/java-archive-javase8-2177648.html你的电脑为64bit就下~x642.使用 ...
2018-10-18 16:41:28 493
转载 CentOS7搭建Hadoop3.1.1
https://blog.csdn.net/weixin_42142630/article/details/81837131非常感谢上面这位大佬详细地说明;其中就3.2 配置etc/hadoop中的文件做下补充:1.hadoop下载直接进虚拟机的浏览器搜索:http://hadoop.apache.org/releases.html (注意:一定是binary文件,否则...
2018-10-11 22:57:38 546 1
原创 CentOS7 不同虚拟机之间的免密登录
以下操作均需对所有虚拟机1.使用hostname + 名称 修改虚拟机的名称,修改/etc/hosts文件,添加主机IP与名称192.168.2.1 hostname1192.168.2.2 hostname2192.168.2.3 hostname32.生成密钥,使用命令ssh-keygen -t rsa3.生成文件 /root/.ssh/authorized_...
2018-10-11 20:35:01 1025
原创 C 文件流 按空格读取单词
1.fscanf(FILE *f, String Formation,Char * str)按照空格读取单词,Formation :字符串格式,读入 str;返回值为 int读取字符个数Formation:%s:只读入字符%d:只读整型数据%[a-z]:只读在a-z范围内的26个小写字母%[^a-z]:读除a-z外的字符,^为除……外2.getc(FILE *strea...
2018-10-09 21:21:31 1274
原创 texlive下载
http://mirrors.huaweicloud.com/repository/toolkit/CTAN/systems/texlive/Images/texlive2018.iso
2018-09-16 19:26:59 1396
原创 局域网实现文件共享
文件共享step1:建立两电脑之间的局域网查看控制面板\网络和 Internet\网络和共享中心\更改适配器设置\右键默认以太网\属性\右键Internet协议版本4\属性,更改其IPV4地址为:与被共享文件所在主机所在网络一致的地址,如被共享主机IPV4地址为192.168.10.2,子网掩码为255.255.255.0则本主机IPV4地址可改为:192.168.10.1~192.168....
2018-09-11 09:01:41 965
原创 浅谈隐式马尔科夫模型
马尔科夫模型是基于马尔科夫假设与观测序列的独立性,著名的马尔科夫假设即状态的转移至于前一个状态有关,与将来无关。将该模型用(A,B,Pi)三元组表示,其中A表示状态转移概率矩阵,元素为:P(St|St-1),B表示在观测输出条件Oi下隐含状态序列Si的概率矩阵,元素为:P(Si|Oi);Pi表示初始状态概率P(Si)。三类问题:(1)已知观测序列(输出符号的概率序列)求取其隐含序列,以语音识别为例...
2018-05-10 15:25:47 1160
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人