自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 windows10+py36+MeCab安装总结

简要介绍下我的环境;windows10+python36+anconda,由于最近要用到日文分词,所以在网上找了一些日文分词工具,比较快速又准确的就是MeCab了,但是找了一个下午,网上的安装教程又少,又乱(不矛盾,真的没什么有价值的文档,尤其是Windows系统,真的没什么教程,最后向实验室的师兄求助,给我发了一篇比较靠谱的安装教程,日文版的呢 ,哈哈,不说废话了,下面是步骤)1.下载...

2018-08-21 20:50:56 6319 9

原创 移动端开发菜鸟成长记(一)

前言硕士做了两年机器学习,实习干了点NLP、推荐,结果校招完全换掉了方向……入职三个月的我现在技术栈一片混乱,可能没有方向就是最高的境界(●'◡'●)刚入职就一头雾水的接到一个移动端开发的任务,回顾两个多月来的迷茫与进展,还是想要记录下,可以回忆这段“特别”的日子。北京的这个天气真的好难穿衣服啊!正文我参与的是一个使用Vue框架开发的移动端项目,写的这一系列文章是根据我自己的学习摸索情况进行记录,希望对于移动端的小白提供一些帮助。相对于PC端的前端开发,移动端开发是基于移动设备(人话就是

2020-11-11 22:58:52 229

原创 移动端视频播放踩坑记

移动端视频播放踩坑记(一更:2020.11.9)本人参与的项目是基于Vue框架进行移动端开发,其中一个页面需要实现播放视频的功能,实现过程及遇到的问题记录如下。一、video标签1.用法<video class="video-player"src="../assets/videoDemo.mp4" // 你的视频地址,包括url链接和本地资源两种形式type="video/mp4" // 视频类型contrlos="controls">

2020-11-09 20:24:43 1148

原创 GBDT与XGboost小结

划重点——AdaBoost + 决策树 = 提升树                 Gradient Boosting + 决策树 = GBDTGBDT(Gradient Boosting Decision Tree)1.算法原理:GBDT(梯度提升决策树),是一种基于boosting串行式的集成学习方法,通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回...

2018-04-16 20:00:09 775

原创 随机森林小结

划重点:Bagging + 决策树 = 随机森林1.算法原理:随机森林,是基于bagging的一种并行式集成学习方法,可以用来做分类、回归。随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由基学习器输出的类别的众数而定。通过自助法(bootstrap)重采样技术,从原始训练样本集N中有放回地重复随机抽取N个样本生成新的训练样本集合,然后根据自助样本集生成k个分类树组成随机森林。在构造第i...

2018-04-16 16:39:39 1127

转载 数据库规范化(二)

转自:https://blog.csdn.net/zxq1138634642/article/details/9121103数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常。反之则是乱七八糟,不仅给数据库的编程人员制造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息。范式...

2018-04-01 15:55:32 1424

转载 数据库规范化(范式)(一)

——转自:https://blog.csdn.net/hbrqlpf/article/details/1887204关系数据库规范化理论一个关系数据库由一组关系模式组成,一个关系由一组属性名组成,关系数据库设计就是如何把已给定的相互关联的一组属性名分组,并把每一组属性名组织成关系的问题。1、关系规范化的作用所谓规范化,就是用形式更为简洁、结构更加规范的关系模式取代原有关系的过程。2、函数依赖2.1...

2018-04-01 15:45:58 2184

原创 统计学习方法-读书笔记-1.概论

这本书的主要内容是关于监督学习,统计学习方法三要素:模型+策略+算法;监督学习方法的应用:分类、标注、回归。1.1统计学习“学习”:如果一个系统能够通过执行某个过程改进它的性能,这就是学习。统计学习的对象是数据,它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去。1.2监督学习(有标记,预测)(1)概念:输入空间、特征空间与输出空间(2)变量的不同类型,...

2018-03-31 00:00:53 230

原创 一书读懂数据分析

一、概述1.常见的数据分析方法:(1)基础分析法(6种):比较分析法、平均分析法、分组分析法、立体分析法、结构分析法、金字塔原理。(2)高级分析法(6种):对应分析、回归分析、相关分析、聚类分析、假设检验、因子分析。二、落实数据分析1.数据分析步骤:(1)清晰分析目的(先决条件);(2)获取数据来源:数据获取渠道—两大类:直接获取和间接获取,细分5类,企业内部数据、互联网数据、数据分析工具(百度指...

2018-03-23 11:12:42 418

原创 《数据分析实战》——2.制表篇(3—5)

三、数据采集与整理1.数据采集的几条重要原则:足够复杂、足够细(粒度细)、有跨度(尽量找不同时间、地区的数据)、要有可行性2.“逐步推进法”推测需要的数据(步骤:总量-结构-时间序列-颗粒度)3.数据整理过程(耗时耗力,有三点要求-尽可能保证数据是对的、数据能用得上、数据的格式能够直接用于分析)(1)重复、空行、空列数据删除(F5-定位)(2)缺失值的填充和分析(3)数据间逻辑的排查—Excel中...

2018-03-22 17:53:09 300

原创 《数据分析实战》——1.基础篇(1—2)

一、什么是数据分析1.企业数据量比较大的,复杂度比较高的,颗粒度比较细的数据,具有比较高的分析和利用价值。数据量大——两点:企业的行业属性和信息化程度(典型的就是互联网行业)数据复杂度——如果说数据量相当于数据的行,那么数据复杂度就相当于数据的列。数据颗粒度——是指从不同的层次来看待数据颗粒度越细越好,可以自行组合为颗粒度较粗的数据。2.数据分析给我们带来什么(1)了解数据的整体状况:总体状况(总...

2018-03-22 13:32:28 1570

原创 数据挖掘流程简述

数据挖掘建模过程:1.定义挖掘目标:明确到底要干什么2.数据抽样:从业务系统中抽取出与挖掘目标相关的样本数据子集。抽样标准有三:相关性、可靠性、有效性,不要动用全部数据。通过数据样本的精选,减少数据处理量,节省系统资源,突出我们想要寻找的规律。3.数据探索:拿到样本集后,探索——属性之间的相关性、明显的规律和趋势、异常的数据状态等,对所抽取的样本数据进行探索、审核和必要的加工处理,是保证最终的挖掘...

2018-03-21 18:19:34 898

原创 数据分析-内容整理

一、认识数据分析1.数据分析是指用合适的统计分析方法对收集来的数据进行分析,将这些大量的数据进行汇总,并做成可以被人们消化和理解的资料,从中提取有用的信息。2.数据分析的基本步骤(6个,缺一不可,相辅相成)(1)明确分析目的:不要偏离分析方向,确保工作有效进行。(2)数据收集:按照确定的数据分析目的来收集相关数据的过程,为分析提供依据。数据的来源一般有4个渠道:数据库(企业业务相关性最强),互联网...

2018-03-21 18:02:14 4026

原创 西瓜书笔记-8.集成学习

关键词:好而不同,基学习器,Boosting,AdaBoost,Bagging,随机森林(RF),Stacking学习8.1个体与集成集成学习:通过构建并结合多个学习器来完成学习任务。先构建“基学习器”或“个体学习器”,再用某种策略将他们结合起来。集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能,所以基学习器也成为弱学习器,集成学习研究的核心就是如何产生并结合“好而不同”的...

2018-03-21 13:52:47 597

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除