自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (5)
  • 收藏
  • 关注

原创 使用python操作excel——模块openpyxl使用指南 基本够用了

1、安装pip install openpyxl 这样就可以了想要在文件中插入图片文件,需要安装pillow,安装文件:PIL-fork-1.1.7.win-amd64-py2.7.exe·font(字体类):字号、字体颜色、下划线等·fill(填充类):颜色等·border(边框类):设置单元格边框·alignment(位置类):对齐方式·number...

2019-03-05 17:04:22 858

原创 汉语中文NLP自然语言处理学习笔记——基础原理NLP中的概率图模型

1--信息熵1.信息熵信息熵被定义为对平均不确定性的度量。一个离散随机变量X的信息熵H(X)定义为:信息熵的本质是信息量的期望。信息熵是对随机变量不确定性的度量。随机变量X的熵越大,说明它的不确定性也越大。若随机变量退化为定值,则熵为0。平均分布是“最不确定”的分布。2.互信息、联合熵、条件熵1)互信息:定义x的后验概率与先验概率比值的对数为y对x的互信息量。公式如下:互信息的性质:1)互信息可以...

2018-05-11 18:51:41 1121 2

原创 Linux学习笔记——强大的vim 程序编辑器

什么是 vim 呢?其实可以将 vim 视作 vi 的进阶版本,vim 可以用颜色或底线等方式来显示一些特殊的信息。 举例来说,当你使用 vim 去编辑一个 C 程序语言的文件,或者shell script 脚本程序时,vim 会依据文件的扩展名或者是文件内的开头信息,判断该文件的内容而自动的调用该程序的语法判断式,再以颜色来显示程序码与一般信息。基本上 vi 共分为三种模式,分别是“一般指令模式...

2018-04-28 17:15:23 167

原创 Linux学习笔记——Linux 的文件权限

Linux一般将文件可存取的身份分为三个类别,分别是 owner/group/others,且三种身份各有 read/write/execute 等权限。(文件拥有者;群组;其他人)1 Linux文件属性ls -al:(有a表示隐藏文件也展示出来)-rw------- 1 root  root       1415 Apr 27 14:54 nohup.out-rw-r--r-- 1 root  ...

2018-04-28 17:12:40 175

原创 Linux学习笔记——文件与目录管理

目录相关操作:cd:变换目录pwd:显示目前的目录mkdir:创建一个新的目录rmdir:删除一个空的目录rm -r : 删除非空目录1 文件与目录的检视: ls-l :长数据串行出,包含文件的属性与权限等等数据;(常用)-a :全部的文件,连同隐藏文件( 开头为 . 的文件) 一起列出来(常用)-A :全部的文件,连同隐藏文件,但不包括 . 与 .. 这两个目录2 复制、删除与移动: cp, r...

2018-04-28 17:07:36 133

原创 Linux学习笔记——LINUX学习建议

LINUX学习建议1. 计算机概论与硬件相关知识: 至少要“听过、有概念”即可;2. 先从Linux的安装与指令学起: 没有Linux怎么学习Linux呢?所以好好的安装起一套你需要的Linux吧!虽然说Linux distributions很多, 不过基本上架构都是大同小异的,差别在于接口的友好度与软件的选择不同罢了! 选择一套你喜欢的就好了,倒是没有哪一套特别好说~3. Linux操作系统的基...

2018-04-28 17:03:24 195

原创 数据挖掘导论笔记

数据挖掘导论——探索数据    汇总统计        频数和众数(对于无序的、分类的数据)        百分位数(对于有序数据)        位置度量:均值和中位数(对于连续数据)        散步度量:极差和方差(连续数据)        多元汇总统计:除了方差,还有:            协方差矩阵            相关性:相关矩阵 -1到1之间

2018-01-24 18:20:19 226

python机器学习库scikit-learn

专门讲python机器学习库sklearn的,适合初学者。 在这本书里,我们将看到一些机器学习的模型和算法。我们会介绍一些常用的机器学习任务和模型的 效果评估方法。而这些模型和算法都是通过十分流行的Python机器学习库scikit-learn来完成,里面有 许多机器学习的模型和算法,每个API都简单易用。 本书特点主要有: 内容通俗易懂。本书只需要基本的编程和数学知识 案例实用。本书的案例都很容易上手,读者可以调整后解决自己的问题。

2018-04-21

The_Elements_of_Statistical_Learning(统计学习精要)

豆瓣评分9.5的好书,斯坦福大学课程用书,有需要的大神们拿去看看吧

2018-04-21

常用数据挖掘算法总结及Python实现 文字版+code

本书适合有志于从事数据挖掘的初学者,需要的朋友可看看 第一部分 数据挖掘与机器学习数学基础3 第一章 机器学习的统计基础3 第二章 探索性数据分析(EDA) .11 第二部分 机器学习概述14 第三章 机器学习概述14 第三部分 监督学习---分类与回归16 第四章 KNN(k 最邻近分类算法) 16 第五章 决策树19 第六章 朴素贝叶斯分类29 第七章 Logistic 回归 .32 第八章 SVM 支持向量机42 第九章 集成学习(Esemble Learning)43 第十一章 模型评估46 第四部分 非监督学习---聚类与关联分析50 第十二章 Kmeans 聚类分析 .50 第十三章 关联分析 Apriori.52 第十四章 数据预处理之数据降维54 第五部分 Python 数据预处理 .57 第十五章 Python 数据分析基础 .57 第十六章 Python 进行数据清洗 .77 第六部分 数据结构与算法82 第七部分 SQL 知识.86 第八部分 数据挖掘案例分析87 案例一 A Journey through Titanic 597c770e .87 案例二 Analysis for airplane-crashes-since-190894 案例三 贷款预测问题98 案例四 KNN 算法实现葡萄酒价格模型预测及交叉验证107

2018-04-21

面向程序员的数据挖掘指南 文字版+配套代码+data

这是一本用于学习基本数据挖掘知识的书籍。大部分关于数据挖掘的书籍都着重于讲解理论知识,难以理解,让人望而却步。不要误会,这些理论知识还是非常重要的。但如果你是一 名程序员,想对数据挖掘做一些了解,一定会需要一本面向初学者的入门书籍。这就是撰写本书的初衷。 这本指南采用“边学边做”的方式编写,因此在阅读本书时,我强烈建议您动手实践每一章结束提供的练习题和实验题,使用书中的Python脚本将其运行起来。书中有一系列展示数据挖掘技术的实例,因此在阅读完本书后,你就能掌握这些技术了。

2018-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除