自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (3)
  • 收藏
  • 关注

原创 修改Jupyter notebook的默认打开文件夹

右键Jupyter Notebook图标,点击属性,

2020-07-11 09:31:33 385

原创 调和平均数,几何平均数,算数平均数,平方平均数

四种平均数的大小关系调和平均数≤几何平均数≤算术平均数≤平方平均数。调和平均数:Hn=n/(1/a1+1/a2+...+1/an)几何平均数:Gn=(a1a2...an)^(1/n)算术平均数:An=(a1+a2+...+an)/n平方平均数:Qn=√ [(a1^2+a2^2+...+an^2)/n]这四种平均数满足 Hn ≤ Gn ≤ An ≤ Qn。四种平均数的应用...

2019-08-02 11:52:02 71459 4

转载 什么是P问题、NP问题和NPC问题

这或许是众多OIer最大的误区之一。你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所说的NP问题其实都是指的NPC问题。他们没有搞清楚NP问题和NPC问题的概念。NP问题并不是那种“只有搜才行”的问题,NPC问题才是。好,行了,基本上这个误解已经被澄清了。下面的内容都是在讲什么是P问题,什么是N...

2019-08-01 20:43:54 341

原创 pyecharts地理位置可视化

明确目标:利用pandas对数据进行查询操作,并利用pyecharts对地理位置可视化,有些地理位置在地理库中不存在,如雄安新区等,需要我们添加地理位置。pyecharts中文文档我们仍然使用招聘数据:数据地址import pandas as pdimport numpy as npdata = pd.read_excel('数据挖掘.xlsx',header = None)...

2019-07-18 10:50:46 2685

原创 基于Python的jieba分词和词云展示

jieba分词是目前最好的python处理中文的词库,有三种模式:精确模式、全模式、搜索引擎模式,并且支持自定义词库。本文词云根据读取txt文件,文件主要是招聘职位的词云统计及可视化,其中为了更好地展现词云的效果,我们创建了自定义词库和停用词库:先简单说说精确模式,全模式,搜索引擎模式精确模式和全模式相当于贪婪算法,即最大匹配与最小比配,精确模式是对句子进行越少的切分越好,且切分后无重...

2019-07-17 14:53:27 1951

原创 python运用正则表达式进行数据处理

上一篇:爬虫篇待处理数据集处理后数据集正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。——百度百科现在我们处理一下之前所获得的招聘数据,想达到的目标如下:1.去掉职位中的括号及集中内容2.薪酬的格式不易统计,改成统一...

2019-07-16 12:19:28 4441

原创 购物篮数据两种商品间的关联分析

先讲一个故事,来自于百度知道。在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集...

2019-07-14 10:03:50 4441 12

原创 利用Python爬取前程无忧(51job)上的招聘岗位

爬取数据集整理后数据集开始之前先了解一下什么是网络爬虫,百度百科对于网络爬虫的解释是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。也就是相当于我做一个机器人,我让它上网帮我找大量的资料。我要告诉他我想要什么数据,怎么找,是从一个网站找,还是好多网站一起找,数据中要包含什么属性,以上就是我们所讲的爬取策略。这其中要学习一些网络结构的内容,请读者自行参阅HTML的相关文献,非常简单。...

2019-07-05 21:15:52 14444 19

原创 SQL server 等值连接与自然连接,解决自然连接去掉重复列的问题

首先介绍一下SQL中的等值连接与自然连接:等值连接是从关系R与S的广义笛卡尔积中选取A、B属性相等的那些元组,按照属性相同的行将两(或以上)张表元组匹配连接;自然连接是特殊的等值连接,要求两个关系中进行比较的分量必须是同名的属性组,并且在结果中把重复的属性列去掉。在SQL server中创建如下两个表格,Student表(储存学生信息)、SC表(储存学生成绩);Student:...

2018-02-02 09:16:20 22673 3

原创 调节屏幕缩放与布局,解决右键菜单栏面积过大、屏幕大小不合适

今天小编用新买的14寸轻薄本开开心心的写论文,在改段落的时候出现了如图的情况:右键段落菜单栏的面积太大,确定键被隐藏到下方任务栏了,于是我在Word里边苦苦找寻了半天怎么解决这个问题。未果...于是我用出了杀手锏,改一下屏幕缩放与布局吧。操作过程如下:1.点击开始菜单——>设置——>选择系统;2.将缩放与布局设置为125%(我觉得刚...

2018-02-01 19:01:18 12931

原创 SQL server 更改计算机名后造成未找到或无法访问服务器解决方法

默认的计算机名较长且不易辨识,我在更改完计算机名之后却发现每次登陆SQL server都需要更改计算机名并重启计算机,否则便会出现以下错误提示;此时我们需要再次更改计算机名(最终你想给计算机起的名字)并重启计算机,因为每次更改过计算机名后第一次都能顺利访问服务器,下面是更改计算机名的步骤;1.右键我的电脑——>点击属性——>点击如图更改设置;...

2018-01-31 09:51:09 6561 4

数据挖掘类数据2300条(已整理)

包含职位名称,工作地点,网址,最低薪酬,最高薪酬,公司规模,公司类型,学历要求,经验要求等,数据挖掘类数据2300条(已整理),可能含有数据挖掘类无关职位。

2019-07-16

数据挖掘2300条数据(未处理)

用python爬取51job上2300条数据,包括职位,公司,薪酬,地点,招聘要求,学历要求,经验要求,网址,公司类型等,未经处理,EXCEL格式。

2019-07-16

test_support_confidence.txt

200条购物篮数据,包含7种商品,可用于数据挖掘做关联分析的demo使用

2019-07-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除