自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Xiaozhu的博客

全力以赴,你会很酷!

  • 博客(22)
  • 收藏
  • 关注

原创 数据分析之“设立标准、判断分类”

        从经验里提炼出标准,是数据分析师的一项重要能力! 标准关乎好坏的判断,也是后续所有分析的基础,标准错,分析方向就会错,进而导致分析结论错,一错到底。因此,如何定义标准,判断分类,也是数据分析师的一项重要能力。       不妨先回忆一下我们在工作中经常碰见的一种场景,业务人员匆匆的来和你说:***模...

2020-03-02 11:52:44 792

原创 《请停止无效的努力》读书笔记

一、如何快速找到你的天赋优势1、人的价值定位1.1、冰山模型        你能创造多大的价值,离不开三大内在因素:第一要素:知识和技能,位于冰山显露的部分,是非常显性,容易展示出来的;第二要素:能力,比如:思考能力、人际交往能力等,需要通过仔细的行为观察才能看出,位于冰山的中间部分;第三要素:天赋。包括潜在能力、性格特质、动机、价值观等 ...

2020-02-09 15:15:34 6439 5

原创 《运营之光》读书笔记

前言        在很多人看来,“运营”这个职位就是一个打杂的,主要是因为互联网公司内的运营岗位和运营工作的职责是高度不标准的。不同类型的运营岗位负责的内容天差地别;同一类型岗位不同类型产品的运营锁负责的内容也不尽相同。因此大部分人对运营没有一个准确的定位于认知,而《运营之光》这本书则彻底理清楚了运营这个职位的职责、分工、不同岗位对能力的要求;以及不同岗...

2019-12-16 16:47:35 8569

原创 爬虫常见问题汇总

1、webdriver.Chrome设置无界面模式from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionschrome_options = Options()chrome_options.add_argument('--headless')driver = webdriver....

2019-06-29 17:51:59 1307

原创 MySQL常见问题汇总

1、distinct 关键字作用范围只能放在select语句第一个列名之前,且对所用列名都起作用即:必须所有列名的组合唯一时,才会被保留下来若要实现基于某一个列名去重,且还要选择其他列, 则可使用 group by 代替如:select a, b from table_name group by a...

2019-06-26 11:52:39 335

原创 《活用数据——驱动业务的数分析实战》读书笔记 (实战篇)

第四章、战略分析案例解析        如思维篇所述,分析思路是从研究目的到研究内容的分解过程。因此需要考虑如下两个问题:战略分析的研究目的战略分析的研究内容1、研究目的:战略选择        战略分析的研究目的是帮助企业进行战略选择,选择适合自己的目标市场。需要回答以下两个问题:市场吸引力:这个市...

2019-05-01 14:27:22 3459 1

原创 《用数据讲故事》——Cole 读书笔记

以上内容通过幕布整理《用数据讲故事》读书笔记幕布连接

2019-04-26 15:08:50 885

原创 pandas.get_dummies (独热编码)详解

dummiesNewData = pandas.get_dummies(newData,columns=[‘症状’],prefix=[‘症状’],prefix_sep=’_’) # 注意陷阱哇 在给新的观测数据进行转换时,一定要加上下面的代码newData[‘症状’] = newData[‘症状’].astype(‘category’,categories=data[‘症状...

2019-04-24 09:42:36 20144 7

原创 《活用数据——驱动业务的数分析实战》读书笔记 (思维篇)

前言数据分析新手最为头疼的两个问题就是: 这么想? 怎么做?。本书基于企业营销环节的业务需求从这两个环节入手,帮助收据分析新手破局!以下是本书行文框架:第一章、明确分析问题黄金思维圈法则的应用: Why ——> What ——> How1、Why:为什么分析1.1、识别机会企业面临的第一难题:市场机会在哪里?,可以通过量化分析,在消费者尚未被满足的需求里,发现市场的空白...

2019-04-23 22:25:49 2070 2

原创 Python连接MySQL数据库

尽管很多 NoSQL 数据库近几年大放异彩,但是像 MySQL 这样的关系型数据库依然是互联网的主流数据库之一,每个学 Python 的都有必要学好一门数据库,不管你是做数据分析,还是网络爬虫,Web 开发、亦或是机器学习,你都离不开要和数据库打交道,而 MySQL 又是最流行的一种数据库,这篇文章介绍 Python 操作 MySQL 的几种方式。一、通过pymysql进行连接数据库的访问无非...

2019-04-11 20:47:46 444

原创 os.path.abspath(__file__)与os.path.dirname()以及os.path.basename(__file__)的用法详解

1、os.path.abspath(_file_)os.path.dirname(_file_)返回脚本的绝对路径

2019-04-09 18:28:37 16328

原创 《习惯的力量》——屈平(读书笔记)

以上内容通过“幕布”整理《习惯的力量》幕布连接

2019-04-09 08:19:15 666

原创 Python常见问题汇总

1、返回列表最大元素的索引2、将列表元素去重并保持原有顺序3、数据框指定位置添加列4、获得某个文件夹下所有文件名称(包括子文件夹内的文件)5、6、7、8、9、10、...

2019-03-25 16:17:05 303

原创 常见思维模型汇总(二)

一、PEST分析法1、简介       PEST分析是指宏观环境的分析, P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology) 。在分析一个企业集团所处的背景的时候,通常是通过这四个因素来进行分析企业集团所面临的状况。此分析法能从各个方面比较好的把握宏观环境的现状及变化的趋势,有利于企业对...

2019-03-23 13:22:16 4566

原创 即兴表达的技巧

Xiaozhu的幕布: https://mubu.com/doc/eiE3mJ5McF

2019-02-08 14:55:09 383

原创 常见思维模型汇总(一)

一、SWOT模型1、简介       SWOT分析代表分析企业优势(strengths)、劣势(weakness)、机会(opportunity)和威胁(threats)。因此,SWOT分析实际上是将对企业内外部条件各方面内容进行综合和概括,进而分析组织的优劣势、面临的机会和威胁的一种方法。2、SWOT模型的拆解  &am

2019-02-08 14:43:28 12724

原创 MySQL索引详解

一、索引简介关于MySQL索引的好处,如果正确合理设计并且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车。  索引是一种特殊的文件,它们包含着对数据表里所有记录的引用指针。例如这样一个查询 :select * from table1 where id=10000。如果没有索引,必须遍历整个表,直到ID等于10000的这一行被找到为止;有了索引之后(...

2018-12-28 17:47:43 125

原创 Tableau保存数据的文件格式

1、Tableau简述Tableau是一款专注于数据可视化的软件,它可以帮助您生动地分析实际存在的任何结构化数据,以在几分钟内生成美观的图表、坐标图、仪表盘与报告。利用 Tableau 简便的拖放式界面,您可以自定义视图、布局、形状、颜色等等,帮助您展现自己的数据视角。2、数据提取与实时在对Tableau保存数据的文件格式讲解之前,必须先分清楚Tableau数据连接的两种方式:实时(Li...

2018-12-12 22:49:03 9168 1

原创 Python 时间提取并格式化处理

在进行文本预处理的过程中,有时候需要将文本中的日期数据提取出来并将其按照一定的格式标准化,进而进行比较大小之类的操作。1、日期提取在文本中日期呈现的方式各种各样,如:2018.12.2、2018.12.02、2018-12-2、2018-12-02、201/12/2、二零一八年十二月二日、2018年12月2日 等等,我们可以利用正则表达式将其提取出来。假设存在如下文本数据,我们需要提取文中...

2018-12-02 11:50:32 7854

原创 TensorFlow中的损失函数

分类问题和回归问题是监督学习的两大种类,本文将分别介绍分类问题和回归问题中使用到的经典损失函数以及根据实际情况所自定义的损失函数。同时注意损失函数定义的是损失,所以要将利润最大化,定义损失函数应该刻画成本或者代价。在实际情况中,可以根据具体问题自定义损失函数。一、经典损失函数1、分类问题1.1、交叉熵简介机器学习中,在解决二分类的情况时,可以通过设置一个阈值,大于阈值的认为是一类,小于阈...

2018-11-20 19:36:56 462

原创 jiaba库之关键词提取(增量更新自定义语料)

一、提取语句关键词在自然语言处理中,经常会遇见对文章或者信件进行关键词提取。而jiaba库正给我们提供了两种简单的关键词提取方法(TF-idf与TextRank)。本文不讲这两方式提取关键词的原理,只注重如何实现。在Python中,短短四个语句就能实现关键词的提取,我们所使用的文本数据为《红楼梦》中的某个章节。第二回 贾夫人仙逝扬州城 冷子兴演说荣国府  诗云  一局输赢料不真,香销茶尽尚...

2018-11-14 22:33:54 5174 2

原创 Word2Vec模型增量训练

一、 问题由来word2vec的本质是一个神经网络语言模型,基于语言模型进行分布式词向量的训练。它需要大量的语料进行训练,从而找到词与词之间的关系,但是当我们已经训练好了一个word2vec模型之后,数据库中又新流动进来了很多语料,我们应该在怎么办呢?我们不可能又基于所有语料重新训练一遍(当语料过大时,太耗费时间了),这时候,增量训练就派上了用场。二、word2vec模型的增量训练impor...

2018-11-13 18:50:44 12990 12

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除