自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

慕白博客

慕白的极客之旅

  • 博客(115)
  • 收藏
  • 关注

原创 Linux 之 我最常用的20条命令

玩过Linux的人都会知道,Linux中的命令的确是非常多,但是玩过Linux的人也从来不会因为Linux的命令如此之多而烦恼,因为我们只需要掌握我们最常用的命令就可以了。当然你也可以在使用时去找一下man,他会帮你解决不少的问题。然而每个人玩Linux的目的都不同,所以他们常用的命令也就差异非常大,而我主要是用Linux进行C/C++和shell程序编写的,所以常用到的命令可以就会跟一个管理Li...

2019-09-18 15:20:58 531

原创 cryptogen tool not found.的解决方案

在执行./byfn.sh -m generate的时候可能会报错,cryptogen tool not found.网上一堆说法是执行curl -sSL https://goo.gl/eYdRbX | bash其实就是执行bootstrap.sh 但是那个网址已经失效了。肯定解决不了。其实在安装Hyperledger Fabric 的时候已经有这个文件了。路径在fabic/scripts...

2019-08-12 23:07:25 1627

原创 解决Mac下废纸篓文件无法删除(错误代码-36)

解决Mac下废纸篓文件无法删除(错误代码-36)在回收站删除文件的时候发现,无法完成操作,不能读取写入。然后尝试在终端中删除文件,居然提示I/O错误。最后发现是MAC下关联NTFS硬盘导致-36。切换到Windows,用管理员模式打开PowerShell,在相应的磁盘中运行chkdsk修复磁盘就可以了。...

2019-08-06 19:59:58 10436

原创 安卓中的三种Adapter适配器

安卓中的三种Adapter适配器适配器是一个非常重要的知识点,Adapter是用来帮助填出数据的中间桥梁。适配器将各种数据以合适的形式显示在View中给用户看。一、ArrayAdapter(数组适配器)有一定的局限性,只能显示一行文本数据0x1 基本使用实例(1)、采用Java控制显示内容布局文件:<?xml version="1.0" encoding="utf-8"?&gt...

2019-04-14 15:43:53 18585 5

原创 重学Java之List

重学Java之List0、概述一个Java对象可以在内部持有若干其他Java対象,并对外提供访问接口,这种Java对象称为集合。Java的数组可以看作是一种集合有了数组为什么还需要其他集合类?数组初始化后大小不可变数组只能按索引顺序存取java.util提供了集合类,包括:Collection:集合类的根接口List:有序列表Set:无重复元素集合Map:通过Ke...

2019-02-18 20:29:56 272

原创 Python实用脚本实践

Python实用脚本实践一、文件相关查找文件import ospath = 'xxx'files = os.listdir(path)for f in files: if f.endswith('.png') and 'fish' in f: print('I found this' + f)分类文件根据后缀名将文件分类至不同文件夹import shu...

2019-02-17 11:10:24 3097

原创 重学Java之核心类

重学Java之核心类一、StringJava字符串的特点:字符串对象可以直接使用"…"表示内容不可变使用equals()判断是否相等字符串常用操作:是否包含子串int containsint indexOf/lastIndexOfboolean startsWith/endsWith去除首尾空白字符trim()移除首尾空白字符空格、\t、\r、\n不改变...

2019-02-16 15:44:42 233

原创 一次学会Python数据可视化的10种技能

一次学会Python数据可视化的10种技能如果你想要用Python进行数据分析,就需要在项目初期开始进行探索性的数据分析,这样方便你对数据有一定的了解。其中最直观的就是采用数据可视化技术,这样,数据不仅一目了然,而且更容易被解读。同样在数据分析得到结果之后,我们还需要用到可视化技术,把最终的结果呈现出来。可视化视图都有哪些?按照数据之间的关系,我们可以把可视化视图划分为4类,它们分别是比较...

2019-02-12 16:25:25 1265 2

原创 Python爬虫:自动化下载海报

Python爬虫:如何自动化下载海报?上一讲中我给你讲了如何使用八爪鱼采集数据,对于数据采集刚刚入门的人来说,像八爪鱼这种可视化的采集是一种非常好的方式。它最大的优点就是上手速度快,当然也存在一些问题,比如运行速度慢、可控性差等。相比之下,爬虫可以很好地避免这些问题,今天我来分享下如何通过编写爬虫抓取数据。爬虫的流程相信你对“爬虫”这个词已经非常熟悉了,爬虫实际上是用浏览器访问的方式模拟了...

2019-02-12 14:50:42 1256

原创 数据分析可视化复现

import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")df = pd.read_csv("./data/HR.csv")df = df[df["last_eva...

2019-02-12 12:30:38 461

原创 Seaborn强大的调色功能

Seaborn强大的调色功能使用matplotlib绘图def sinplot(): x = np.linspace(0,14,100) plt.figure(figsize=(8,6)) for i in range(4): plt.plot(x, np.sin(x+i)*(i+0.75), label='sin(x+%s)*(%s+0.75)'% (...

2019-02-11 19:52:48 784 1

原创 Seaborn设置图形显示的效果

Seaborn设置图形显示的效果绘制三角函数x = np.linspace(0,14,100)y1 = np.sin(x)y2 = np.sin(x+2)*1.25def sinplot() plt.plot(x,y1) plt.plot(x,y2) plt.show()使用matplotlib绘图的效果使用seaborn绘图设置显示主题seabo...

2019-02-11 18:07:00 1587

原创 Seaborn

Seaborn一、Seaborn和Matplotlib对比Seaborn是matplotlib的强大的一个扩展。一个例子要求画出花萼和花瓣的长度的散点图,并且颜色要区分花的种类花的品种一共三种:根据花的种类定义好每种花的颜色color_map = dict(zip(iris.Name.unique(), ['blue','green','red']))使用matplotlib...

2019-02-11 17:29:35 23410 2

原创 直方图和密度图

直方图和密度图一、直方图直方图反映的是一组数据的分布情况0x1 绘制直方图hist方法可以用来绘制直方图,为了使图像更清晰,可以指定每个柱间宽度:s = Series(np.random.randn(1000))plt.hist(s)plt.hist(s,rwidth=0.9)直方图反应的是分布情况,为了加深这一理解,可以看如下实验:反映了每个值出现的次数0x2 指...

2019-02-11 15:14:31 8411

原创 Pandas绘图之Series和Dataframe

Pandas绘图之Series和Dataframe一、Series绘图0x1生成数据并画图首先生成一个series数据:import numpy as npimport pandas as pdfrom pandas import Seriesimport matplotlib.pyplot as plts1 = Series(np.random.randn(10)).cumsum...

2019-02-11 15:13:53 1125

原创 Subplot和Subplots绘制子图

Subplot和Subplots绘制子图plot可以绘出精美的图形,但是如果想要在一张图中展示多个子图,plot就很难办了。matplotlib提供了subplot来解决这一问题。(其实很像matlab中的绘图方法)Subplot绘图方法首先利用之前plot的方法,在一个人图中绘制两个曲线:import numpy as npimport matplotlib.pyplot as pl...

2019-02-11 14:00:00 3747

原创 一条命令搞定黑苹果双系统时差

安装黑苹果和Win10双系统的时候,重启进入Win10就会发现时间不对了。在Mac端输入下面的代码修复该问题。sudo sh -c "$(curl -kfsSL https://raw.githubusercontent.com/hieplpvip/LocalTime-Toggle/master/fix_time_osx.sh)"输入当前用户密码然后回车重启即可...

2019-02-10 17:47:23 11607 3

原创 Markdown文本中图片的整体迁移

问题复现在markdown软件中写作时,为了使图片在所有平台都可以访问,必须要一个图床。插入图片时可以先通过iPic或者PicGO等图床软件进行转换,但是每次插图的时候都需要进行一次上传图片在粘贴markdown代码的操作,有点不方便,尤其是文章要插入很多图片的时候。还有一个情况就是,比如在有一篇好文章你想把它保存为markdown,但是文章采用了防盗链功能,直接转换图片地址就有点行不通。那...

2019-02-09 21:38:12 2918 3

原创 Hexo主题casper使用教程

Hexo主题casper使用教程我看到的一个好的主题,对其中的部分代码进行了修改。原项目地址 https://github.com/xzhih/hexo-theme-casperDEMO https://blog.geekmubai.com特性文章封面图(在首页文章摘要上显示)文章特色图(在文章详细页面上置顶)自定义菜单自定义 favicon, logo, 头部背景, 作者头像...

2019-02-07 23:11:11 1466

原创 Syncthing就是我要的同步备份软件

Syncthing就是我要的同步备份软件引言数据无价,平时不注意备份,电脑突然翻车就追悔莫及啦。最开始的时候,我在路由器上开启 Samba,每次编辑完项目就手动拷贝到路由器硬盘里,麻烦程度可想而知,后来又用了 Google Drive/One Drive,又因为它们的网络不理想,就又放弃使用了。其实就是很简单的需求,自动备份、速度快,然后去找了一下,发现一堆人推荐用 Rsync,这货我只在...

2019-02-07 23:10:25 31492 3

原创 5 个不为人知的 PDF 技巧

5 个不为人知的 PDF 技巧工作、学习中,我们都没少和 PDF 文档打交道。PDF能流行开来,功劳就在其兼容性好,本世纪的设备基本都能打开、打印时所见即所得、传给别人不用担心格式丢失或出错……以至于我和同事曾经调侃:简单说,PDF 就是一张图片不过,如果你想对 PDF 做一些超出「图片范畴」的操作,问题就接踵而至了。这篇文章里,就收集了 5 类疑难杂症,相信不少人都遇到过:PDF 边儿...

2019-02-07 23:09:39 1390

原创 Hexo + Github Pages博客搭建教程

前言一直以来自己都有书写文章的习惯,不管是收集资料还是表达自己的个人见解。最开始把资料都放在印象笔记里,但是印象笔记有个不好的点就是书写不方便,而且多设备登录不友好,需要升级账户。后来就搭建了一个WordPress站点,记录自己的点滴。慢慢的接触到了CSDN,也计划着在那里写博客。CSDN的编辑器有markdown版本,接触到了markdown就对其产生了好感。与此同时,我也将我的WordPre...

2019-02-07 23:08:22 401

原创 数据分组技术GroupBy

数据分组技术GroupBy数据概览其中包括四行:日期、城市、温度、风力。它的大小为20行。按列分组加入这里按照city这一列进行分组:g = df.groupby(df['city'])得到一个DataFrameGroupBy 类型的对象:&amp;lt;pandas.core.groupby.DataFrameGroupBy object at 0x10d45a128&amp;gt;查看分组...

2019-01-28 14:22:24 1167

原创 数据分箱技术Binning

数据分箱技术Binning数据分箱就是按照某种规则将数据进行分类。就像可以将水果按照大小进行分类,售卖不同的价格一样。对Series进行分箱创建一个整形随机的series,表示学生的成绩:import numpy as npimport pandas as pdfrom pandas import Series, DataFramescore_list = np.random.r...

2019-01-28 13:37:03 3871

原创 用户画像:标签化就是数据的抽象能力

王兴说过,我们已经进入到互联网的下半场。在上半场,也就是早期的互联网时代,你永远不知道在对面坐的是什么样的人。那个年代大部分人还是QQ的早期用户。在下半场,互联网公司已经不新鲜了,大部分公司已经互联网化。他们已经在用网络进行产品宣传,使用电商销售自己的商品。这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业,他们有数据,有用户。通过大数据告诉政府该如何智慧地管理交通,做城市规划。通...

2019-01-27 20:34:28 10100

原创 数据采集:如何自动化采集数据?

上一节中我们讲了如何对用户画像建模,而建模之前我们都要进行数据采集。数据采集是数据挖掘的基础,没有数据,挖掘也没有意义。很多时候,我们拥有多少数据源,多少数据量,以及数据质量如何,将决定我们挖掘产出的成果会怎样。举个例子,你做量化投资,基于大数据预测未来股票的波动,根据这个预测结果进行买卖。你当前能够拿到以往股票的所有历史数据,是否可以根据这些数据做出一个预测率高的数据分析系统呢?实际上,如...

2019-01-27 20:33:54 29671 3

原创 时间序列的操作

时间序列的操作一、时间序列基础import numpy as npimport pandas as pdfrom pandas import Series, DataFramefrom datetime import datetimet1 = datetime(2009,10,20) # 创建时间序列date_list = [ # 创建...

2019-01-27 18:38:22 1138

原创 通过去重进行数据清洗

通过去重进行数据清洗数据初始Seqno列去重查看Seqno列都有哪些值df['Seqno'].unique() # 查看唯一的值duplicated方法duplicated用于从上到下比较指定某一列的值,当这个值第一次出现时,返回False,当这个值和上一个比一样时,返回Truedf['Seqno'].duplicated()drop_duplicates去重复dr...

2019-01-27 17:03:40 1278

原创 Apply函数进行数据预处理

Apply函数进行数据预处理测试数据集:包含两列:时间戳和字符串,大小为近8000行在df中添加一列,使其全部都是a将A列改的值为大写df['A'] = df['A'].apply(str.upper)使用apply进行预处理将data数据拆分为三列Apply接收一个函数作为参数,apply将会把指定列中的每一个值送给函数参数进行处理。根据观察,data列的值其实是三个部分...

2019-01-27 16:36:42 549 1

原创 Pandas玩转数据

Pandas玩转数据一、排序功能0x1 Series的排序s1 = Series(np.random.randn(10)) s2 = s1.sort_values(ascending=False) # 按照值降序排列s2.sort_index() # 按照索引升序排列0x2 Dataframe的排序df1 = DataFrame(np.random.randn(40).r...

2019-01-27 15:58:58 190

原创 学数据分析要掌握哪些基本概念?

学数据分析要掌握哪些基本概念?美国明尼苏达州一家Target百货被客户投诉,这名客户指控Target将婴儿产品优惠券寄给他的女儿,而他女儿还是一名高中生。但没多久这名客户就来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。Target百货寄送婴儿产品优惠券绝非偶然之举,他们发现妇女在怀孕的情况下,购买的物品会发生变化,比如护手霜会从有香味的改成无味的,此外还会购买大量维生素等保健品。通过类似的...

2019-01-26 23:16:16 580

原创 Python科学计算:Pandas

今天我来给你介绍Python的另一个工具Pandas。在数据分析工作中,Pandas的使用频率是很高的,一方面是因为Pandas提供的基础数据结构DataFrame与json的契合度很高,转换起来就很方便。另一方面,如果我们日常的数据清理工作不是很复杂的话,你通常用几句Pandas代码就可以对数据进行规整。Pandas可以说是基于 NumPy 构建的含有更高级数据结构和分析能力的工具包。在Nu...

2019-01-26 23:13:25 492

原创 Python科学计算:用NumPy快速处理数据

Python科学计算:用NumPy快速处理数据Python中一个非常重要的第三方库就是NumPy。它不仅是Python中使用最多的第三方库,而且还是SciPy、Pandas等数据科学的基础库。它所提供的数据结构比Python自身的“更高级、更高效”,可以这么说,NumPy所提供的数据结构是Python数据分析的基础。我上次讲到了Python数组结构中的列表list,它实际上相当于一个数组的...

2019-01-26 22:13:52 750

原创 NumPy(axis=0 与axis=1)的区分

NumPy(axis=0 与axis=1)的区分df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"])df.mean(axis=1)当执行下面代码后,删掉的却是一列:df.drop("col4", axis=1)df.mean...

2019-01-26 20:42:03 1388

原创 Python基础语法:开始你的Python之旅

Python基础语法:开始你的Python之旅上一节课我跟你分享了数据挖掘的最佳学习路径,相信你对接下来的学习已经心中有数了。今天我们继续预习课,我会用三篇文章,分别对Python的基础语法、NumPy和Pandas进行讲解,带你快速入门Python语言。如果你已经有Python基础了,那先恭喜你已经掌握了这门简洁而高效的语言,这几节课你可以跳过,或者也可以当作复习,自己查漏补缺,你还可以在留...

2019-01-26 19:42:06 527 1

原创 学习数据挖掘的最佳路径是什么?

上一节中,我给你分享了数据分析的全景图,其中最关键的部分就是数据挖掘,那什么是数据挖掘呢?想象一下,茫茫的大海上,孤零零地屹立着钻井,想要从大海中开采出宝贵的石油。对于普通人来说,大海是很难感知的,就更不用说找到宝藏了。但对于熟练的石油开采人员来说,大海是有坐标的。他们对地质做勘探,分析地质构造,从而发现哪些地方更可能有石油。然后用开采工具,进行深度挖掘,直到打到石油为止。大海、地质信息、...

2019-01-26 18:19:20 469

转载 数据分析全景图及修炼指南

数据分析全景图及修炼指南数据分析在现代社会中有重要地位。掌握数据,就是掌握规律。当你了解了市场数据,对它进行分析,就可以得到市场规律。当你掌握了产品自身的数据,对它进行分析,就可以了解产品的用户来源、用户画像等等。所以说数据是个全新的视角。数据分析如此重要,它不仅是新时代的“数据结构+算法”,也更是企业争夺人才的高地。当我们谈论数据分析的时候,都在讲些什么呢?这里我可以把数据分析分成三个重要...

2019-01-26 17:58:11 1616 1

原创 Python数据科学常用库——Pandas

Python数据科学常用库——Pandas一、数据格式Series0x1 创建Seriesimport numpy as npimport pandas as pd s1 = pd.Series([1,2,3,4]) # 通过Python list创建 s2 = pd.Series(np.arange(10)) # 通过numpy array创建 s3 = pd.Seri...

2019-01-26 15:33:19 302

原创 Python数据科学常用库——Numpy

Python数据科学常用库——Numpy一、数组的创建与访问0x1 创建一维数组import numpy as np # create from python listlist_1 = [1, 2, 3, 4]array_1 = np.array(list_1)0x2 创建二维数组list_2 = [5, 6, 7, 8]array_2 = np.array([list_1, ...

2019-01-25 14:40:10 362 1

原创 MacOS上虚拟环境安装TensorFlow

MacOS上虚拟环境安装TensorFlow0x1 检查是否已经配置Python环境注意MacOS系统上只支持CPU的TensorFlow,而且对系统安装的Python版本有要求,仅支持以下Python版本。python3 --versionpip3 --versionvirtualenv --version如果已安装这些软件包,请跳至下一步。否则,请安装 Python、pip...

2019-01-24 12:21:56 576 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除