徐念安-CSDN博客

原创 Linux 之我最常用的20条命令

玩过Linux的人都会知道，Linux中的命令的确是非常多，但是玩过Linux的人也从来不会因为Linux的命令如此之多而烦恼，因为我们只需要掌握我们最常用的命令就可以了。当然你也可以在使用时去找一下man，他会帮你解决不少的问题。然而每个人玩Linux的目的都不同，所以他们常用的命令也就差异非常大，而我主要是用Linux进行C/C++和shell程序编写的，所以常用到的命令可以就会跟一个管理Li...

2019-09-18 15:20:58 531

原创 cryptogen tool not found.的解决方案

在执行./byfn.sh -m generate的时候可能会报错，cryptogen tool not found.网上一堆说法是执行curl -sSL https://goo.gl/eYdRbX | bash其实就是执行bootstrap.sh 但是那个网址已经失效了。肯定解决不了。其实在安装Hyperledger Fabric 的时候已经有这个文件了。路径在fabic/scripts...

2019-08-12 23:07:25 1627

原创解决Mac下废纸篓文件无法删除（错误代码-36）

解决Mac下废纸篓文件无法删除（错误代码-36）在回收站删除文件的时候发现，无法完成操作，不能读取写入。然后尝试在终端中删除文件，居然提示I/O错误。最后发现是MAC下关联NTFS硬盘导致-36。切换到Windows，用管理员模式打开PowerShell，在相应的磁盘中运行chkdsk修复磁盘就可以了。...

2019-08-06 19:59:58 10436

原创安卓中的三种Adapter适配器

安卓中的三种Adapter适配器适配器是一个非常重要的知识点，Adapter是用来帮助填出数据的中间桥梁。适配器将各种数据以合适的形式显示在View中给用户看。一、ArrayAdapter（数组适配器）有一定的局限性，只能显示一行文本数据0x1 基本使用实例(1)、采用Java控制显示内容布局文件：<?xml version="1.0" encoding="utf-8"?&gt...

2019-04-14 15:43:53 18585 5

原创重学Java之List

重学Java之List0、概述一个Java对象可以在内部持有若干其他Java対象，并对外提供访问接口,这种Java对象称为集合。Java的数组可以看作是一种集合有了数组为什么还需要其他集合类？数组初始化后大小不可变数组只能按索引顺序存取java.util提供了集合类，包括：Collection：集合类的根接口List：有序列表Set：无重复元素集合Map：通过Ke...

2019-02-18 20:29:56 272

原创 Python实用脚本实践

Python实用脚本实践一、文件相关查找文件import ospath = 'xxx'files = os.listdir(path)for f in files: if f.endswith('.png') and 'fish' in f: print('I found this' + f)分类文件根据后缀名将文件分类至不同文件夹import shu...

2019-02-17 11:10:24 3097

原创重学Java之核心类

重学Java之核心类一、StringJava字符串的特点：字符串对象可以直接使用"…"表示内容不可变使用equals()判断是否相等字符串常用操作：是否包含子串int containsint indexOf/lastIndexOfboolean startsWith/endsWith去除首尾空白字符trim()移除首尾空白字符空格、\t、\r、\n不改变...

2019-02-16 15:44:42 233

原创一次学会Python数据可视化的10种技能

一次学会Python数据可视化的10种技能如果你想要用Python进行数据分析，就需要在项目初期开始进行探索性的数据分析，这样方便你对数据有一定的了解。其中最直观的就是采用数据可视化技术，这样，数据不仅一目了然，而且更容易被解读。同样在数据分析得到结果之后，我们还需要用到可视化技术，把最终的结果呈现出来。可视化视图都有哪些？按照数据之间的关系，我们可以把可视化视图划分为4类，它们分别是比较...

2019-02-12 16:25:25 1265 2

原创 Python爬虫：自动化下载海报

Python爬虫：如何自动化下载海报？上一讲中我给你讲了如何使用八爪鱼采集数据，对于数据采集刚刚入门的人来说，像八爪鱼这种可视化的采集是一种非常好的方式。它最大的优点就是上手速度快，当然也存在一些问题，比如运行速度慢、可控性差等。相比之下，爬虫可以很好地避免这些问题，今天我来分享下如何通过编写爬虫抓取数据。爬虫的流程相信你对“爬虫”这个词已经非常熟悉了，爬虫实际上是用浏览器访问的方式模拟了...

2019-02-12 14:50:42 1256

原创数据分析可视化复现

import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")df = pd.read_csv("./data/HR.csv")df = df[df["last_eva...

2019-02-12 12:30:38 461

原创 Seaborn强大的调色功能

Seaborn强大的调色功能使用matplotlib绘图def sinplot(): x = np.linspace(0,14,100) plt.figure(figsize=(8,6)) for i in range(4): plt.plot(x, np.sin(x+i)*(i+0.75), label='sin(x+%s)*(%s+0.75)'% (...

2019-02-11 19:52:48 784 1

原创 Seaborn设置图形显示的效果

Seaborn设置图形显示的效果绘制三角函数x = np.linspace(0,14,100)y1 = np.sin(x)y2 = np.sin(x+2)*1.25def sinplot() plt.plot(x,y1) plt.plot(x,y2) plt.show()使用matplotlib绘图的效果使用seaborn绘图设置显示主题seabo...

2019-02-11 18:07:00 1587

原创 Seaborn

Seaborn一、Seaborn和Matplotlib对比Seaborn是matplotlib的强大的一个扩展。一个例子要求画出花萼和花瓣的长度的散点图，并且颜色要区分花的种类花的品种一共三种：根据花的种类定义好每种花的颜色color_map = dict(zip(iris.Name.unique(), ['blue','green','red']))使用matplotlib...

2019-02-11 17:29:35 23410 2

原创直方图和密度图

直方图和密度图一、直方图直方图反映的是一组数据的分布情况0x1 绘制直方图hist方法可以用来绘制直方图，为了使图像更清晰，可以指定每个柱间宽度：s = Series(np.random.randn(1000))plt.hist(s)plt.hist(s,rwidth=0.9)直方图反应的是分布情况，为了加深这一理解，可以看如下实验：反映了每个值出现的次数0x2 指...

2019-02-11 15:14:31 8411

原创 Pandas绘图之Series和Dataframe

Pandas绘图之Series和Dataframe一、Series绘图0x1生成数据并画图首先生成一个series数据：import numpy as npimport pandas as pdfrom pandas import Seriesimport matplotlib.pyplot as plts1 = Series(np.random.randn(10)).cumsum...

2019-02-11 15:13:53 1125

原创 Subplot和Subplots绘制子图

Subplot和Subplots绘制子图plot可以绘出精美的图形，但是如果想要在一张图中展示多个子图，plot就很难办了。matplotlib提供了subplot来解决这一问题。（其实很像matlab中的绘图方法）Subplot绘图方法首先利用之前plot的方法，在一个人图中绘制两个曲线：import numpy as npimport matplotlib.pyplot as pl...

2019-02-11 14:00:00 3747

原创一条命令搞定黑苹果双系统时差

安装黑苹果和Win10双系统的时候，重启进入Win10就会发现时间不对了。在Mac端输入下面的代码修复该问题。sudo sh -c "$(curl -kfsSL https://raw.githubusercontent.com/hieplpvip/LocalTime-Toggle/master/fix_time_osx.sh)"输入当前用户密码然后回车重启即可...

2019-02-10 17:47:23 11607 3

原创 Markdown文本中图片的整体迁移

问题复现在markdown软件中写作时，为了使图片在所有平台都可以访问，必须要一个图床。插入图片时可以先通过iPic或者PicGO等图床软件进行转换，但是每次插图的时候都需要进行一次上传图片在粘贴markdown代码的操作，有点不方便，尤其是文章要插入很多图片的时候。还有一个情况就是，比如在有一篇好文章你想把它保存为markdown，但是文章采用了防盗链功能，直接转换图片地址就有点行不通。那...

2019-02-09 21:38:12 2918 3

原创 Hexo主题casper使用教程

Hexo主题casper使用教程我看到的一个好的主题，对其中的部分代码进行了修改。原项目地址 https://github.com/xzhih/hexo-theme-casperDEMO https://blog.geekmubai.com特性文章封面图（在首页文章摘要上显示）文章特色图（在文章详细页面上置顶）自定义菜单自定义 favicon, logo, 头部背景, 作者头像...

2019-02-07 23:11:11 1466

原创 Syncthing就是我要的同步备份软件

Syncthing就是我要的同步备份软件引言数据无价，平时不注意备份，电脑突然翻车就追悔莫及啦。最开始的时候，我在路由器上开启 Samba，每次编辑完项目就手动拷贝到路由器硬盘里，麻烦程度可想而知，后来又用了 Google Drive/One Drive，又因为它们的网络不理想，就又放弃使用了。其实就是很简单的需求，自动备份、速度快，然后去找了一下，发现一堆人推荐用 Rsync，这货我只在...

2019-02-07 23:10:25 31492 3

原创 5 个不为人知的 PDF 技巧

5 个不为人知的 PDF 技巧工作、学习中，我们都没少和 PDF 文档打交道。PDF能流行开来，功劳就在其兼容性好，本世纪的设备基本都能打开、打印时所见即所得、传给别人不用担心格式丢失或出错……以至于我和同事曾经调侃：简单说，PDF 就是一张图片不过，如果你想对 PDF 做一些超出「图片范畴」的操作，问题就接踵而至了。这篇文章里，就收集了 5 类疑难杂症，相信不少人都遇到过：PDF 边儿...

2019-02-07 23:09:39 1390

原创 Hexo + Github Pages博客搭建教程

前言一直以来自己都有书写文章的习惯，不管是收集资料还是表达自己的个人见解。最开始把资料都放在印象笔记里，但是印象笔记有个不好的点就是书写不方便，而且多设备登录不友好，需要升级账户。后来就搭建了一个WordPress站点，记录自己的点滴。慢慢的接触到了CSDN，也计划着在那里写博客。CSDN的编辑器有markdown版本，接触到了markdown就对其产生了好感。与此同时，我也将我的WordPre...

2019-02-07 23:08:22 401

原创数据分组技术GroupBy

数据分组技术GroupBy数据概览其中包括四行：日期、城市、温度、风力。它的大小为20行。按列分组加入这里按照city这一列进行分组：g = df.groupby(df['city'])得到一个DataFrameGroupBy 类型的对象：&lt;pandas.core.groupby.DataFrameGroupBy object at 0x10d45a128&gt;查看分组...

2019-01-28 14:22:24 1167

原创数据分箱技术Binning

数据分箱技术Binning数据分箱就是按照某种规则将数据进行分类。就像可以将水果按照大小进行分类，售卖不同的价格一样。对Series进行分箱创建一个整形随机的series，表示学生的成绩：import numpy as npimport pandas as pdfrom pandas import Series, DataFramescore_list = np.random.r...

2019-01-28 13:37:03 3871

原创用户画像：标签化就是数据的抽象能力

王兴说过，我们已经进入到互联网的下半场。在上半场，也就是早期的互联网时代，你永远不知道在对面坐的是什么样的人。那个年代大部分人还是QQ的早期用户。在下半场，互联网公司已经不新鲜了，大部分公司已经互联网化。他们已经在用网络进行产品宣传，使用电商销售自己的商品。这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业，他们有数据，有用户。通过大数据告诉政府该如何智慧地管理交通，做城市规划。通...

2019-01-27 20:34:28 10100

原创数据采集：如何自动化采集数据？

上一节中我们讲了如何对用户画像建模，而建模之前我们都要进行数据采集。数据采集是数据挖掘的基础，没有数据，挖掘也没有意义。很多时候，我们拥有多少数据源，多少数据量，以及数据质量如何，将决定我们挖掘产出的成果会怎样。举个例子，你做量化投资，基于大数据预测未来股票的波动，根据这个预测结果进行买卖。你当前能够拿到以往股票的所有历史数据，是否可以根据这些数据做出一个预测率高的数据分析系统呢？实际上，如...

2019-01-27 20:33:54 29671 3

原创时间序列的操作

时间序列的操作一、时间序列基础import numpy as npimport pandas as pdfrom pandas import Series, DataFramefrom datetime import datetimet1 = datetime(2009,10,20) # 创建时间序列date_list = [ # 创建...

2019-01-27 18:38:22 1138

原创通过去重进行数据清洗

通过去重进行数据清洗数据初始Seqno列去重查看Seqno列都有哪些值df['Seqno'].unique() # 查看唯一的值duplicated方法duplicated用于从上到下比较指定某一列的值，当这个值第一次出现时，返回False，当这个值和上一个比一样时，返回Truedf['Seqno'].duplicated()drop_duplicates去重复dr...

2019-01-27 17:03:40 1278

原创 Apply函数进行数据预处理

Apply函数进行数据预处理测试数据集：包含两列：时间戳和字符串，大小为近8000行在df中添加一列，使其全部都是a将A列改的值为大写df['A'] = df['A'].apply(str.upper)使用apply进行预处理将data数据拆分为三列Apply接收一个函数作为参数，apply将会把指定列中的每一个值送给函数参数进行处理。根据观察，data列的值其实是三个部分...

2019-01-27 16:36:42 549 1

原创 Pandas玩转数据

Pandas玩转数据一、排序功能0x1 Series的排序s1 = Series(np.random.randn(10)) s2 = s1.sort_values(ascending=False) # 按照值降序排列s2.sort_index() # 按照索引升序排列0x2 Dataframe的排序df1 = DataFrame(np.random.randn(40).r...

2019-01-27 15:58:58 190

原创学数据分析要掌握哪些基本概念？

学数据分析要掌握哪些基本概念？美国明尼苏达州一家Target百货被客户投诉，这名客户指控Target将婴儿产品优惠券寄给他的女儿，而他女儿还是一名高中生。但没多久这名客户就来电道歉，因为女儿经他逼问后坦承自己真的怀孕了。Target百货寄送婴儿产品优惠券绝非偶然之举，他们发现妇女在怀孕的情况下，购买的物品会发生变化，比如护手霜会从有香味的改成无味的，此外还会购买大量维生素等保健品。通过类似的...

2019-01-26 23:16:16 580

原创 Python科学计算：Pandas

今天我来给你介绍Python的另一个工具Pandas。在数据分析工作中，Pandas的使用频率是很高的，一方面是因为Pandas提供的基础数据结构DataFrame与json的契合度很高，转换起来就很方便。另一方面，如果我们日常的数据清理工作不是很复杂的话，你通常用几句Pandas代码就可以对数据进行规整。Pandas可以说是基于 NumPy 构建的含有更高级数据结构和分析能力的工具包。在Nu...

2019-01-26 23:13:25 492

原创 Python科学计算：用NumPy快速处理数据

Python科学计算：用NumPy快速处理数据Python中一个非常重要的第三方库就是NumPy。它不仅是Python中使用最多的第三方库，而且还是SciPy、Pandas等数据科学的基础库。它所提供的数据结构比Python自身的“更高级、更高效”，可以这么说，NumPy所提供的数据结构是Python数据分析的基础。我上次讲到了Python数组结构中的列表list，它实际上相当于一个数组的...

2019-01-26 22:13:52 750

原创 NumPy（axis=0 与axis=1）的区分

NumPy（axis=0 与axis=1）的区分df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"])df.mean(axis=1)当执行下面代码后，删掉的却是一列：df.drop("col4", axis=1)df.mean...

2019-01-26 20:42:03 1388

原创 Python基础语法：开始你的Python之旅

Python基础语法：开始你的Python之旅上一节课我跟你分享了数据挖掘的最佳学习路径，相信你对接下来的学习已经心中有数了。今天我们继续预习课，我会用三篇文章，分别对Python的基础语法、NumPy和Pandas进行讲解，带你快速入门Python语言。如果你已经有Python基础了，那先恭喜你已经掌握了这门简洁而高效的语言，这几节课你可以跳过，或者也可以当作复习，自己查漏补缺，你还可以在留...

2019-01-26 19:42:06 527 1

原创学习数据挖掘的最佳路径是什么？

上一节中，我给你分享了数据分析的全景图，其中最关键的部分就是数据挖掘，那什么是数据挖掘呢？想象一下，茫茫的大海上，孤零零地屹立着钻井，想要从大海中开采出宝贵的石油。对于普通人来说，大海是很难感知的，就更不用说找到宝藏了。但对于熟练的石油开采人员来说，大海是有坐标的。他们对地质做勘探，分析地质构造，从而发现哪些地方更可能有石油。然后用开采工具，进行深度挖掘，直到打到石油为止。大海、地质信息、...

2019-01-26 18:19:20 469

转载数据分析全景图及修炼指南

数据分析全景图及修炼指南数据分析在现代社会中有重要地位。掌握数据，就是掌握规律。当你了解了市场数据，对它进行分析，就可以得到市场规律。当你掌握了产品自身的数据，对它进行分析，就可以了解产品的用户来源、用户画像等等。所以说数据是个全新的视角。数据分析如此重要，它不仅是新时代的“数据结构+算法”，也更是企业争夺人才的高地。当我们谈论数据分析的时候，都在讲些什么呢？这里我可以把数据分析分成三个重要...

2019-01-26 17:58:11 1616 1

原创 Python数据科学常用库——Pandas

Python数据科学常用库——Pandas一、数据格式Series0x1 创建Seriesimport numpy as npimport pandas as pd s1 = pd.Series([1,2,3,4]) # 通过Python list创建 s2 = pd.Series(np.arange(10)) # 通过numpy array创建 s3 = pd.Seri...

2019-01-26 15:33:19 302

原创 Python数据科学常用库——Numpy

Python数据科学常用库——Numpy一、数组的创建与访问0x1 创建一维数组import numpy as np # create from python listlist_1 = [1, 2, 3, 4]array_1 = np.array(list_1)0x2 创建二维数组list_2 = [5, 6, 7, 8]array_2 = np.array([list_1, ...

2019-01-25 14:40:10 362 1

原创 MacOS上虚拟环境安装TensorFlow

MacOS上虚拟环境安装TensorFlow0x1 检查是否已经配置Python环境注意MacOS系统上只支持CPU的TensorFlow，而且对系统安装的Python版本有要求，仅支持以下Python版本。python3 --versionpip3 --versionvirtualenv --version如果已安装这些软件包，请跳至下一步。否则，请安装 Python、pip...

2019-01-24 12:21:56 576 1

空空如也

空空如也