- 博客(21)
- 收藏
- 关注
原创 数据不求人-用Faker随机库生成数据
from faker import Faker#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"fake = Faker("zh_CN")生成个人信息# 生成姓名fake.name()# 女性姓名fa...
2020-04-30 16:06:00
1343
原创 pandas数据处理120题
1.DataFrame基本操作import numpy as npimport pandas as pdimport matplotlib.pyplot as plt1.将下面的字典创建为DataFramedata = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"], "score":[1,...
2020-04-24 23:11:34
4023
2
原创 mysql学生表经典案例50题
一、建库、建表create database alibaba;use alibaba;– 建表create table student(s_id varchar(10),s_name varchar(10),s_age date,s_sex varchar(10)) engine=InnoDB default charset utf8;insert into student(s_id,s...
2020-04-03 19:09:16
3388
原创 ds案例
市场规模市场容量分析是对行业规模的分析判断import pandas as pdimport numpy as npimport warningswarnings.filterwarnings("ignore")导入数据path1 = '驱虫剂市场/'#电蚊香套装市场近三年交易额dwx=pd.read_excel(path1+'电蚊香套装市场近三年交易额.xlsx')#防霉防蛀...
2020-03-23 10:43:39
1386
原创 sklearn常用机器学习算法参数详解
线性回归from sklearn.linear_model import LinearRegressionLinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1)参数含义:1.fit_intercept:布尔值,指定是否需要计算线性回归中的截距,即b值。如果为False,那么不计算b值。2.nor...
2020-03-21 18:21:14
4994
4
原创 Linux命令自习随笔记录
一、系统基本命令halt 关闭系统poweroff 关闭系统init 0 关闭系统init 1 单用户模式,只root用户进行维护init 2 多用户模式,不能使用NFSinit 3 完全多用户模式init 4 安全模式init 5 图形化界面init 6 重启shutdown -r now 重启shutdown -r +10 十分钟后重启shutdown -h...
2020-03-15 10:49:44
144
原创 新冠肺炎新增数据南丁格尔玫瑰图
南丁格尔玫瑰图(新冠肺炎新增数据可视化)import pandas as pdfrom pyecharts.charts import Piefrom pyecharts import options as opts数据#省份provinces = ['北京','上海','黑龙江','吉林','辽宁','内蒙古','新疆','西藏','青海','四川','云南','陕西','重庆',...
2020-03-14 12:21:51
2277
原创 KDD CUP 99利用决策分类树进行网络异常检测
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt数据导入与数据探索数据导入df=pd.read_csv('train_data.csv',header=None)col_name = [ 'duration','protocol_type','service','flag','src_byt...
2020-03-03 22:56:51
17404
5
原创 谷歌浏览器下载地址及chromedriver下载地址
分享一个下载谷歌Chrome浏览器的网站包含各个历史版本:https://www.chromedownloads.net/谷歌浏览器driver下载地址:chromdriver仓库:http://chromedriver.storage.googleapis.com/index.html官方Chrome driver的网站镜像:http://npm.taobao.org/mirrors/c...
2020-03-02 23:49:54
9742
原创 Titanic练习
导入数据、查看数据基本信息、数据的简单探索import numpy as npimport pandas as pd导入数据data = pd.read_csv('Titanic.csv')data.head() PassengerId Survived Pclass Name Sex ...
2019-12-28 21:19:38
296
原创 python之map函数的使用
map(func, *iterables) --> map objectmap函数对可遍历对象中的每个值进行相同的func操作,最终得到一个结果序列(map 对象)但是生成的结果序列不会把全部结果显示出来,要想显示出全部结果,可以用list方法展现,或者用解包、遍历等方法展现。当seq只有一个时当seq只有一个时,将函数func作用于这个seq的每个元素上,并得到一个新的seq...
2019-12-22 13:52:52
882
原创 MYSQL存储过程
create database proce;use proce;create table test(a int);select * from test;-- t1、创建查询test表的存储过程delimiter //create procedure t1()begin select * from test;end //delimiter ;call t1();dr...
2019-11-19 20:33:05
167
原创 Excel表格中实现IP地址排序
需要插入辅助列,用辅助列来进行排序,公式如下:=TRIM(TEXT(LEFT(SUBSTITUTE(A1,".",REPT(" ",99)),100),"000")&TEXT(MID(SUBSTITUTE(A1,".",REPT(" ",99)),100,100),"000")&TEXT(MID(SUBSTITUTE(A1,".",
2019-01-16 13:16:21
7487
2
原创 正则表达式常见元字符
正则表达式(Regular Expression)正则表达式 REGEXP:是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。元字符 \:转义字符 x|y:匹配x或y 匹配次数 *:匹配其前面子表达式任意次;等价于{0,} +...
2018-12-10 23:19:55
332
原创 Xshell 无法连接到虚拟机下的Ubuntu
新在虚拟机上装的Ubantu,查看IP,提示如下:Command 'ifconfig' not found, but can be installed with:apt install net-tools按照上面要求执行 apt install net-tools提示如下:E: Could not get lock /var/lib/dpkg/lock - open...
2018-12-02 23:57:48
297
原创 Linux通配符
*:任意长度的任意字符?:任意单个字符[]:匹配值定范围内的任意单个字符eg:[0-9] [a-z] [A-Z] [a-g] [a-zA-Z][0-9a-zA-Z][:space:]空白字符[:punct:]标点符号[:lower:]小写字母[:upper:]大写字母[:alpha:]大小写字母[:digit:]数字[:alnum:]数字和大小写[^]:匹配指定范围外的任意单...
2018-11-22 23:56:13
177
原创 Linux的主要目录
/bin: binary的缩写,存放着使用者最经常使用的命令,如ls,cp,cat等;/boot:存放着启动Linux时使用的一些核心文件;/dev:device的缩写,这个目录是Linux的外部设备,其功能类似Dos下的.sys和Win下的.vxd。在Linux中设备和文档是用同种方法访问的,例如:/dev/hda代表第一个物理IDE硬盘;/etc:用来存放任何系统管理所需要的配置文档和...
2018-11-20 22:29:48
207
原创 Git使用
Git使用笔记Git安装 略Git库版本库创建1、创建一个空目录(该目录即为该版本库的文件地址)2、在该目录下运行 git init 进行版本库的初始化添加文件到Git库1、git add <file> 可多次使用,添加多个文件;2、git commit -m " 修改备注“ 完成添加文件到Git库版本回退及切换git log 用于显示从最近到最远的提交日志及...
2018-11-19 22:12:15
126
原创 Hive安装出现的错误
学习hive过程中,安装完成后第一次启动有如下错误:1、WARN conf.HiveConf: HiveConf of name hive.metastore.local does not exist原因: 0.11或者之后的HIVE版本 hive.metastore.local 属性不再使用。而我安装的版本是1.2.1的,难怪会警告了。解决方法:在hive-site.xml中删除这一项就好了&l...
2018-03-22 20:17:52
789
原创 启动Hbase后Hmaster节点挂掉的几个原因
学习HBase过程中,在安装Hbase后,会出现Hmaster节点在几秒种后会突然挂掉,有可能是以下原因: 1.时钟不同步 2.zookeeper出问题了 3.hdfs和hbase配置的端口不匹配 hdfs core-site.xml hdfs://master hbase-rootdir hdfs://master:9000/hbase
2017-10-18 19:57:44
9625
2
原创 安装HBase出现的问题
1、问题描述:启动HBase后用Hadoop fs -ls /hbase,提示找不到该目录原因:hbase-site.xml文件配置错误 hbase.rootdir hdfs://master:9000/hbase解决方法:关闭Hbase,修改好配置文件后,重启Hbase,再次查看就会有该目录啦!
2017-10-17 19:06:04
1264
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人