cc抱富
码龄7年
关注
提问 私信
  • 博客:191,887
    191,887
    总访问量
  • 74
    原创
  • 1,899,657
    排名
  • 115
    粉丝
  • 0
    铁粉

个人简介:天下熙熙,皆为利来;天下攘攘,皆为利往

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2017-09-28
博客简介:

抱富的博客

博客描述:
愿你自律如日出日落
查看详细资料
个人成就
  • 获得93次点赞
  • 内容获得24次评论
  • 获得533次收藏
  • 代码片获得573次分享
创作历程
  • 2篇
    2021年
  • 51篇
    2020年
  • 25篇
    2019年
成就勋章
TA的专栏
  • hive
    9篇
  • 网络
    3篇
  • 数据分析-统计方法论
    6篇
  • python
    20篇
  • Pandas
    12篇
  • 语法
    22篇
  • 代码
    5篇
  • 深度学习
    1篇
  • 数据分析之行业案例分析
    1篇
  • Tableau
    1篇
  • MySQL
    5篇
  • hadoop
    7篇
  • VMware
    1篇
兴趣领域 设置
  • 人工智能
    机器学习数据分析
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hue如何上传本地excel到hive

1、处理本地数据将excel转为csv格式,并将列名删除,只保留数据2、在HDFS上创建文件夹,并上传本地数据3、在hive中建表CREATE EXTERNAL TABLE `abc.info`( `a` string COMMENT 'ID', `b` string COMMENT '名称', `c` string COMMENT '需求' )row format delimited fields terminated by ',' stored as textfi
原创
发布博客 2021.09.27 ·
1511 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

3GPP协议文档下载网址

3GPP查询/下载网址:https://www.3gpp.org/dynareport/SpecList.htm?release=Rel-15&tech=4&ts=1&tr=11、选择技术类型:5G/4G ,发行版本2、可通过检索关键字,查找涉及的协议3、知道目标协议编号的前提下,直接下载。如在主页选择23.501,点击目标版本即可完成下载...
原创
发布博客 2021.03.04 ·
1581 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

统计分析方法论-----逻辑回归

1、逻辑回归模型1.1逻辑回归含义逻辑回归其实是一个分类算法,用于对样本数据进行分类的场景1.2、逻辑回归算法模型分类的依据为计算一个阈值,超过为A类,未超过为B类。逻辑回归的算法模型,与线性回归类似模型的理解:如2个参数即因变量x1和x2,那么阈值(决策边界的线)就是w1x1+w2x2+b=0这条直线(x1作为x轴,x2作为y轴,以此将平面分为2块,w1x1+w2x2+b结果即z大于0的部分为A类,z小于0的部分为B类)1.3、sigmoid函数理解sigmoid函数把z值(﹣
原创
发布博客 2020.12.17 ·
836 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

PYTHON中join的使用方法,应用于改变DataFrame某列的格式

PYTHON中join的使用方法:将序列中的元素以指定的字符连接生成一个新的字符串。可连接的序列包括:字符串,列表,集合,元祖,字典应用:对于DataFrame,取出某列后,利用apply函数分别对每行进行join1、连接的序列为列表如name列目前为列表方式存储,需要将每个列表中的名字使用空格间隔开,而不是逗号df1=pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'name':[["zho","ds"],["def","
原创
发布博客 2020.12.08 ·
655 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

python在列表和集合中查找数据的区别(时间复杂度)

列表数据有序,可重复,查找某个元素方式为逐个遍历;时间复杂度为列表的长度,即从第一个元素遍历到最后一个元素为止,O(len(list))集合数据无序,不可重复,查找某个元素方式为哈希。即某个元素通过哈希计算,他的位置永远固定(顺序却不按输入元素顺序,解释了为什么集合无序),查询时通过哈希即可一次找到该元素。时间复杂度为O(1)总结,对于大量数据,集合效率极高#1、创建空表方式a=list()b=set()#2、查找某个元素list1=['haha','heihei','neinei.
原创
发布博客 2020.11.01 ·
3397 阅读 ·
2 点赞 ·
0 评论 ·
6 收藏

tcpdump抓包通过IP或端口过滤抓包方法

1.通过ip过滤抓包方法tcpdump -i any -s 0 -w 100.pcap net 172.16.1.139 or 172.16.1.1592.通过端口过滤抓包方法tcpdump sctp or udp port 2123 or udp portrange 10000-11000 -i any -s 0 -w 01.pcap
原创
发布博客 2020.10.21 ·
14467 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

交换机镜像操作配置方法

发布资源 2020.10.21 ·
pdf

利用LSTM长短期记忆算法分析猪肉价格未来走势

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom keras.models import Sequentialfrom keras.layers.core import Dense, Activation, Dropoutfrom keras.layers.recurrent import LSTMfrom sklearn.preprocessing import MinMaxScalerfrom
原创
发布博客 2020.09.06 ·
1890 阅读 ·
6 点赞 ·
7 评论 ·
42 收藏

行业案例分析1------------经营分析报告方法

1、七问法5W2H:why(何因)、what(何事)、who(何人)、when(何时)、where(何地)、how(如何做)、how much(何价)
原创
发布博客 2020.08.30 ·
1233 阅读 ·
1 点赞 ·
0 评论 ·
12 收藏

2020年基于anaconda安装TensorFlow注意不要使用清华园的镜像了!!!

pip --default-timeout=1000000 install -U -i https://pypi.doubanio.com/simple/ --upgrade tensorflow-gpu==2.3.0 这样还可以防止超时,还是指定版本conda config --add channels https://pypi.doubanio.com/simple/ --upgrade tensorflow-gpu==2.3.0按enter(%%这句指定了清华镜像下载资源路径)再输入:co
原创
发布博客 2020.08.09 ·
3072 阅读 ·
7 点赞 ·
0 评论 ·
11 收藏

数据挖掘算法之-----KNN算法

1、KNN概念KNN算法:K-Nearest Neighbor,K近邻算法,即K个最近的邻居(近朱者赤近墨者黑)KNN即可用于分类,也可用于回归分类预测时,使用K个邻居中,类别数量(或加权后)作为预测的结果回归预测时,使用K个邻居的均值(或加权后),最为预测结果2、超参数概念超参数:人为指定,超参数不同对模型效果影响很大2.1、K值K值大,容错性增加,敏感性降低,易导致欠拟合K值小,容错性降低,敏感性增加,易导致过拟合极端情况,使用整个样本数量作为K值,那么无论预测值在哪,结果都
原创
发布博客 2020.07.19 ·
1370 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

Python enumerate() 函数用于for循环

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。Python 2.3. 以上版本可用,2.6 添加 start 参数。遍历列表,并得到索引,索引值从0开始x=['d','e','f']for i,j in enumerate(x): print(i,j)结果0 d1 e2 f配合笛卡尔积使用for循环,相当于双层for循环笛卡尔积用于遍历很好用a=['g','h']b=[
原创
发布博客 2020.07.15 ·
1085 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

Python3.6及以后版本,格式化输出使用f‘a与b的和为{a+b}‘

int计算a=1b=2print(f'A+B={a+b}')结果A+B=3字符串显示name='xiaoming'print(f"他的名字是:{name}")结果他的名字是:xiaoming说明:{}内的会进行格式化输出,无论是int计算,还是字符串格式显示。相对于“{} {}”.format(“hello”, “world”)方式更加简化...
原创
发布博客 2020.07.15 ·
1023 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

数据分析理论流程AQI.xmind

发布资源 2020.07.11 ·
xmind

sklearn评价指标——回归模型评估及分类模型评估使用的库、ROC曲线理解

1、线性回归评价指标#MSE均方误差from sklearn.metrics import mean_squared_error#MAEXfrom sklearn.metrics import mean_absolute_error#R^2决定系数from sklearn.metrics import r2_score2、分类指标:混淆矩阵confusion_matrix(y_true, y_pred, labels=None, sample_weight=None):通过计算混淆矩
原创
发布博客 2020.07.08 ·
3687 阅读 ·
4 点赞 ·
0 评论 ·
29 收藏

numpy数组如何通过逻辑判断(不相关的数组)取出目标元素,举例X=X[y!=0]

前提:是数组,即查询的type结果为numpy.ndarray。列表不行X和y赋值,X的行数需要同y元素个数相同X = np.arange(0,32).reshape(8,4)print(type(X))print(X)y=np.arange(0,8)print(y)结果<class 'numpy.ndarray'>[[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11] [12 13 14 15] [16 17 18 19] [20 2
原创
发布博客 2020.07.07 ·
821 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

统计学方法论-----线性回归

np.random.seed(3)#所有的随机数都是伪随机,种子相同,随机数就相同random_state 随机种子train_test_split(X,y,test_size=0.25,random_state=0),其中random_state用于打乱样本顺序,设置为0为了排除在调整超参数建立模型的时候,顺序对模型的影响线性回归的结果为了损失最小(∑(实际y-预测y))bais:偏置weight:权重...
原创
发布博客 2020.07.05 ·
1115 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

统计学方法论2---------推断统计分析:通过样本推断总体

1、概述总体、个体、样本2、点估计和区间估计2.1、点估计2.2、区间估计置信度:总体参数有多大的概率位于置信区间置信区间:
原创
发布博客 2020.07.04 ·
9316 阅读 ·
2 点赞 ·
1 评论 ·
17 收藏

详细说明如何在pycharm不联网的情况下,离线安装第三方库及依赖包(如sklearn)

单独
原创
发布博客 2020.07.04 ·
20818 阅读 ·
11 点赞 ·
7 评论 ·
73 收藏

统计学方法论1---------描述性统计分析

1、相关概念数理统计:以概率论为基础,研究大量随机现象的统计规律性。描述统计推断统计描述性统计:从总体数据中提取变量的主要信息(总和,均值等),从总体层面上,对数据进行统计性描述2、统计量2.1、频数与频率导入相关模块import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.datasets import load_irisimp
原创
发布博客 2020.07.02 ·
1555 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏
加载更多