自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 数据分析 numpy基础(三)

1. 合并数据堆叠合并数据横向堆叠,将两个表在x轴向拼接在一起:pd.concat(objs,axis=0,join='outer',join_axes=none,ignore_index='false'参数名称 说明 objs 接受多个series,dataframe,panel组合,表示参与的组合 axis 连接的轴向,axis=0纵向拼接,a...

2019-09-24 21:40:54 167

原创 数据分析 pandas(二)

转换与处理时间序列对时间类型的数据分析的前提就是将原本为字符串的时间转换为标准时间类名称 说明 Timestamp 表示某个时间点 period 表示单个时间跨度,某个时间段 Timedelta 不同的单位时间,而非具体的某个时间 Datetimeindex 一组timestamp构成的index,可以用来作为series或者dataframe...

2019-09-24 19:18:39 148

原创 数据分析 pandas基础

Dataframe基础一、基础属性函数 返回值 函数 返回值 values 元素 index 索引 columns 列名 dtypes 类型 size 元素个数 ndim 维度数 shape 数据形状 二、查改增删dataframe数据1.查看数据根据定义可知df是...

2019-09-24 16:49:11 113

原创 matplotlib数据可视化基础

pyplot基础语法1.创建画布和创建子图plt.figure创建一个空白画布可以指定画布大小,像素figure.add_subplot创建并选中子图,可以指定子图的行数,列数与选中图片编号2.添加画布内容*添加图例要在绘图之后函数名 函数作用 plt.title 添加标题 plt.xlabel 添加x轴名称 plt.ylabel 添加...

2019-09-24 12:07:33 174

原创 数据分析 numpy基础(二)

1创建matr1=np.mat("1 2 3;4 5 6;7 8 9")#用mat函数创建矩阵matr2=np.matrix([[1,2,3],[4,5,6],[7,8,9]])#用matrix函数创建矩阵np.bmat("arr1 arr2;arr1 arr2")#用bmat函数合成矩阵Numpy矩阵矩阵相乘:matr1*matr2矩阵元素相乘:np.multiply(ma...

2019-09-24 10:26:39 244

原创 数据分析 numpy基础(一)

1.数组属性ndarray(数组)是储存单一数据类型的多维数组属性 说明 ndim 返回int。表示数组的维数 shape 返回tuple。表示数组的尺寸,(n,m) size 返回int。表示数组元素总数,等于shape的乘积 dtype 返回data-type.描述数组元素的类型 itemsize ...

2019-09-23 22:19:41 331

原创 爬虫学习 文件储存

1.TXT文本储存1.写法:with open('name.text','a',encoding='utf-8') as file: file.write(str) 2.常用的打开方式w 以写入的方式打开一个文件。如果文件已存在则将其覆盖,不存在则创建新文件 w+ 以读写的方式打开一个文件,如果该文件已存在,则将其覆盖。如果文件不...

2019-09-21 17:13:39 120

原创 爬虫练习 用beautifulsoup 爬取猫眼top100

import requestsfrom bs4 import BeautifulSoup as bsheaders={'User-Agent':'Mozilla/5.0 (Windows NT 6.1;Win64;x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/55.0.2883.87 Safari/537.36'}for i in r...

2019-09-21 11:25:42 607

原创 网络爬虫 学习日志(四)

Task4(2天)**4.1 ** 实战大项目 实战大项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容。 丁香园论坛:http://www.dxy.cn/bbs/thread/626626#626626。 参考资料:https://blog.csdn.net/nao77/article/details/88316754 import re...

2019-05-19 21:28:49 225

原创 网络爬虫 学习日志(三)

3.1 安装selenium并学习 安装selenium并学习。 使用selenium模拟登陆163邮箱。 163邮箱直通点:https://mail.163.com/。 参考资料:https://blog.csdn.net/weixin_42937385/article/details/88150379 3.2 学习IP相关知识 学习什么是IP,为...

2019-05-15 22:23:54 169

原创 网络爬虫 学习日志(二)

Task2(2天)2.1 学习beautifulsoup 学习beautifulsoup,并使用beautifulsoup提取内容。 使用beautifulsoup提取丁香园论坛的回复内容。 丁香园直通点:http://www.dxy.cn/bbs/thread/626626#626626。 参考资料:https://blog.csdn.net/wwq11...

2019-05-13 18:58:25 261

原创 网络爬虫 学习日志(一)

任务: 学习get与post请求,尝试使用requests或者是urllib用get方法向https://www.baidu.com/发出一个请求,并将其返回结果输出。 如果是断开了网络,再发出申请,结果又是什么。了解申请返回的状态码。 了解什么是请求头,如何添加请求头。 学习什么是正则表达式并尝试一些正则表达式并进行匹配。 然后结合requests、...

2019-05-11 13:50:32 982

原创 第一个机器学习样例《python与机器学习实战》

问题:现有47个房子的面积和价格,需要建立一个模型对新的房价进行预测。 数据源:http://github.com/carefree0910/MachineLearning/blob/master_Data/price.text该数据集比较简单,但是数据相当的大。保留他原始形式是有必要的。我们通过数据标准化处理对他做简单的处理以降低问题的复杂度标准化的数学公式为:数据规范化详见这个博主...

2019-05-09 11:41:28 1098 1

原创 tableau学习手册(1)

基于服装销售数据的产品的产品线分析通过二级品类的数据,1.发现了日用品的二级品类出现了休闲装2.在所有二级品类中最高价格的产品居然在帽子,手套围巾里。要通过对数据溯源,检查数据错误。通过观察产品价格带的分布的均值,该产品的平均价格在180左右,在女装品牌中属于中低端定价。除了日用品包含大量的珠宝配饰类二级品类外,只有衬衫/背心和汗衫/T恤品类中的产品品类中种类较多,其他品类中的品...

2018-11-07 00:18:51 658

原创 Matlab基础知识(一)

1.1数值类型基本的数值类型主要有(有无符号)整数、单精度和双精度。matlab的数值默认为双精度浮点类型,将变量设置为整数类型时,需要用转换函数,在转换过程中,转换值转换为与之最接近的整数值,若小数部分为0.5,则往该浮点数最接近的两个整数中绝对值较大的一个。MATLAB内置的取整函数函数 运算法则 e.g. floor(x) 向下取整 flo...

2018-08-04 21:09:04 5276

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除