自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 reques简单四行代码·实现爬虫

import requestsimport bs4#导包# box=input("请输入要统计的物品信息关键字:")#进行数据解析的原理:1标签定位2.提取解析标签中存取数据值#soup.tagname:返回第一次出现的标签#soup.find("标签名称")返回的是第一次出现的div 相当于soup.div#soup.fing_all("标签名称")#select函数:#soup.select('放置一些选择器')选择器类似:id,class,标签,选择器#获取标签红的属性值:u.

2022-05-22 09:00:16 197

原创 搜狗爬虫初学request

# :开发时间# :我爱编程#爬取搜狗首页页面数据import requestsif __name__=="_main_":#指定url url='https://www.sogou.com/' #step2 发起请求 response=requests.get(url=url)#第一个参数是 指定url,get方法返回一个响应对象 #step3 获取响应数据:text获取字符串类的响应数据 page_text=response.text prin..

2022-05-14 22:57:34 174

原创 9.深度学习

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。...

2021-11-05 09:43:09 388

原创 8.数据挖掘

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘(...

2021-11-05 09:39:37 657

原创 7.机器学习

机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。...

2021-11-05 09:35:58 1074

原创 6.统计学

a'a

2021-10-29 21:25:42 353

原创 5.YARN工作机制

aa

2021-10-29 21:24:01 82

原创 4.HDFS的blick和切片

aa

2021-10-29 21:23:24 306

原创 3.节点距离计算

安爱

2021-10-29 21:22:33 105

原创 2.HDFS读写流程

444

2021-10-29 21:21:45 93

原创 1.HDFS写数据流

aaaa

2021-10-29 21:20:26 143

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除