自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数据预处理与实践(第四期)

通过数据采集获取的数据信息往往五花八门、杂乱无章,因此需要对这些不同类型的数据进行集成,并将集成数据传入到电脑中,然后通过算法模型挖掘其潜在的价值,作为智能应用的支撑。本章介绍文本信息抽取技术,以帮助大家更好地利用爬取的数据。

2023-01-03 17:04:51 330

原创 数据预处理与实践(第三期)

随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长,数据的形式也更加丰富,主要有结构化数据、半结构化数据、非结构化数据。面对各种形式的数据应当采用什么样的数据采集策略,如何实现网络爬虫爬取网页信息,如何对抓取到的网页信息进行本地化存储,都是数据预处理过程中经常会遇到的问题。本章从数据的分类入手,分别介绍数据采集和存储的常用方法与技术。

2022-12-29 11:16:12 381 1

原创 数据预处理与实践(第二期)

随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长,数据的形式也更加丰富,主要有结构化数据、半结构化数据、非结构化数据。面对各种形式的数据应当采用什么样的数据采集策略,如何实现网络爬虫爬取网页信息,如何对抓取到的网页信息进行本地化存储,都是数据预处理过程中经常会遇到的问题。本章从数据的分类入手,分别介绍数据采集和存储的常用方法与技术。

2022-12-26 16:40:21 311

原创 从零开始学python|PyCharm快捷键大全

熟练运用快捷键可以让我们编程变得更加方便,不用依赖于鼠标去切换界面。

2022-12-24 16:24:55 828

原创 数据预处理与实践(第一期)

本期主要介绍三个Python科学计算工具:Numpy、SciPy、Pandas。欢迎评论留言,关注楠姐,需要原文件的uu们可以关注我后评论区评论蹲蹲免费领取哦~

2022-12-24 15:59:51 138 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除