Datawhale 第一次打卡

最新推荐文章于 2022-10-17 01:24:35 发布

qq_45820344

最新推荐文章于 2022-10-17 01:24:35 发布

阅读量115

点赞数

本文链接：https://blog.csdn.net/qq_45820344/article/details/112575705

版权

Datawhale 第一次打卡：

开源内容

在代码运行的时候不懂的点：

1. enumerate：
Enumerate is a built-in function of Python.

my_list = ['apple', 'banana', 'grapes', 'pear']
for c, value in enumerate(my_list, 1):
    print(c, value)

# Output:# 1 apple# 2 banana# 3 grapes
#类似于对表进行排列，方便读取

2. 列表推导式嵌套循环：

unique_categories = set([i for l in [x.split(' ') for x in data["categories"]]
 for i in l])
 #用x在categories 现进行循环，然后split
 #首先是temp =  [x.split(' ') for x in data["categories"]]就是对于每一个data["categories"]中的元素按照空格进行split,这对应一个paper的多个类别，是一个list[list[]]，外层的list是每一个paper，内层是每一个paper的类别。
 #然后 for l in temp 是将每一个paper分开
 #for i in l 是对于一个分离得到一个paper的多个种类再使用set去除重复的str

（感觉看懂了却不会运用）

list1 = []
for l in [x.split(' ') for x in data['categories']]:
    for i in l:
       list1.append(i) 
list1

（此为复杂化描写）

3. 正则操作：
re.

phone = "2000-4923-3792 # this is number"
num = re.sub(r'('\D')," ",phone)
#可以去除符号

https://tool.oschina.net/regex/
检测正则

最后成果
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_45820344

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Datawhale 爬虫实战打卡（一）

weixin_44456895的博客

04-21

434

文章目录爬虫前置知识网络连接HTTP协议网页基础网页组成HTML DOMrequests库get函数实践：爬取豆瓣top250电影爬虫前置知识网络连接可以简单的理解为由客户端和服务器组成，由客户端发出请求（requests），服务器在接收后返回一个响应（response）爬虫的原理就是模拟浏览器对目标网站发送请求，然后从网站返回的数据中提取有用的数据，并将有用的数据存放于数据库或文件中。 ...

【datawhale打卡】数据清洗及特征处理

m0_56010333的博客

01-19

190

对泰坦尼克数据分析的进一步数据清洗及特征处理

参与评论您还未登录，请先登录后发表或查看评论

Datawhale打卡-统计学（Day4）

Mr.Nono的博客

03-05

230

线性回归

DataWhale动手学数据分析打卡

Shirley_L77的博客

06-16

142

DAY1: DAY2: DAY3:

DataWhale NLP 打卡（三）特征提取

qq_35175666的博客

04-11

172

1. 基本文本处理技能尽管现在很多文本处理采用基于字/字符的方式，词作为能够独立语用的基本语言单位，依然是目前是主流的NLP任务的基本处理单位。对于没有间隔符的汉语，分词就成了文本预处理的第一个任务。汉语分词，现在其实已经有大量的开源工具，比如最常用的jieba, Stanford NLP，THULAC以及最近开源的pkuseg。宗成庆老师的书里对于分词难度总结为三个方面：分词规范，歧义切...

Datawhale打卡第2次

qq_40791906的博客

03-24

286

EDA (Exploratory Data Analysis)，也就是对数据进行探索性的分析，从而为之后的数据预处理和特征工程提供必要的结论。通常我们用到pandas库和可视化工具如 matplotlib 和 seaborn 就可以完成了。主要的步骤是：理解问题；读取数据；单变量探索；多变量探索；数据预处理；建立假设，并检验。本次对二手车价格数据EDA的整个过程我用代码记录了下来，下面是我...

Datawhale 第三次打卡，第一天学习。

weixin_52848341的博客

10-17

174

第三次打卡datawhale

Datawhale第五次打卡

09-27

支持向量机（Support Vector Machine，SVM）是一种强大的监督学习算法，尤其适用于分类和回归任务。在机器学习领域，SVM以其高效性和泛化能力而闻名。本章主要介绍了SVM的基本概念、对偶问题、核函数以及软间隔和...

Datawhale第四次打卡

09-22

"机器学习第五章笔记" 机器学习是人工智能的重要分支，它涉及到计算机科学、数学、统计学、神经生物学等多个领域。机器学习的主要目标是使计算机系统自动地从经验中学习，提高自己的性能。机器学习的应用领域非常...

Datawhale：动手深度学习第一次打卡！

01-20

标题中的“动手深度学习第一次打卡！”表明这是一次学习深度学习的实践记录，特别是与循环神经网络（RNN）相关的动手操作。描述中提到的代码片段是使用PyTorch库来构建和初始化一个简单的RNN模型，同时加载了一个...

DataWhale 深度学习第二次打卡

01-20

在DataWhale的第二次打卡学习中，涵盖了多个核心概念，包括过拟合、欠拟合、梯度消失、梯度爆炸、循环神经网络、机器翻译、注意力机制、Seq2seq模型、Transformer、卷积神经网络以及权重衰减等。首先，过拟合和欠...

DataWhale 吃瓜教程第一次打卡：第一章、第二章

Pbsrm的博客

03-14

855

周志华老师《机器学习》第二章的自我学习笔记

Pytorch文本分类(imdb数据集)，包含DataLoader数据加载，最优模型保存

最新发布

09-15

Pytorch文本分类(imdb数据集)，包含DataLoader数据加载，最优模型保存_Pytorch-imdb-classification

5001-微信小程序家庭记账本的设计与实现+ssm（源码+数据库+lun文）.zip

09-15

5334-微信小程序同城交易小程序（源码+数据库）.zip

09-15

iOS一行代码集成空白页面占位图(无数据、无网络占位图)_emptyView-empty_set_LYEmptyView.zip

09-15

iOS一行代码集成空白页面占位图(无数据、无网络占位图)_emptyView-empty_set_LYEmptyView

java-ssm+jsp热带水果商城网站实现源码(项目源码-说明文档)

09-15

登陆系统后，可以查看个人中心，用户管理，地区管理，商品分类管理，商品信息管理，留言板，系统管理，订单管理等功能项目关键技术开发工具：IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7+ 后端技术：ssm 前端技术：jsp 关键技术：jsp、spring、ssm、MYSQL、MAVEN 数据库工具：Navicat、SQLyog

5084-微信小程序的影院选座系统+ssm（源码+数据库+lun文）.zip

09-15

5078-微信小程序培训咨询微信小程序+ssm（源码+数据库）.zip

09-15

Datawhale第四次打卡：机器学习第五章——神经网络与感知机详解

在"Datawhale第四次打卡"的机器学习第五章笔记中，我们深入探讨了神经网络的基础概念和算法。章节首先介绍了神经元模型，它是神经网络的基本构建单元，接收来自其他神经元的加权输入，通过激活函数处理后产生输出。...