自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 阿里云笔记

赛题理解是极其重要的,不可以只简单的读一遍,要从直观上梳理问题,分析问题的可行方法,在开始之前,要对赛题数据有初步了解,方便后续的进行。评估指标即是我们对于一个模型效果的数值型量化。(有点类似与对于一个商品评价打分,而这是针对于模型效果和理想效果之间的一个打分)1.通过数据科学以及机器学习深度学习的办法来进行建模得到结果。每个赛题的评价指标是不同的,针对不同的赛题侧重点不一样。3.通过EDA来挖掘数据的联系和自我熟悉数据。2.此题是一个典型的回归问题。

2024-07-29 14:44:48 388

原创 Pandas笔记

在数据处理与分析领域,特别是在处理大型数据集时,Chunker通常指的是一种技术或对象,用于将大型数据集分成较小的块(chunk)进行逐个读取和处理。:使用pandas库处理大型CSV文件时,可以通过设置chunksize参数来逐块读取数据,此时,每个块(chunk)可以视为一个DataFrame对象,而Chunker则是这个逐块读取过程的一种抽象表示。arange(8):这是NumPy库中的一个函数,用于生成一个从0开始,到8(不包括8)的一维数组,即[0, 1, 2, 3, 4, 5, 6, 7]。

2024-07-22 14:43:49 759

原创 Datawhale 2024 年 AI 夏令营 -task1

缺点:不考虑语言表达(语法)上的准确性;没有考虑同义词或相似表达的情况,可能会导致合理翻译被否定。看了文件后,了解了机器翻译的发展历程:1.基于规则的机器翻译 2.基于统计的机器翻译 3.基于神经网络机器翻译 4. 发展趋势。BLEU,全称为Bilingual Evaluation Understudy(双语评估替换),是一种对生成语句进行评估的指标。优点:计算速度快、计算成本低、容易理解、与具体语言无关、和人类给的评估高度相关。领悟到机器翻译其实根据算法进行循环,循环次数不同,最终翻译程度不同。

2024-07-14 22:31:04 187

原创 Python笔记

d.append(123) 向列表中加入数据123。d.pop(3) 删去列表索引为3的数据。每一个键值唯一,如果重复,则后面替代前面。字符串可以用双引号" ",也可以用单引号' '标识符的第一个字符必须是字母表中的字母或下划线_write时的文件原先没有,则会创建新文件。文件读写:read() write()整数,浮点数,字符串,列表,字典等。强制类型转换:a='123'为字符串。列表内可以放置任何种类的对象。文件关闭:close()模块导入:import。文件打开:open()

2024-07-14 15:22:12 152

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除