Larsailjx-CSDN博客

原创阿里云笔记

赛题理解是极其重要的，不可以只简单的读一遍，要从直观上梳理问题，分析问题的可行方法，在开始之前，要对赛题数据有初步了解，方便后续的进行。评估指标即是我们对于一个模型效果的数值型量化。（有点类似与对于一个商品评价打分，而这是针对于模型效果和理想效果之间的一个打分）1.通过数据科学以及机器学习深度学习的办法来进行建模得到结果。每个赛题的评价指标是不同的，针对不同的赛题侧重点不一样。3.通过EDA来挖掘数据的联系和自我熟悉数据。2.此题是一个典型的回归问题。

2024-07-29 14:44:48 388

原创 Pandas笔记

在数据处理与分析领域，特别是在处理大型数据集时，Chunker通常指的是一种技术或对象，用于将大型数据集分成较小的块（chunk）进行逐个读取和处理。：使用pandas库处理大型CSV文件时，可以通过设置chunksize参数来逐块读取数据，此时，每个块（chunk）可以视为一个DataFrame对象，而Chunker则是这个逐块读取过程的一种抽象表示。arange(8)：这是NumPy库中的一个函数，用于生成一个从0开始，到8（不包括8）的一维数组，即[0, 1, 2, 3, 4, 5, 6, 7]。

2024-07-22 14:43:49 759

原创 Datawhale 2024 年 AI 夏令营 -task1

缺点：不考虑语言表达（语法）上的准确性；没有考虑同义词或相似表达的情况，可能会导致合理翻译被否定。看了文件后，了解了机器翻译的发展历程：1.基于规则的机器翻译 2.基于统计的机器翻译 3.基于神经网络机器翻译 4. 发展趋势。BLEU，全称为Bilingual Evaluation Understudy（双语评估替换），是一种对生成语句进行评估的指标。优点：计算速度快、计算成本低、容易理解、与具体语言无关、和人类给的评估高度相关。领悟到机器翻译其实根据算法进行循环，循环次数不同，最终翻译程度不同。

2024-07-14 22:31:04 187

原创 Python笔记

d.append(123) 向列表中加入数据123。d.pop(3) 删去列表索引为3的数据。每一个键值唯一，如果重复，则后面替代前面。字符串可以用双引号" "，也可以用单引号' '标识符的第一个字符必须是字母表中的字母或下划线_write时的文件原先没有，则会创建新文件。文件读写：read() write()整数，浮点数，字符串，列表，字典等。强制类型转换：a='123'为字符串。列表内可以放置任何种类的对象。文件关闭：close()模块导入：import。文件打开：open()

2024-07-14 15:22:12 152

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 阿里云笔记

原创 Pandas笔记

原创 Datawhale 2024 年 AI 夏令营 -task1

原创 Python笔记

空空如也

空空如也

原创阿里云笔记