韩雨庭-CSDN博客

原创 Docker入门与练习

Docker入门与练习WHAT IS DOCKER AND WHY IT IS USED环境配置的难题Docker的意义Docker的用途重要概念Docker 的使用阿里云容器使用练习结果WHAT IS DOCKER AND WHY IT IS USED环境配置的难题相信程序员都经历过为环境配置犯难的时候。譬如开发python程序，本地不光需要python的interpreter还有依赖包还要配置环境变量。如果之后更换电脑就意味着环境配置的困难又卷土重来。那么如果有这样一个程序，自带环境于所

2021-02-22 01:23:59 261

原创 Grid2op文档之make函数

使用场景关于grid2op竞赛中的环境，当然最简单的是使用预定义的环境，方法是借助import grid2openv = grid2op.make("rte_case14_realistic")可以在此程序包的Getting_stared目录中查阅不同的笔记本，以获取有关如何使用它的更多信息。用法最简单版import grid2openv = grid2op.make("rte_case14_realistic")参数dataset_path (str) ：用于指定要加载的环境的路

2020-09-01 19:31:11 1118

原创 Grid2op文档 reward类总结

这里写自定义目录标题定义用法 & 实例对reward类的概述BaseReward静态变量方法BridgeRewardCloseToOverflowRewardCombinedRewardCombinedScaledRewardConstantRewardDistanceRewardEconomicRewardFlatReward（per_timestep = 1）GameplayRewardIncreasingFlatReward（per_timestep = 1）L2RPNRewardL2RPNS

2020-09-01 18:58:56 1533 1

原创对于Titanic数据集模型的搭建与评估

步骤数据清洗确立搭建模型训练前准备试用不同模型模型评估数据清洗把数据缺失值，重复值处理到易于模型分析的样子缺失值处理首先找到含有缺失值的特征train.isnull().mean()将含缺失值的特征分为分类变量与连续变量处理缺失的分类变量# 对分类变量进行填充train['Cabin'] = train['Cabin'].fillna('NA')train['Embarked'] = train['Embarked'].fillna('S')处理缺失的

2020-08-29 01:10:51 298

原创 Leetcode实战 task3：查找

查找Tips：善用基本数据结构查找有无–set元素’a’是否存在，通常用set：集合set只存储键，而不需要对应其相应的值。set中的键不允许重复查找对应关系(键值对应)–dict元素’a’出现了几次：dict–>字典dict中的键不允许重复改变映射关系–map通过将原有序列的关系映射统一表示为其他实战题目一：LeetCode 349 Intersection Of Two Arrays 1题目描述给定两个数组nums,求两个数组的公共元素。input: nums

2020-08-26 01:18:13 179

原创 DataWhale LeetcodeTask2:动态规划的思想与实操

写在最前面没太学懂，感觉是带记忆的暴力求解，但在实际使用时很难快速确切想到相应解法。望还有下次再做做题（不咕了）。一句话介绍动态规划常常适用于有重叠子问题和最优子结构性质的问题，动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题，我们需要解其不同部分（即子问题），再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题，例如斐波那契数列，如果运用递归的方式来求解会重复计算很多相同的子问题，利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次，具有天然剪枝的功能

2020-08-24 01:06:29 115

原创数据分析Task2 数据清洗与特征工程

一数据清洗缺失值缺失值的识别主要依赖几个函数来进行清洗前的判断info(), 详细列出非空值的个数df.info()df.isnull().sum(), 同上df.isnull().sum()df[[‘所需查询列一’，‘列二]], 以表格形式显示df[['Age']].head(3)如果没有[]是这样df['Age'].head(3)缺失值的处理一般搜索none，np.NAN然后补为0，df[df[‘Age’]==None] = 0df[df[‘

2020-08-22 00:00:56 166

原创 DataWhale 数据分析实战数据的加载与观察

数据加载读取直接读取df = pd.read_csv('train.csv')#输入相对路径df = pd.read_csv('/Users/chenandong/Documents/datawhale数据分析每个人题目设计/招募阶段/第一单元项目集合/train.csv')# 输入绝对路径逐块读取当加载数据过多时需要分批加载chunker = pd.read_csv(‘train.csv’, chunksize=1000)按照自定义表头读取df = pd.read_csv('

2020-08-19 23:59:15 189

原创 DataWhaleChina 0818-20 leetcode实践 Task1 分治思想与练习题

分治算法是什么分治算法的主要思想是将原问题递归地分成若干个子问题，直到子问题满足边界条件，停止递归。将子问题逐个击破(一般是同种方法)，将已经解决的子问题合并，最后，算法会层层合并得到原问题的答案。我的疑问（待解决）这和动态规划的区别主要是啥呀。。分支的条件不同吗步骤分为三步：分：确定分支条件，比如什么时候终止分支治：确定处理已分出来支的方法合：汇总处理后的分支给出局部解直到最终解练习题leetcode 50 pow解题思路咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕咕解

2020-08-19 21:11:27 153

原创 TIANCHI-NLP-入门赛-新闻分类-Task3-解决思路一

知识点Bag of WordsBag of Words（词袋表示），也称为Count Vectors，每个文档的字/词可以使用其出现次数来进行表示。直接统计每个字出现的次数，并进行赋值。在sklearn中可以直接CountVectorizer来实现这一步骤：vectorizer = CountVectorizer()vectorizer.fit_transform(datalist).toarray()TF-IDF第一部分是词语频率（Term Frequency），第二部分是逆文档频率（In

2020-07-25 23:59:25 122

原创天池nlp入门赛-新闻类别分辨-Task2-数据分析

比赛链接Task1-赛题理解天池入口句子长度统计plt.hist(df['len'],bins=3000)plt.xlim(0,8000)句子类别统计df['label'].value_counts().plot()字符个数统计from collections import Counterall_lines = ' '.join(list(train_df['text']))word_count = Counter(all_lines.split(" "))word_cou

2020-07-22 23:55:51 95

原创 NLP-KAGGLE-新手入门赛-TASK1：赛题分析

TASK1-赛题理解赛题学习目标解题思路所遇问题赛题赛题名称：零基础入门NLP之新闻文本分类赛题任务：赛题以自然语言处理为背景，对新闻文本进行分类。比赛链接学习目标去博客设置页面，选择一款你喜欢的代码片高亮样式，下面展示同样高亮的代码片.理解背景，理解数据比赛报名，数据下载，理解解题思路解题思路主要是文本特征提取和文本分类两个任务，可用多种思路组合完成。尝试思路：TF-IDF + 机器学习分类器直接使用TF-IDF对文本提取特征，并使用分类器进行分类。在分类器的选择上，可

2020-07-21 23:38:17 372

weixin_45019579的博客