自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 Excel相关——常用函数

包括逻辑判断函数,文本函数,查找函数,动态函数等。

2023-01-29 19:28:33 145

原创 Excel相关——常用快捷键

Excel快捷操作

2023-01-18 21:54:25 142

原创 Excel相关——数据格式

Excel与数据格式

2023-01-16 00:28:44 158

原创 JavaScript 面向对象的编程 (Code with mosh学习笔记)

js 面向对象的编程

2023-01-02 22:15:02 395

原创 JavaScript 基础篇 (Code with mosh学习笔记)

JavaScript 学习笔记

2022-12-26 20:22:43 1233

原创 Python办公自动化——Excel读取

Excel读取读取对应表格2003年版本的是xls格式,2007和2007年之后的版本是xlsx格式。xlsx格式通过 openpyxl 模块打开;xls格式通过 xlwt 模块写,xlrd 模块读取。import warningswarnings.filterwarnings('ignore')import openpyxl查看属性wb = openpyxl.load_workbook('用户行为偏好.xlsx')type(wb)openpyxl.workbook.workb

2021-11-20 02:13:17 2823

原创 Python办公自动化——文件处理

文件自动化处理文件处理文件与文件路径用 os.path.join() 函数来创建文件名称字符串,其主要功能是用于拼接文件路径,形成符合规范的文件名。import osos.path.join('测试','算例','不是真的路径') '测试\\算例\\不是真的路径'当前工作目录每个运行在计算机上的程序,都有一个“当前工作目录”。利用 os.getcwd() 函数,可以取得当前工作路径的字符串。利用 os.chdir() 可以改变当前工作路径。import osos.getcwd()

2021-11-17 23:38:32 2871

原创 Pandas学习——综合练习

显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchmarking Inference float p

2021-01-13 23:10:16 1928

原创 Pandas学习——时序数据

1. 时序中的基本对象时间序列的概念在日常生活中十分常见,但对于一个具体的时序事件而言,可以从多个时间对象的角度来描述。例如 2020 年 9 月 7 日周一早上 8 点整需要到教室上课,这个课会在当天早上 10 点结束,其中包含了哪些时间概念?第一,会出现**时间戳(Date times)**的概念,即’2020-9-7 08:00:00’和’2020-9-7 10:00:00’这两个时间点分别代表了上课和下课的时刻,在 pandas 中称为 Timestamp。同时,一系列的时间戳可以组成 Da.

2021-01-10 22:52:45 2960

原创 Pandas学习——分类数据

cat对象cat对象的属性在 pandas 中提供了 category 类型,使用户能够处理分类类型的变量,将一个普通序列转换成分类变量可以使用 astype 方法。df = pd.read_csv('G:/代码/joyful-pandas-master/data/learn_pandas.csv',usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight'])df.head() Grade.

2021-01-07 21:46:55 2478

原创 Pandas学习——文本数据

str对象str对象的设计意图str 对象是定义在 Index 或 Series 上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其 str 对象。在Python标准库中也有 str 模块,为了使用上的便利,有许多函数的用法 pandas 照搬了它的设计,例如字母转为大写的操作:var = 'abcd'str.upper(var) # Python内置str模块'ABCD's = pd.Series(['abcd', 'efg', 'hi.

2021-01-06 20:14:23 1973

原创 Pandas学习——处理缺失数据

缺失值的统计和删除缺失信息的统计缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,结合 mean 可以计算出每列缺失值的比例:df = pd.read_csv('G:/代码/joyful-pandas-master/data/learn_pandas.csv',usecols = ['Grade', 'Name', 'Gender', 'Height','Weight', 'Transfer'])df.isna().head()

2021-01-03 23:45:24 3208

原创 Pandas学习——综合练习

import pandas as pd import numpy as np 任务一:企业收入的多样性一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:I=−∑ip(xi)log⁡(p(xi))\rm I=-\sum_{i}p(x_i)\log(p(x_i))I=−i∑​p(xi​)log(p(xi​))其中p(xi)\rm p(x_i)p(xi​)是企业该年某产业收入额占该年所有产业总收入的比重。在 company.csv 中存有需要计算的企业和年份,在 company_data.

2021-01-01 23:08:29 2318 2

原创 Pandas学习——连接

关系型连接(横向连接)连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照 姓名 和 班级 连接成总的成绩表,又例如对企业员工的各类信息表按照 员工ID号 进行连接汇总。由此可以看出,在关系型连接中, 键是十分重要的,往往用 on 参数表示。另一个重要的要素是连接的形式。在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner 、外连接.

2020-12-29 21:33:12 2736

原创 Pandas学习——变形

长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。例如:一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。下面的两张表就分别是关于性别的长表和宽表:# 长表pd.DataFrame({'Gender':['F','F','M','M'],'Height':[163, 160, 175, 180]}) Gender Height

2020-12-27 23:53:02 2106

原创 Pandas学习——分组

分组模式及其对象分组的一般模式分组操作在日常生活中使用极其广泛,例如:依据性别分组,统计全国人口寿命的平均值依据季节分组,对每一个季节的温度进行组内标准化依据班级分组,筛选出组内数学分数的平均值超过80分的班级从上述的几个例子中不难看出,想要实现分组操作,必须明确三个要素:分组依据 、 数据来源 、 操作及其返回结果。同时从充分性的角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:df.groupby(分组依据)[数据来源].使用操作df = p

2020-12-25 22:12:16 2493

原创 Pandas学习——索引

索引器DataFrame 的列索引列索引是最常见的索引形式,一般通过 [] 来实现。通过 [列名] 可以从 DataFrame 中取出相应的列,返回值为 Series ,例如从表中取出姓名一列:df = pd.read_csv('G:\代码\joyful-pandas-master\data\learn_pandas.csv',usecols = ['School', 'Grade', 'Name', 'Gender','Weight', 'Transfer'])df['Name'].head()

2020-12-22 19:01:11 2610

原创 Pandas学习——Pandas基础

文件的读取和写入文件读取df_csv = pd.read_csv('G:\代码\joyful-pandas-master\data\my_csv.csv') # 可以写相对路径也可以写绝对路径df_csv col1 col2 col3 col4 col5 0 2 a 1.4 apple 2020/1/1

2020-12-19 23:52:14 2400 1

原创 Pandas学习——预备知识

调用库函数import numpy as npPython基础列表推导式与条件赋值L = []def my_f(x): return 2*xfor i in range(5): L.append(my_f(i)) L [0, 2, 4, 6, 8]利用列表推导式对上面的写法进行简化:[my_f(i) for i in range(5)][0, 2, 4, 6, 8]列表表达式还支持多层嵌套,如下面的例子中,第一个 for 为外层循环,第二个 fo

2020-12-16 14:48:40 2164 1

原创 Code With Mosh 学习笔记

当第一个session的第一个SELECT语句执行之后,第二个session执行完毕,然后第一个session的第二个SELECT语句继续执行,会发生Non-repeadting Read.第一个session更新完customers,第二个session开始执行(等待第一个session提交),此时继续执行第一个session更新orders,发生Deadlock.(用途:一个表存产品的颜色,另一个表存产品的尺寸,想要将所有的型号和所有的颜色组合)返回每笔订单的订单id,产品id,名字,订购数量和单价。

2020-11-26 19:09:39 2113

原创 《写作是门手艺》读书笔记

《写作是门手艺》读书笔记

2020-11-23 18:49:52 3136

原创 空气动力学笔记——基本概念

2020-11-16 18:21:38 2932

原创 强化学习——Deep Deterministic Policy Gradient

Deep Deterministic Policy Gradient

2020-11-07 20:45:21 2074

原创 强化学习——Sparse Reward and Imitation Learning

Sparse RewardImitation Learning

2020-11-05 16:13:41 566

原创 强化学习——DQN 算法与Actor-Critic

DQN 算法

2020-11-03 22:42:49 2701

原创 航空航天科学与工程专业术语翻译

航空航天科学与工程专业学术翻译必备词汇中文英文仿真simulation数值numerical飞机aircraft卫星satellite发动机engine飞行flight流动,流场flow可靠性reliability火箭rocket空间space姿态attitude非线性nonlinear推进剂propellant固体solid直升机helicopter导航navig

2020-10-29 17:45:20 2042

原创 强化学习——策略梯度及 PPO 算法

强化学习—策略梯度及 PPO 算法

2020-10-29 15:37:48 3299 1

原创 强化学习——马尔可夫决策过程及表格型方法

马尔可夫决策过程及表格型方法手打更新中,请稍后刷新

2020-10-23 18:52:10 380

原创 强化学习——基础知识

2020-10-20 22:23:08 222

原创 零基础入门金融风控之贷款违约预测—模型融合

模型融合模型融合的方式:平均简单平均法加权平均法投票简单投票法加权投票法综合排序融合log 融合stacking构建多层模型,并利用预测结果再拟合预测。blending选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。boosting / baggingstacking\blendingstacking 将若干基学习器获得的预测结果,将预测结果作为新的训练集来训练一个学习器。首先直接用所有的训练数据对第一层多个模型进行 K 折交叉验

2020-09-27 22:24:17 1065

原创 零基础入门金融风控之贷款违约预测—建模与调参

基本模型逻辑回归逻辑回归是一个假设样本服从伯努利分布 (f(x∣p)=px(1−p)n−xf(x|p) = p^x(1-p)^{n-x}f(x∣p)=px(1−p)n−x),利用极大似然估计和梯度下降求解的二分类模型。逻辑回归本质上是线性回归,只是在特征到结果的映射中加入了一个 sigmoid 函数,即先把特征线性求和,然后使用非线性的函数将连续值映射到 0 与 1 之间。 优点训练速度较快,分类的时候,计算量仅仅只和特征的数目相关简单易理解,模型的可解释性非常好,从特征的权重可

2020-09-24 23:28:49 1587 3

原创 零基础入门金融风控之贷款违约预测—特征工程

初始化import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetimefrom tqdm import tqdmfrom sklearn.preprocessing import LabelEncoderfrom sklearn.feature_selection import SelectKBestfrom sklearn.feature_sel

2020-09-21 23:00:54 1314

原创 A城市巡游车与网约车运营特征对比分析—地图及订单数据统计

初始化import pandas as pdimport numpy as npimport matplotlib.pyplot as plt import folium # 文件目录,绝对路径INPUT_PATH = 'G:\DCIC\Data\\'# 文件读取行数MAX_ROWS = 100000 地图数据统计:taxigps2019 = pd.read_csv(INPUT_PATH + 'taxiGps20190531.csv',

2020-09-20 15:23:39 1629 4

原创 A城市巡游车与网约车运营特征对比分析—数据可视化

初始化import pandas as pdimport numpy as npimport matplotlib.pyplot as plt import folium # 文件目录,绝对路径INPUT_PATH = 'G:\DCIC\Data\\'# 文件读取行数MAX_ROWS = 100000 读取数据# 巡游车 GPS 数据taxigps2019 = pd.read_csv(INPUT_PATH + 'taxiGps20190531.csv',

2020-09-20 14:25:01 1020

原创 零基础入门金融风控之贷款违约预测—数据分析

主要目标了解数据集的一些基本情况,如缺失值,异常值,数据集大小,原始特征维度等了解变量间的相互关系、变量与预测值之间存在的关系观察变量的分布情况,为特征工程做准备

2020-09-18 23:52:13 2054

原创 口袋妖怪数据集探索

口袋妖怪数据集探索数据读取import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltdf = pd.read_csv("pokemon.csv")df.head() abilities against_bug against_dark against_dragon against_electric a

2020-09-14 21:50:25 2176

原创 零基础入门金融风控之贷款违约预测—赛题理解

赛题数据赛题数据来自某信贷平台的贷款记录,总数据量超过 120 万条,包含 47 列变量信息,其中 15 列为匿名变量。从中抽取 80 万条作为训练集,20 万条作为测试集A,20 万条作为测试集B,同时会对 employmentTitle、purpose、postCode 和 title 等信息进行脱敏。字段表:字段名描述id为贷款清单分配的唯一信用证标识loanAmnt贷款金额term贷款期限(year)interestRate贷款利率insta

2020-09-14 16:27:14 2710

原创 A城市巡游车与网约车运营特征对比分析—数据读取及统计

初始化import pandas as pdimport numpy as np# 文件目录,绝对路径INPUT_PATH = 'G:\DCIC\Data\\'# 文件读取行数MAX_ROWS = 100000 数据读取巡游车GPS数据读取taxigps2019 = pd.read_csv(INPUT_PATH + 'taxiGps20190531.csv', nrows=MAX_ROWS)# 查看数据的统计描述taxigps2019.describe()

2020-09-13 20:22:18 1970 10

原创 函数等高级用法

函数函数的定义还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数、返回值是函数。我们首先来介绍函数的定义。函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname (parameters):      &

2020-09-10 16:48:55 1053

原创 Python 数据结构

列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语

2020-09-09 20:33:49 1713

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除