自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

转载 第8章 分类数据

import pandas as pd import numpy as np df = pd.read_csv('data/table.csv') df.head() School Class ID Gender Address Height Weight Math Physics 0 S_1 C

2020-06-27 22:30:11 578

转载 第7章 文本数据

第7章 文本数据 import pandas as pd import numpy as np import sklearn as skl skl.__version__ '0.23.1' 一、string类型的性质 1. string与object的区别 string类型和object不同之处有三: ① 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型 ② 某些Series方法不能在

2020-06-26 22:51:43 259

转载 Pandas缺失数据学习

1.缺失值信息的了解 主要有两种方法可以了解Series和DateFrame数据格式的详细的缺失值信息,即isna和notna。 DataFrame.isna() Series.isna() # 缺失值返回False DataFrame.notna() Series.notna() # 缺失值返回True 每一列缺失值的汇总 DataFrame.isna().sum() # 统计每列缺失值的总数 DataFrame.notna().sum() # 统计每列非缺失值的总数 可以通过info函

2020-06-23 22:10:13 283

原创 随机事件与随机变量

随机试验 可以在相同条件下重复进行; 结果有多种可能性,并且所有可能结果事先已知; 作一次试验究竟哪个结果出现,事先不能确定。 随机试验的所有结果的组成为样本空间,记作Ω\OmegaΩ,试验的每一个点为样本点,记作ω\omegaω。 样本空间中一般分为随机事件、必然事件、不可能事件。、 古典概率 事件A的古典概率定义为:P(A)=mn=事件A包含的基本事件数基本事件总数P(A) = \frac{m} {n} = \frac{事件A包含的基本事件数} {基本事件总数}P(A)=nm​=基本事件总数事件A包

2020-06-23 00:15:40 585

转载 Task12:

题目 罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。 例如, 罗马数字 2 写做 II ,即为两个并列的 1。12 写做 XII ,即为 X + II 。 27 写做 XXVII, 即为 XX + V + II 。 字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1000 通常情况下,罗马数字中小的数字在...

2020-03-14 00:39:31 84

转载 Task12:合并K个排序链表

题目 合并 k 个排序链表,返回合并后的排序链表。请分析和描述算法的复杂度。 解题 # Definition for singly-linked list. # class ListNode: # def __init__(self, x): # self.val = x # self.next = None import heapq class Solut...

2020-03-12 23:16:50 68

转载 Task11: 删除链表的倒数第N个节点

题目 给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点。 解题 # Definition for singly-linked list. # class ListNode: # def __init__(self, x): # self.val = x # self.next = None class Solution: def r...

2020-03-11 21:24:07 75

转载 Task10:两数相加

题目 给出两个 非空 的链表用来表示两个非负的整数。其中,它们各自的位数是按照 逆序 的方式存储的,并且它们的每个节点只能存储 一位 数字。 如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。 您可以假设除了数字 0 之外,这两个数都不会以 0 开头。 解题 # Definition for singly-linked list. # class ListNode: # d...

2020-03-10 23:33:43 86

转载 Task9:环形链表

题目 给定一个链表,判断链表中是否有环。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。 解题 # Definition for singly-linked list. # class ListNode: # def __init__(self, x): # self.val ...

2020-03-09 23:48:55 73

转载 Task8:删除排序链表中的重复元素

题目 给定一个排序链表,删除所有重复的元素,使得每个元素只出现一次。 解题 # Definition for singly-linked list. # class ListNode: # def __init__(self, x): # self.val = x # self.next = None class Solution: def del...

2020-03-08 21:17:42 83

转载 Task7:合并两个有序链表

题目 将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 解题 class Solution: def mergeTwoLists(self, l1: ListNode, l2: ListNode) -> ListNode: prehead = ListNode(-1) prev = prehead ...

2020-03-07 23:35:42 84

转载 Task6:买卖股票的最佳时机 III

题目 给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。 注意: 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 解题 from typing import List class Solution: def maxProfit(self, prices: List[int]) ->...

2020-03-06 23:31:24 77

原创 Task5:最接近的三数之和

题目 给定一个包括 n 个整数的数组 nums 和 一个目标值 target。找出 nums 中的三个整数,使得它们的和与 target 最接近。返回这三个数的和。假定每组输入只存在唯一答案。 例如,给定数组 nums = [-1,2,1,-4], 和 target = 1. 与 target 最接近的三个数的和为 2. (-1 + 2 + 1 = 2). 解题: class Solution: ...

2020-03-05 23:09:27 81

转载 Task4:三数之和

题目 给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。 注意:答案中不可以包含重复的三元组。 解题 class Solution: def threeSum(self, nums: List[int]) -> List[List[int]]: n=len(...

2020-03-04 22:00:35 71

原创 Task3:移除元素

给定一个数组 nums 和一个值 val,你需要原地移除所有数值等于 val 的元素,返回移除后数组的新长度。 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。 元素的顺序可以改变。你不需要考虑数组中超出新长度后面的元素。 解题: class Solution: def removeElement(self, nums: List[int], va...

2020-03-03 18:32:31 71

原创 Task2:删除排序数组中的重复项

给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。 解题: class Solution: def removeDuplicates(self, nums: List[int]) -> int: if len(nums) == 0...

2020-03-02 18:21:25 69

原创 Task1:两数之和

```python class Solution: def twoSum(self, nums: List[int], target: int) -> List[int]: n = [i for i in range(len(nums))] nums_dict = dict(zip(nums, n)) # 创建字典 for i in...

2020-03-01 20:55:57 68

转载 动手学Task2

文本预处理 文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 读入文本 我们用一部英文小说,即H. G. Well的Time Machine,作为示例,展示文本预处理的具体过程。 import collecti...

2020-02-14 18:46:18 107

转载 动手学Task1

线性回归 主要内容包括: 1.线性回归的基本要素 2.线性回归模型从零开始的实现 3.线性回归模型使用pytorch的简洁实现 线性回归模型从零开始的实现 1.生成数据集 使用线性模型来生成数据集,生成一个1000个样本的数据集,下面是用来生成数据的线性关系: price=warea⋅area+wage⋅age+b \mathrm{price} = w_{\mathrm{area}} \cdo...

2020-02-14 18:26:54 89

原创 baseline_1

import pandas as pd import numpy as np import lightgbm as lgb import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import KFold from sklearn.metrics import r2_score def ...

2019-07-26 21:30:16 206

转载 EDA_house

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np from scipy.stats import norm from sklearn.preprocessing import StandardScaler from scipy import stats impor...

2019-07-25 07:52:17 302

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除