自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 【数据结构与算法】双端队列及Python实现

目录1 双端队列抽象数据类型及Python实现1.1 抽象数据类型Deque1.2 Python实现ADT Deque2 双端队列的应用2.1 回文词判定算法1 双端队列抽象数据类型及Python实现定义: 双端队列Deque是一种有次序的数据集,跟队列相似,其两端可以称作 “ 首 ”“ 尾 ” 端,但deque 中数据项既可以从队首加入,也可以从队尾加入;数据项也可以从两端移除。某种意义上说,双端队列集成了栈和队列的能力。特性: 双端队列并不具有内在的LIFO (Last in first

2020-09-05 10:51:40 400 1

原创 【数据结构与算法】队列及Python实现

目录1 队列抽象数据类型及Python实现1.1 抽象数据类型Queue1.2 Python实现ADT Queue2 队列的应用2.1 热土豆(约瑟夫问题)算法2.2 打印任务算法1 队列抽象数据类型及Python实现定义: 当数据项加入队列,首先出现在队尾,随着队首数据项的移除,它逐渐接近队首。特性: 队列是一种有次序的数据集合,新数据项的添加总发生在一端(通常称为 “ 尾rear ” 端),而现存数据项的移除总发生在另一端(通常称为“ 首front ” 端)。1.1 抽象数据类型Qu

2020-09-05 10:22:35 494

原创 【数据结构与算法】栈及Python实现

目录1 栈抽象数据类型及Python实现1.1 抽象数据类型Stack1.2 Python实现ADT Stack2 栈的应用2.1 简单括号匹配算法2.2 通用括号匹配算法1 栈抽象数据类型及Python实现定义: 一种有次序的数据项集合,在栈中,数据项的加入和移除都仅发生在同一端,这一端叫栈 “ 顶top ” ,另一端叫栈 “ 底base”特性: 反转次序,进栈和出栈的次序正好相反1.1 抽象数据类型StackStack() :创建一个空栈,不包含任何数据项push(ite

2020-08-27 10:43:50 607

原创 【Leetcode】动态规划

动态规划动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题,我们需要解其不同部分(即子问题),再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题,例如斐波那契数列,如果运用递归的方式来求解会重复计算很多相同的子问题,利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次,具有天然剪枝的功能,从而减少计算量,一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。动态规划

2020-08-22 22:07:27 361

原创 【Leetcode】分治

MapReduce(分治算法的应用) 是 Google 大数据处理的三驾马车之一,另外两个是 GFS 和 Bigtable。它在倒排索引、PageRank 计算、网页分析等搜索引擎相关的技术中都有大量的应用。目录主要思想分治算法的步骤分治法适用的情况算法应用参考资料主要思想分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。分治算法的步骤分:递归地将问题分解为

2020-08-19 13:07:14 123

原创 【机器学习算法】线性回归

目录线性回归1. 定义与公式2. 线性回归API线性回归的损失和优化1. 损失函数2. 优化算法 -- 正规方程梯度下降法欠拟合和过拟合正则化线性模型线性回归1. 定义与公式线性回归(Linear regression) 是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点: 只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。通用公式:h(w)=w1x1+w2x2+w3x3+...+b=wTx+bh(w) = w_1

2020-08-14 22:41:37 389

原创 【公式推导】正规方程

线性代数基础:假设向量A=[abcd]A = \begin{bmatrix} a & b & c & d \end{bmatrix}A=[a​b​c​d​],则AT=[abcd]A^T = \begin{bmatrix} a\\ b\\ c\\ d \end{bmatrix}AT=⎣⎢⎢⎡​abcd​⎦⎥⎥⎤​A2=A∗AT=[abcd]∗[abcd]A^2 = A * A^T = \begin{bmatrix} a & b & c & d \end{.

2020-08-13 13:36:24 593

原创 【机器学习算法】K-近邻算法 (KNN)

目录K-近邻算法简介Scikit-learnk近邻算法api距离度量1. 欧式距离(Euclidean Distance)2. 曼哈顿距离(Manhattan Distance)3. 切比雪夫距离 (Chebyshev Distance)4. 闵可夫斯基距离(Minkowski Distance)5 标准化欧氏距离 (Standardized EuclideanDistance)6. 余弦距离(Cosine Distance)7. 汉明距离(Hamming Distance)8. 杰卡德距离(Jaccard

2020-08-11 20:34:15 815

原创 【Python】类与对象

目录类与对象1. 对象 = 属性 + 方法2. self 是什么?3. Python 的魔法方法4. 公有和私有5. 继承6. 组合7. 类、类对象和实例对象8. 什么是绑定?9. 一些相关的内置函数(BIF)类与对象1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。【例子】

2020-08-11 07:01:46 152

原创 【Python】函数与Lambda表达式

目录函数1. 函数的定义2. 函数的调用3. 函数文档4. 函数参数7. 函数的返回值8. 变量作用域内嵌函数闭包递归Lambda 表达式1. 匿名函数的定义2. 匿名函数的应用练习题:函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数返回值是函数1. 函数的定义函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个

2020-08-10 21:22:47 285

原创 【Pandas】电影数据分析案例

目录1 需求2 实现2.1 问题一:2.2 问题二:2.3 问题三:1 需求现在我们有一组从2006年到2016年1000部最流行的电影数据,数据来源:https://www.kaggle.com/damianpanek/sunday-eda/data问题1:我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么获取?问题2:对于这一组电影数据,如果我们想rating,runtime的分布情况,应该如何呈现数据?问题3:对于这一组电影数据,如果我们希望统计电影分类(genre)的

2020-08-07 00:20:09 4118 1

原创 【Pandas】分组与聚合

目录1 什么是分组与聚合2 分组API3 星巴克案例3.1 数据获取3.2 进行分组聚合学习目标应用groupby和聚合函数实现数据的分组与聚合1 什么是分组与聚合分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况交叉表与透视表也有分组的功能,所以算是分组的一种形式,只不过他们主要是计算次数或者计算比例。2 分组APIDataFrame.groupby(key, as_index=False)key:分组的列数据,可以多个案例:不同颜色的不同笔

2020-08-06 22:39:38 339

原创 【Pandas】交叉表与透视表

目录1 交叉表与透视表作用2 crosstab(交叉表) & pivot_table(透视表)3 案例3.1 数据准备3.2 查看效果3.3 pivot_table(透视表)实现4 小结学习目标应用crosstab和pivot_table实现交叉表与透视表1 交叉表与透视表作用探究股票的涨跌与星期几有关?以下图当中表示,week代表星期几,1,0代表这一天股票的涨跌幅是好还是坏,里面的数据代表比例可以理解为所有时间为星期一等等的数据当中涨跌幅好坏的比例2 crosstab(交叉

2020-08-06 21:47:55 414

原创 【Pandas】数据离散化与合并

目录1 数据离散化1.1 离散化1.2 案例a. 数据分组b. 哑变量矩阵(one-hot)2 数据合并2.1 pd.concat实现数据合并2.2 pd.merge实现数据合并3 小结学习目标应用cut、qcut实现数据的区间分组应用series.value_counts()统计分组次数应用get_dummies实现数据的one-hot编码应用pd.concat实现数据的合并应用pd.merge实现数据的合并1 数据离散化1.1 离散化为什么要数据离散化连续属性

2020-08-05 11:20:56 519

原创 【Pandas】缺失值处理

目录1 缺失值处理1.1 如何处理nan1.2 电影数据的缺失值处理a. 判断缺失值是否存在b. 存在缺失值nan,并且是np.nanc. 不是缺失值nan,有默认标记的2 小结学习目标说明Pandas的缺失值类型应用replace实现数据的替换应用dropna实现缺失值的删除应用fillna实现缺失值的填充应用isnull和notnull判断是否有缺失数据NaN1 缺失值处理1.1 如何处理nan判断数据是否为NaN:pd.isnull(df)pd.notnul

2020-08-05 09:36:58 365

原创 【Python】字典集合和序列

目录字典1. 可变类型与不可变类型2. 字典的定义3. 创建和访问字典4. 字典的内置方法字典1. 可变类型与不可变类型序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。字典是 Python 唯一的一个 映射类型,字符串、元组、列表属于序列类型。那么如何快速判断一个数据类型 X 是不是可变类型的呢?两种方法:麻烦方法:用 id(X) 函数,对 X 进行某种操作,比较操作前后的 id,如果不一样,则 X 不可变,如果一样,则

2020-08-04 22:57:27 718 1

原创 【Pandas】文件读取与存储

目录1. CSV1.1 read_csv1.2 to_csv1.3 案例2. HDF52.1 read_hdf2.2 to_hdf3. JSON3.1 read_json3.2 to_json4. 拓展学习目标了解Pandas的几种文件读取存储操作应用CSV方式和HDF方式实现文件的读取和存储我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。注:最常用的HDF5和CSV文件

2020-08-04 18:34:21 616

原创 【Pandas】DataFrame运算

目录数据预处理1. 算术运算2. 逻辑运算2.1 逻辑运算符号<、 >、|、 &2.2 逻辑运算函数3 统计运算3.1 describe()3.2 统计函数4 累计统计函数5 自定义运算学习目标算术运算【掌握】逻辑运算【知道】1.逻辑运算符号2.逻辑运算函数对象.query()对象.isin()统计运算【知道】1.对象.describe()2.统计函数3.累积统计函数自定义运算【知道】apply(func, axis=0)

2020-08-04 17:32:41 608

原创 【Pandas】索引赋值和排序

目录1. 索引操作2. 赋值操作3. 排序学习目标记忆DataFrame的形状、行列索引名称获取等基本属性应用Series和DataFrame的索引进行切片获取应用sort_index和sort_values实现索引和值的排序预处理为了更好的理解这些基本操作,我们将读取一个真实的股票数据。import pandas as pd # 读取文件data = pd.read_csv("./data/stock_day.csv")# 删除一些列,让数据更简单些,再去做后面的操作

2020-08-03 22:10:39 2999

原创 Matplotlib中文显示问题解决方法

中文显示问题解决方法下载 SimHei 字体Jupyter中输入以下代码找到路径import matplotlibmatplotlib.matplotlib_fname()注意:D:\\Anaconda\\lib\\site-packages\\matplotlib\\mpl-data\\matplotlibrc第一个反斜线\表示转义字符,删除即可用记事本打开matplotlibrc文件,按住Ctrl+F搜索The font.size,在该行前面输入以下代码fon

2020-08-03 10:44:12 369

原创 【Pandas】Pandas与DataFrame

目录1. Pandas介绍1.1 Pandas处理案例2. DataFrame2.1 DataFrame结构2.2 DataFrame属性2.3 DatatFrame索引的设置2.3.1 修改行列索引值2.3.2 重设索引2.3.3 以某列值设置为新的索引1. Pandas介绍专门用于数据挖掘的开源python库便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计算1.1 Pandas处理案例import pandas as pd # 导入pandasim

2020-08-02 11:12:21 578

原创 【Python】列表元组与字符串

学习目标列表列表的定义列表的创建向列表中添加元素删除列表中的元素获取列表中的元素列表的常用操作符列表的其他方法练习题列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class '

2020-07-30 21:20:36 341

原创 【Python】异常处理

异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。学习目标Python标准异常总结Python标准警告总结try - except 语句try - except - finally 语句try - except - else 语句raise语句练习题1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardErro

2020-07-28 18:03:00 144

原创 【Python】条件循环结构

学习目标条件语句if 语句if - else 语句if - elif - else 语句assert 关键词循环语句while 循环while - else 循环for 循环for - else 循环range( ) 函数enumerate( ) 函数break 语句continue 语句pass 语句推导式综合例子练习题1. 条件语句1.1 if 语句if expression: expr_true_suiteif 语句的 exp

2020-07-25 00:08:49 285

原创 【Python】变量、运算符、数据类型及位运算

学习目标变量、运算符与数据类型注释运算符变量和赋值数据类型转换print( )函数练习题位运算练习题1. 变量、运算符与数据类型1.1 注释PythonC++/Java单行注释#//多行注释''' ''' 或者 """ """/* */# 这是一个注释print("Hello world") # Hello world'''这是多行注释,用三个单引号'''"""这是多行注释,用三个双引号"""''' '

2020-07-24 22:53:48 906 1

原创 NLP学习实践天池赛Task2

NLP天池赛Task1数据读取与数据分析学习目标数据读取数据分析句子长度分析新闻类别分布字符分布统计数据分析的结论本章小结本章作业数据读取与数据分析 本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。学习目标 学习使用Pandas读取赛题数据分析赛题数据的分布规律数据读取 赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。1. imp

2020-07-23 23:14:41 161

原创 NLP学习实践天池赛Task1

NLP天池赛Task1赛题理解学习目标赛题数据数据标签评测指标数据读取解题思路赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。学习目标 理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路赛题数据 赛题以匿名处理后的新闻数据为赛题数据,数据集报名

2020-07-23 21:08:54 128

原创 XShell连接不上虚拟机Linux解决办法

XShell连接不上虚拟机Linux解决办法Ubuntu终端没有安装SSH服务,故只需在终端输入sudo adp-get install openssh-server即可。你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

2020-05-10 19:35:47 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除