文翰翰-CSDN博客

原创模型建立和评估

模型搭建和评估import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPython.display import Imageplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号plt.rc

2020-08-28 23:19:30 303

原创查找算法

查找表考虑的基本数据结构第一类：查找有无–set元素’a’是否存在，通常用set：集合set只存储键，而不需要对应其相应的值。set中的键不允许重复第二类：查找对应关系(键值对应)–dict元素’a’出现了几次：dict–>字典dict中的键不允许重复第三类：改变映射关系–map通过将原有序列的关系映射统一表示为其他LeetCode 349 Intersection Of Two Arrays 1题目描述给定两个数组nums,求两个数组的公共元素。如nums1 = [

2020-08-26 11:23:20 180

原创 pandas数据可视化

数据可视化开始之前，导入numpy、pandas包和数据%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as plttext = pd.read_csv(r'result.csv')text.head() Unnamed: 0 PassengerId Survived Pclass N

2020-08-26 07:27:05 708

原创动态规划

动态规划动态规划常常适用于有重叠子问题和最优子结构性质的问题，动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题，我们需要解其不同部分（即子问题），再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题，例如斐波那契数列，如果运用递归的方式来求解会重复计算很多相同的子问题，利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次，具有天然剪枝的功能，从而减少计算量，一旦某个给定子问题的解已经算出，则将其记忆化存储，以便下次需要同一个子问题解之时直接查表。动态规划

2020-08-23 23:38:22 98

原创数据重构

使用concat方法将数据train-left-up.csv和train right-up.csv横向合并为一张表，并保存这张表为result_upimport numpy as npimport pandas as pdtext_left_up = pd.read_csv("data/train-left-up.csv")text_left_down = pd.read_csv("data/train-left-down.csv")text_right_up = pd.read_csv("da

2020-08-23 08:21:24 222

原创数据清洗及特征处理

第二章：数据清洗及特征处理本章我们将学习缺失值、重复值、字符串和数据转换等操作，将数据清洗成可以分析或建模的样子。2.1 缺失值观察与处理2.1.1 任务一：缺失值观察(1) 请查看每个特征缺失值个数(2) 请查看Age， Cabin， Embarked列的数据以上方式都有多种方式，所以大家多多益善import numpy as npimport pandas as pdimport osdf = pd.read_csv('train.csv') #使用相对路径载入数据df[['Age

2020-08-22 08:13:43 543

原创数据加载及探索性数据分析

载入数据数据集下载 https://www.kaggle.com/c/titanic/overviewimport numpy as npimport pandas as pdimport osdf = pd.read_csv('train.csv') #使用相对路径载入数据df.head(3) PassengerId Survived Pclass Name Sex Age

2020-08-17 10:20:36 373

原创分治法

主要思想分治算法的主要思想是将原问题递归地分成若干个子问题，直到子问题满足边界条件，停止递归。将子问题逐个击破(一般是同种方法)，将已经解决的子问题合并，最后，算法会层层合并得到原问题的答案。分治算法的步骤分：递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题)；治：将这些规模更小的子问题逐个击破；合：将已解决的子问题逐层合并，最终得出原问题的解；分治法适用的情况原问题的计算复杂度随着问题的规模的增加而增加。原问题能够被分解成更小的子问题。子问题的结构和性质与原问题一样

2020-08-17 08:35:49 109

原创 python 类与对象

对象 = 属性 + 方法对象是类的实例。换句话说，类主要定义对象的结构，然后我们以类为模板创建对象。类不但包含方法定义，而且还包含所有实例共享的数据。封装：信息隐蔽技术我们可以使用关键字 class 定义 Python 类，关键字后面紧跟类的名称、分号和类的实现。继承：子类自动共享父类之间数据和方法的机制多态：不同对象对同一方法响应不同的行动self 是什么？Python 的 self 相当于 C++ 的 this 指针。class Test: def prt(self).

2020-08-05 23:11:22 137

原创 python函数与Lambda表达式

函数还记得 Python 里面“万物皆对象”么？Python 把函数也当成对象，可以从另一个函数中返回出来而去构建高阶函数，比如：参数是函数返回值是函数函数的定义函数以def关键词开头，后接函数名和圆括号()。函数执行的代码以冒号起始，并且缩进。return [表达式] 结束函数，选择性地返回一个值给调用方。不带表达式的return相当于返回None。待续...

2020-08-02 23:10:17 81

原创 python字典、集合和序列

字典字典的定义字典是无序的键:值（key:value）对集合，键必须是互不相同的（在同一个字典之内）。dict 内部存放的顺序和 key 放入的顺序是没有关系的。dict 查找和插入的速度极快，不会随着 key 的增加而增加，但是需要占用大量的内存。字典定义语法为 {元素1, 元素2, …, 元素n}其中每一个元素是一个「键值对」-- 键:值 (key:value)关键点是「大括号 {}」,「逗号 ,」和「冒号 :」大括号 – 把所有元素绑在一起逗号 – 将每个键值对分开冒号

2020-07-31 23:51:24 249

原创 python列表、元组和字符串

列表容器数据类型列表<class ‘list’>元组<class ‘tuple’>字典<class ‘dict’>集合<class ‘set’>字符串<class ‘str’>列表的创建创建一个普通列表x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']print(x, type(x))# ['Monday', 'Tuesday', 'Wednes

2020-07-28 08:26:57 305

原创 python异常处理

Python 标准异常总结BaseException：所有异常的基类Exception：常规异常的基类StandardError：所有的内建标准异常的基类ArithmeticError：所有数值计算异常的基类FloatingPointError：浮点计算异常OverflowError：数值运算超出最大限制ZeroDivisionError：除数为零AssertionError：断言语句（assert）失败AttributeError：尝试访问未知的对象属性EOFError：没有内..

2020-07-25 10:21:00 74

原创 python 条件循环语句

if - else 语句if expression: expr_true_suiteelse: expr_false_suiteif-elif-else 语句temp = input('请输入成绩:')source = int(temp)if 100 >= source >= 90: print('A')elif 90 > source >= 80: print('B')elif 80 > source >= 60.

2020-07-23 01:59:06 235

原创 python变量，运算符，数据类型与位运算

查漏补缺保留小数后n位import decimala = decimal.getcontext()print(a)# Context(prec=28, rounding=ROUND_HALF_EVEN, Emin=-999999, Emax=999999,# capitals=1, clamp=0, flags=[], # traps=[InvalidOperation, DivisionByZero, Overflow])b = Decimal(1) / Decimal(3)pri

2020-07-20 22:26:14 156

原创 pandas 变形思维导图

2020-04-28 10:04:23 383

原创 pandas 分组思维导图

2020-04-27 05:15:00 196

原创 pandas 索引

单级索引df.loc[1103]df.loc[[1102,2304]]df.loc[2402::-1].head() #-1表示倒叙df.loc[:,['Height','Math']].head() #多列索引df.loc[1102:2401:3,'Height':'Math'].head() #联合索引df.loc[lambda x:x['Gender']=='M'].head()...

2020-04-23 23:32:12 132

原创第1章 Pandas基础

一.文章的读入和写入import pandas as pdimport numpy as npimport osos.chdir(r'文件目录') //用os.chdir 进入指定文件目录，读取相应文件df = pd.read_csv('data/table.csv')df_txt = pd.read_table('data/table.txt')df_excel = pd.read...

2020-04-20 23:48:00 112

weixin_46167028的博客