文翰翰
码龄5年
关注
提问 私信
  • 博客:4,939
    4,939
    总访问量
  • 19
    原创
  • 2,025,188
    排名
  • 0
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:美国
  • 加入CSDN时间: 2020-01-09
博客简介:

weixin_46167028的博客

查看详细资料
个人成就
  • 获得0次点赞
  • 内容获得0次评论
  • 获得3次收藏
创作历程
  • 19篇
    2020年
成就勋章
兴趣领域 设置
  • 大数据
    spark
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

模型建立和评估

模型搭建和评估import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPython.display import Imageplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号plt.rc
原创
发布博客 2020.08.28 ·
320 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

查找算法

查找表考虑的基本数据结构第一类: 查找有无–set元素’a’是否存在,通常用set:集合set只存储键,而不需要对应其相应的值。set中的键不允许重复第二类: 查找对应关系(键值对应)–dict元素’a’出现了几次:dict–>字典dict中的键不允许重复第三类: 改变映射关系–map通过将原有序列的关系映射统一表示为其他LeetCode 349 Intersection Of Two Arrays 1题目描述给定两个数组nums,求两个数组的公共元素。如nums1 = [
原创
发布博客 2020.08.26 ·
195 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pandas数据可视化

数据可视化开始之前,导入numpy、pandas包和数据%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as plttext = pd.read_csv(r'result.csv')text.head() Unnamed: 0 PassengerId Survived Pclass N
原创
发布博客 2020.08.26 ·
733 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

动态规划

动态规划动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题,我们需要解其不同部分(即子问题),再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题,例如斐波那契数列,如果运用递归的方式来求解会重复计算很多相同的子问题,利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次,具有天然剪枝的功能,从而减少计算量,一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。动态规划
原创
发布博客 2020.08.23 ·
108 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据重构

使用concat方法 将数据train-left-up.csv和train right-up.csv横向合并为一张表,并保存这张表为result_upimport numpy as npimport pandas as pdtext_left_up = pd.read_csv("data/train-left-up.csv")text_left_down = pd.read_csv("data/train-left-down.csv")text_right_up = pd.read_csv("da
原创
发布博客 2020.08.23 ·
241 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据清洗及特征处理

第二章:数据清洗及特征处理本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的样子。2.1 缺失值观察与处理2.1.1 任务一:缺失值观察(1) 请查看每个特征缺失值个数(2) 请查看Age, Cabin, Embarked列的数据 以上方式都有多种方式,所以大家多多益善import numpy as npimport pandas as pdimport osdf = pd.read_csv('train.csv') #使用相对路径载入数据df[['Age
原创
发布博客 2020.08.22 ·
565 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

数据加载及探索性数据分析

载入数据数据集下载 https://www.kaggle.com/c/titanic/overviewimport numpy as npimport pandas as pdimport osdf = pd.read_csv('train.csv') #使用相对路径载入数据df.head(3) PassengerId Survived Pclass Name Sex Age
原创
发布博客 2020.08.17 ·
389 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

分治法

主要思想分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。分治算法的步骤分:递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题);治:将这些规模更小的子问题逐个击破;合:将已解决的子问题逐层合并,最终得出原问题的解;分治法适用的情况原问题的计算复杂度随着问题的规模的增加而增加。原问题能够被分解成更小的子问题。子问题的结构和性质与原问题一样
原创
发布博客 2020.08.17 ·
119 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 类与对象

对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。继承:子类自动共享父类之间数据和方法的机制多态:不同对象对同一方法响应不同的行动self 是什么?Python 的 self 相当于 C++ 的 this 指针。class Test: def prt(self).
原创
发布博客 2020.08.05 ·
149 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python函数与Lambda表达式

函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数返回值是函数函数的定义函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。待续...
原创
发布博客 2020.08.02 ·
91 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python字典、集合和序列

字典字典的定义字典 是无序的 键:值(key:value)对集合,键必须是互不相同的(在同一个字典之内)。dict 内部存放的顺序和 key 放入的顺序是没有关系的。dict 查找和插入的速度极快,不会随着 key 的增加而增加,但是需要占用大量的内存。字典 定义语法为 {元素1, 元素2, …, 元素n}其中每一个元素是一个「键值对」-- 键:值 (key:value)关键点是「大括号 {}」,「逗号 ,」和「冒号 :」大括号 – 把所有元素绑在一起逗号 – 将每个键值对分开冒号
原创
发布博客 2020.07.31 ·
273 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python列表、元组和字符串

列表容器数据类型列表<class ‘list’>元组<class ‘tuple’>字典<class ‘dict’>集合<class ‘set’>字符串<class ‘str’>列表的创建创建一个普通列表x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']print(x, type(x))# ['Monday', 'Tuesday', 'Wednes
原创
发布博客 2020.07.28 ·
326 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python异常处理

Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisionError:除数为零AssertionError:断言语句(assert)失败AttributeError:尝试访问未知的对象属性EOFError:没有内..
原创
发布博客 2020.07.25 ·
83 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 条件循环语句

if - else 语句if expression: expr_true_suiteelse: expr_false_suiteif-elif-else 语句temp = input('请输入成绩:')source = int(temp)if 100 >= source >= 90: print('A')elif 90 > source >= 80: print('B')elif 80 > source >= 60.
原创
发布博客 2020.07.23 ·
251 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python变量,运算符,数据类型与位运算

查漏补缺保留小数后n位import decimala = decimal.getcontext()print(a)# Context(prec=28, rounding=ROUND_HALF_EVEN, Emin=-999999, Emax=999999,# capitals=1, clamp=0, flags=[], # traps=[InvalidOperation, DivisionByZero, Overflow])b = Decimal(1) / Decimal(3)pri
原创
发布博客 2020.07.20 ·
169 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pandas 变形思维导图

原创
发布博客 2020.04.28 ·
405 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

pandas 分组思维导图

原创
发布博客 2020.04.27 ·
211 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pandas 索引

单级索引df.loc[1103]df.loc[[1102,2304]]df.loc[2402::-1].head() #-1表示倒叙df.loc[:,['Height','Math']].head() #多列索引df.loc[1102:2401:3,'Height':'Math'].head() #联合索引df.loc[lambda x:x['Gender']=='M'].head()...
原创
发布博客 2020.04.23 ·
143 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

第1章 Pandas基础

一.文章的读入和写入import pandas as pdimport numpy as npimport osos.chdir(r'文件目录') //用os.chdir 进入指定文件目录,读取相应文件df = pd.read_csv('data/table.csv')df_txt = pd.read_table('data/table.txt')df_excel = pd.read...
原创
发布博客 2020.04.20 ·
130 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多