魔术师_-CSDN博客

原创 python浮点数精确计算，小数点精确计算问题

1、浮点数计算出错a=1.1b=2.2a+b 输出：出现上面的情况，主要还是因浮点数在计算机中实际是以二进制保存的，有些数不精确。比如说: 0.1是十进制，转化为二进制后它是个无限循环的数：0.00011001100110011001100110011001100110011001100110011001100而python是以双精度(64)位来保存浮点数，多余的位会被截掉，所以看到的是0.1，但在电脑上实际保存的已不是精确的0.1。【注意】这是二进制浮点数的自然性质：它不是 Pyt

2021-01-05 17:23:39 10982 6

原创 pandas中对nan空值的判断

pandas基于numpy，所以其中的空值nan和numpy.nan是等价的。numpy中的nan并不是空对象，其实际上是numpy.float64对象，所以我们不能误认为其是空对象，从而用bool(np.nan)去判断是否为空值，这是不对的。对于pandas中的空值，我们该如何判断，并且有哪些我们容易掉进去的陷阱，即不能用怎么样的方式去判断呢？可以判断pandas中单个空值对象的方式：1、利用pd.isnull(),pd.isna();2、利用np.isnan();3、利用is表达式；4、利

2020-06-30 09:46:01 29514 1

原创半小时漫画经济学2：金融危机篇-笔记

经济的定义：价值的创造、转化、实现。eg：大自然的水，经工厂消毒净化为矿泉水，卖给口渴的人。水实现了应有的价值。这就是资源配置。资源配置出现问题，经济时好时坏，就是经济周期。经济危机：产品太多。金融危机：钱太多。除了战争、天灾等特殊情况，经济危机都是金融危机引起的。美国大萧条1929年，美股崩盘，大萧条席卷世界。二战开打，军工业发达，美国国内失业解决，同时获取大量财富。亚洲金融危机97年香港回归后，98年索罗斯搞垮英国英格兰银行、泰国、马来西亚后将眼睛瞄向香港。见香港金融保卫战。美

2020-05-25 17:42:35 2797 1

原创小狗钱钱的读书笔记

第一章: 白色的拉不拉多猎狗金钱有一些秘密和规律，我是想解释给你听。但前提条件是，你自己必须真的有这个愿望，所以你必须找到十个想变得富有的理由可以在深圳买一套房子，有一套舒服的沙发可以每天玩游戏，看视频，毫无压力的看书可以买很多新衣服，化妆品可以去全国各地旅游可以下馆子不用看菜单价格可以报很多培训班学跳舞，画画，烘焙买辆车可以养娃可以去美容，除皱可以在淘宝买买买钱钱语录：金钱有一些秘密和规律，要想了解这些秘密和规律，前提条件是，你自己必须真的有这个愿望。第二章梦想储蓄罐和

2020-05-23 17:28:00 1209

原创富爸爸穷爸爸（读后感悟，书中重点）

很多东西。我不得不思考每个爸爸的建议，在我把这些建议付诸实际的同时，我认识到有一点很重要，那就是一个人的观念对他的一生影响巨大。例如，我的一个爸爸总是习惯说“我可付不起”，而另一个爸爸则禁止我们说这样的话，他坚持让我这样说：“我怎样才能付得起？”这两句话，一句是陈述句，另一句是疑问句。一句让你放弃，而另一句则促使你去想办法。一个爸爸认为，富人应该多缴税去照顾那些相对不幸的人；另一个爸爸则说：“税是惩勤奖懒。” 一个爸爸劝我：“努力学习吧，那样你就能去好公司工作。”而另一个爸爸则说：“努力学习吧

2020-05-23 17:08:30 5236

原创 Excel 划分各分数段并统计各分数段的人数

每当考试阅卷结束后，老师们都要对考试成绩进行统计，而统计各分数段人数是其中必不可少的一部分。那么怎么快速对各分数段人数进行统计呢？下面跟大家分享个简便的方法。第一种方法第一步：先添加一个辅助列，把每个人的属于哪个分数段标出来在 c 列输入公式=MAX(FLOOR(B3,{60;80;90}))向下拖动，可以求得提示：FLOOR 函数参数用来将数值向下舍入为最接近的整数，或者最为...

2020-04-08 21:44:10 14946

原创对比excel与python 的分列处理方式

Excel 分列Excel中对数据进行分列是非常简单的。如下：选中需要处理的列功能卡"数据"，“分列"按钮，即出现设置弹窗选"分隔符号”点击下一步左上部分，勾选"逗号"点击下一步最后看到结果预览，没问题，直接点击完成pandas 分列pandas对文本列进行分列，非常简单：df = pd.DataFrame({'姓名':['张三', '李四','王五'] , ...

2020-04-07 11:50:42 9340 1

原创 pandas行转列，列转行操作

需求一：将下面表格变成使用的python 代码df = pd.DataFrame({'1': {0: 'a', 1: 'a', 2: 'b',3:'b'}, '2': {0: 'A', 1: 'B', 2: 'A',3:'B'}, '3': {0: 2, 1: 4, 2: 6,3:8}})df方法一：pi...

2020-04-06 20:06:16 18269 3

原创 Mysql 获取当月和上个月第一天和最后一天

Mysql 获取当月和上个月第一天和最后一天的解决方案获取当前日期select curdate();获取当月最后一天select last_day(curdate())；获取本月的第一天select date_add(curdate(),interval -day(curdate())+1 day) ;获取下个月的第一天select date_add(curdate()-...

2020-04-02 11:46:48 9930

原创 sqlzoo练习答案--More JOIN operations（mysql）

Movie DatabaseThis tutorial introduces the notion of a join. The database consists of three tables movie , actor and casting .1、 List the films where the yr is 1962 [Show id , title ]SELECT id...

2020-03-21 16:57:51 591 1

原创将DataFrame中一列list扩展成多列

Pandas：怎样将DataFrame中一列list扩展成多列？如题，如果在dataframe中有一列是list，要怎么才能把一列list拆分成很多列呢先制造点数据import numpy as npimport pandas as pd #创建数据df=pd.DataFrame({'col':[[2,3,4], [6,9,0], [7,2,5], [3,5,6]]}, index=l...

2020-03-07 15:28:53 11064 2

原创 python 数据合并　merge , join , concat的区别

merge , join , concat的区别merge :与sql 的join类似，有left join ，right join ，outer join ，连接字段可以是索引可以是一个列join ：连接字段是索引，或者两个连接字段的列名一样。其他与merge 相同merge is a function in the pandas namespace, and it is als...

2019-05-16 21:03:21 2782

原创 MySQL 日期函数－转换时间戳

MySQL 日期函数－转换时间戳from_unixtime：unix_timestampfrom_unixtime：from_unixtime(unixtime, format))用途：将数字型的unix 时间日期值转为DE日期值参数说明：● unixtime: bigint类型，秒数，unix格式的日期时间值，若输入为string,double类型会隐式转换为bigint后参与运...

2019-05-11 16:28:09 1502

原创独热编码的应用实例

独热编码的应用实例独热编码处理OneHotEncoder只要传给OneHotEncoder 就会进行处理，自动认为是分类变量只对需要的列进行处理如果只使用LabelEncoder进行处理Labelencoder 与 OneHotEndoer 一起使用利用pandas 的get_dummies 进行处理独热编码处理from sklearn.preprocessing import Standar...

2018-12-22 09:40:46 4712

原创 numpy中argsort函数用法

argsort函数返回的是数组值从小到大的索引值x = np.array([6, 4, 5])np.argsort(x) #按升序排列array([1, 2, 0])np.argsort(-x) #按降序排列array([0, 2, 1])6,4,5从小到大排序就是4,5,6。 4的index是1 5的index是2 6的index是0 所以返回[1,2,0]a= ...

2018-05-30 16:04:51 1084

原创 Python3.0 + 机器学习实战-第二章knn例子

使用k-近邻算法快速判定她是不是你喜欢的类型？问题描述比如你的朋友经常上约会网站寻找自己的约会对象，你的朋友选定约会对象的时候主要看重三点“每年飞行的旅程数”、“玩游戏所耗时间百分比”、“每个月看书的数目”，你阅人无数的朋友已经约会过很多个对象了，并且把这些对象分为三类“她是我喜欢的类型”、“一般喜欢”，“她不是我喜欢的类型”，经过无数次的约会之后，你的朋友心已经很累了，他想能否输入某人的...

2018-05-26 10:27:37 706

原创关于假设检验

关于假设检验　　假设检验（Hypothesis Testing），或者叫做显著性检验（Significance Testing）是数理统计学中根据一定假设条件由样本推断总体的一种方法。其基本原理是先对总体的特征作出某种假设，然后通过抽样研究的统计推理，对此假设应该被拒绝还是接受作出推断。既然以假设为前提，那么在进行检验前需要提出相应的假设：　　H0：原假设或零假设（null hypothe...

2018-05-21 20:31:00 1132

原创中心极限定理-纯理解无公式

什么是中心极限定理（Central Limit Theorem）中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样，一共抽 m 次。然后把这 m 组抽样分别求出平均值。这些平均值的分布接近正态分布。也就是说：大量相互独立的随机变量，其均值（或者和）的分布以正态分布为极限意思就是当满足某些条件的时候，比如Sample Size比较大，采样次数区域无穷大的...

2018-05-18 14:05:02 13750

原创 Apriori关联分析

啤酒与尿布的故事已经成为了关联规则挖掘的经典案例，还有人专门出了一本书《啤酒与尿布》，虽然说这个故事是哈弗商学院杜撰出来的，但确实能很好的解释关联规则挖掘的原理。很多的时候，我们都需要从大量数据中提取出有用的信息，从大规模数据中寻找物品间的隐含关系叫做关联分析(association analysis)或者关联规则学习(association rule learning)。比如在平时的购物中，...

2018-05-15 16:40:36 1228

原创 Python之numpy高维索引与newaxis的用法

对于高维数组，索引位置上的元素不再是标量而是低一维的数组例子：X = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])print ('X[:, 3] : ' ,X[:, 3])print('\n' * 1) #仅仅是为了打印的时候空出一行，好看。print('X[:, 3].shape : ', X[:, 3].sh...

2018-05-11 20:43:57 1886

原创 svm 函数间隔与几何间隔的认识

在超平面w⋅x+b=0w⋅x+b=0w\cdot x+b=0确定的情况下，|w⋅x+b||w⋅x+b||w\cdot x+b|可以相对地表示点x距离超平面的远近。对于两类分类问题，如果w⋅x+b>0w⋅x+b>0w\cdot x+b>0，则xxx的类别被判定为1；否则判定为-1。所以如果y(w⋅x+b)>0y(w⋅x+b)>0y(w\cdot x+b)>0，则认为x...

2018-05-10 10:29:02 12882 10

原创 Logistic Regression（逻辑回归）原理及公式推导

逻辑回归是广义线性模型广义线性模型：是指让模型的预测值去逼近y的衍生物，譬如说，假设我们认为示例所对应的输出标记是在指数尺度上的变化，那就可以将输出标记的对数作为线性模型逼近目标，即 lny=w2x+blny=w2x+blny=w^{2}x+b更一般的考虑单调可微函数g()令y=g−1(wTx+b)y=g−1(wTx+b)y=g^{-1}(w^{T}x+b) ，这样得到的模型称为广义线性模...

2018-05-09 20:30:05 11331 1

原创 pandas中 DataFrame.align 的使用

官方文档将轴上的两个对象与每个轴索引的指定连接方法连接DataFrame.align(other, join='outer', axis=None, level=None, copy=True, fill_value=None, method=None, limit=None, fill_axis=0, broadcast_axis=None例子：data1 = pd.Data...

2018-05-09 14:21:58 13626

原创 pandas.中 Series.asof的使用

官方文档解释：最后一行不是NaN值的值（或没有NaN的最后一行只考虑DataFrame情况下的列的子集）通俗的说：假如我有一组数据，某个点的时候这个值是NaN，那就求这个值之前最近一个不是NaN的值是多少Series.asof(where, subset=None)参数:where : 日期或日期数组 subset : 字符串或字符串列表，默认为None，如果不是No...

2018-05-09 13:53:02 7338 1

原创 19. Remove Nth Node From End of List--python

题目：Given a linked list, remove the n-th node from the end of list and return its head.Example:Given linked list: 1->2->3->4->5, and n = 2.After removing the second node from the en...

2018-05-08 17:58:26 344

原创 pandas --移动窗口rolling的概念

概念:为了提升数据的准确性，将某个点的取值扩大到包含这个点的一段区间，用区间来进行判断，这个区间就是窗口。移动窗口就是窗口向一端滑行，默认是从右往左，每次滑行并不是区间整块的滑行，而是一个单位一个单位的滑行。给个例子好理解一点：import pandas as pds = [1,2,3,5,6,10,12,14,12,30]pd.Series(s).rolling(window=3...

2018-05-08 16:23:00 78739 3

原创 pandas中pivot_table透视表

官方文档pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')data : 创建透视表的dataframevalues : 要聚合的值, optional...

2018-05-07 20:11:38 5052

原创 Pandas中的map(), apply()和applymap()的应用

它们的区别在于应用的对象不同。1、map（）map() 是一个Series的函数，DataFrame结构中没有map()。map()将一个自定义函数应用于Series结构中的每个元素(elements)。例子：df = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' ...

2018-05-07 17:43:08 37944 2

原创 SQL server 中 return,break和continue的使用及例子

1、continue：重新开始 WHILE 循环。在 CONTINUE 关键字之后的任何语句都将被忽略。例子：计算1-10的偶数和DECLARE @SUM INT, @I INTSET @SUM=0SET @I =1WHILE (@I <=10) BEGIN IF (@I % 2 =1) BEGIN ...

2018-05-06 22:10:20 19235

原创 pandas 中 rank 的用法

官方文档例子：import pandas as pdimport numpy as npa = pd.DataFrame(np.arange(12).reshape(3,4),columns = list("abdc"))a =a.sort_index(axis=1,ascending=False)a1、直接rank（）a.rank()显示了排名，...

2018-05-05 21:24:47 16295

原创 python windows下导入含有中文的csv文件报错

我的数据集是这样的：有很多中文，当你用pandas导入数据的时候容易报错>>>data = pd.read_csv("C:/Desktop/watermelon3_0_Ch.csv")UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd4 in position 2: invalid continuati...

2018-05-05 16:22:43 1915 1

原创 pandas.get_dummies 的用法

get_dummies 是利用pandas实现one hot encode的方式。详细参数请查看官方文档官方文档在这里pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)[source]例子：i...

2018-05-04 17:48:19 226620 21

原创数据预处理查看重复值删除--python

python数据分析开始1、导入数据可以用pandasdata = pd.read_csv("C:/Users/Administrator/Desktop/11/lianjia.csv")2、describe可以查看数值型的信息data.describe()3、info可以查看全部列的信息data.info()4、可以用isnull查...

2018-05-04 17:13:31 18346

原创 SQL 分支语句 if...else 与 case....when

IF ....ELSE....例子：if 语句通常里面都要嵌套begin ...end DECLARE @score INTSET @score =91 IF (@score > 90) BEGIN PRINT '成绩：'+ CONVERT(varchar, @score) PRINT '判定为：A' ENDELSE BEGIN SELECT '成绩：B...

2018-05-03 17:36:52 3884

原创 SQL转换函数CAST 和 CONVERT

CAST 语法：CAST ( expression AS data_type [ ( length ) ] )CONVERT 语法：CONVERT ( data_type [ ( length ) ] , expression [ , style ] )expression 任何有效的表达式。data_type 目标数据类型。这包括 xml、bigint 和 sql_variant。不能使用别...

2018-05-03 15:37:19 636

原创 56. Merge Intervals--python

题目：解题：先将区间按照每个start的值来排序，排好序以后判断一个区间的start值是否处在前一个区间中，如果在前一个区间中，那么合并；如果不在，就将新区间添加。# Definition for an interval.# class Interval(object):# def __init__(self, s=0, e=0):# self.start = s#...

2018-05-03 11:28:28 413

原创 python中sort，sorted的用法

sort 与 sorted 区别：sort 是应用在 list 上的方法，sorted 可以对所有可迭代的对象进行排序操作。list 的 sort 方法返回的是对已经存在的列表进行操作，而内建函数 sorted 方法返回的是一个新的 list，而不是在原来的基础上进行的操作。1、内置函数sort（）原型：sort（fun，key，reverse=False）fun：是表明此sort函数是基于何种算...

2018-05-03 10:53:25 993

原创 SQL 添加约束

SQL 约束用于规定表中的数据规则。如果存在违反约束的数据行为，行为会被约束终止。约束可以在创建表时规定（通过 CREATE TABLE 语句），或者在表创建之后规定（通过 ALTER TABLE 语句）创建表的时候添加约束：CREATE TABLE table_name(column_name1 data_type(size) constraint_name,column_name2 data_...

2018-05-02 20:46:16 1176

原创 94. Binary Tree Inorder Traversal--python

题目:Given a binary tree, return the inorder traversal of its nodes' values.Example:Follow up: Recursive solution is trivial, could you do it iteratively?解题：二叉树的中序遍历，可以用递归的方式（关于中序遍历可以参考我的另一篇博客，详细介绍了中序，前...

2018-05-02 14:53:43 391

原创二叉树的前序、中序、后序遍历(及算法实现） -- python

有三种常用的模式来访问树中的所有节点。这些模式之间的差异是每个节点被访问的顺序。我们称这种访问节点方式为“遍历”。我们将看到三种遍历方式称为前序，中序，后序。让我们更仔细地定义这三种遍历方式，然后看看这些模式有用的一些例子。前序在前序遍历中，我们首先访问根节点，然后递归地做左子树的前序遍历，然后是右子树的递归前序遍历。中序在中序遍历中，我们递归地对左子树进行中序遍历，访问根节点，最后递归中...

2018-05-02 14:34:44 929

259个常用宏.xlsm

pandas 行转列、列转行.ipynb

空空如也