数据分析Python基础篇
文章平均质量分 70
萝卜丝皮尔
统计学、管理科学与工程
展开
-
【Python代码】 局部线性回归(随机梯度下降方法)
原文在这里''' 这部分代码是lwls.py文件,基于随机梯度下降方法, 这与CSDN大部分相关文章求解正规方程(中间需要求逆)的方法不同, 这里不需要求矩阵的逆。 但是,它带来的另外一个问题是如何调参,如何找到最好的参数………… 我暂时还没找到好方法…… 欢迎留言评论 '''# Locally Weighted Linear Regression is very inefficient because Parameters are calculated again for each te原创 2021-11-24 17:17:50 · 1018 阅读 · 0 评论 -
解决pandas中boxplot函数默认添加大标题“Boxplot grouped by ”
问题:如何删除下图的“Boxplot grouped by path_num?”# 生成上图的代码fig,ax=plt.subplots(figsize=(8,6))df[df.path_num!=2].boxplot(column=['travel_time'],by='path_num',grid=False,ax=ax)plt.xlabel('path_num')plt.ylabel('travel_time')plt.title('晚高峰')解决:添加fig.suptitle(''原创 2021-04-05 12:54:12 · 1664 阅读 · 1 评论 -
解决:如何转换pandas的Series中的时间数据单位(默认为ns)
官方指导文档,很详细# 我想把 t 的时间单位(毫秒)转换成 秒# t is a SeriestOut[84]: 0 0 days 00:01:341 0 days 00:04:062 0 days 00:02:553 0 days 00:13:594 0 days 00:01:15Name: time_diff, dtype: timedelta64[ns]t.astype('timedelta64[s]')Out[85]: 0 94.01翻译 2021-03-29 11:42:24 · 776 阅读 · 0 评论 -
【cookbook pandas】学习笔记 chap 11. Combining Pandas Objects
Introductiona wide variety of options are available to combine two or more DataFrame or Series together;the append method is the least flexibility and only allows for new rows to be appended to a DataFrame.the concat method is very versatile and can com原创 2021-03-27 14:24:17 · 802 阅读 · 0 评论 -
【cookbook pandas】chapter 9 grouping by continuous variables ,etc.
calculating weighted mean SAT scores per state with applysomething about ‘.apply’ methodthe groupobject has four methods that accepts a function (or functions ) to perform a calculations on each group.these four methods are .agg,.filter,.transform, an原创 2021-03-26 17:50:32 · 231 阅读 · 0 评论 -
【cookbook pandas】学习笔记 chapter9 grouping,aggregation,filtration,and transformation
unleash its powers 释放它的力量introduction# perform the simplest aggregation involving only a single grouping column, a single aggregation column, ad a single aggregation function# Task: find the average arrival delay for each airline# pandas has differen原创 2021-03-25 22:33:13 · 216 阅读 · 0 评论 -
【cookbook pandas】Chap 8 Index Alignment
the uninitiated 无经验的人,门外汉in-depth 彻底的,深入的when Series or DataFrame are combined , each dimension of the data automatically aligns on each axis first before any computation happens.原创 2021-03-24 14:15:09 · 237 阅读 · 0 评论 -
【cookbook pandas】chapter7 Filtering Row
filter or subset data in pandas with Boolean indexing;Boolean indexing (also known as Boolean selection) refers to selecting rows by providing a Boolean array , a pandas Series with the same index, but a True or False for each rowinformative 提供有用信息的,给予知识原创 2021-03-23 10:31:29 · 282 阅读 · 0 评论 -
【cookbook pandas】学习笔记第六章
Selecting Subsets of Dataevery dimension of data in a Series or DataFrame is labeled in the index object.it is this index that separates pandas data structures from Numpy’s n-dimension array.indexes provide meaningful labels for each rows and column of原创 2021-03-21 12:40:16 · 388 阅读 · 0 评论 -
【CookBook pandas】学习笔记第五章 Exploratory Data Analysis
dive more into … 深入讨论exploratory data analysis , the process of sifting through the data and trying to make sense of the individual columns and the relationships between them.literally 简直,差不多what is ‘parsing dates’……divine more about the dataobject原创 2021-03-20 16:56:08 · 383 阅读 · 0 评论 -
【cookbook-pandas】学习笔记 Time Series Analysis
由于机器故障,我辛辛苦苦抄半下午的都木有了……然而,笔记还是要做的。chapter7 Time Series Analysisunderstanding the difference between Python and pandas date tools关于参数error:原创 2021-03-18 19:30:08 · 454 阅读 · 0 评论 -
【pandas cookbook学习笔记】Chap3&4
Chapter3: Creating and Persisting DataFrames[102/627]id=list(range(1,5))fruit=list('abcd')import pandas as pd# by default, pandas will create a RangeIndex for our DataFrame data=pd.DataFrame({'id':id,'fruit':fruit})dataOut[7]: id fruit0 1原创 2021-03-14 14:47:27 · 218 阅读 · 0 评论 -
【pandas cookbook学习笔记】第一、二章
2021/3/8《MySQL必知必会》【180/254】存储过程(procedure)被保存在服务器上以供使用。存储过程(有点像MySQL的函数)的创建、删除、调用。存储过程并不显示结果,而是把结果返回给你指定的变量。它不能通过一个参数返回多个行和列;MySQL中的变量全部都是以@开头,展示变量用select @variable1_name,@variable2_name;存储过程的价值体现在业务规则和智能处理。declare total decimal(8,2)定义变量total;cr原创 2021-03-13 09:07:50 · 216 阅读 · 0 评论 -
numpy学习1.0
按某课程写的,非原创 import numpy as npdef main(): lst=[[1,2,3,4,5],[3,4,5,6,7]] np_lst=np.array(lst,dtype=float) print(type(lst)) print(type(np_lst)) print(np_lst.shape) print(np_lst.size)...翻译 2019-07-10 09:21:27 · 132 阅读 · 0 评论 -
numpy学习 4.0
来自 北京理工大学 嵩天老师的视频教程《Python数据分析与展示》,在 中国MOOC 可以找到。#2019/07/13'''数值计算库:SciPy 符号计算库:SymPy 绘图库:Matplotlib np.arange(n) '''numpy库中的函数除了arange()生成整数型浮点数组之外,其余差不多都是浮点数类型,因为科学计算需要np.ones(shap...转载 2019-07-13 22:34:16 · 156 阅读 · 0 评论 -
numpy学习2.0
import numpy as npdef main(): st=[[[1,2,3,4],[4,5,6,7]], [[7,8,9,10],[10,11,12,13]], [[14,15,16,17],[18,19,20,21]]] lst=np.array(st) print('lst:') print(lst) print('Sum:') p...原创 2019-07-10 12:13:42 · 167 阅读 · 0 评论 -
numpy学习 5.0
接 numpy4.0学习 内容****PART ONEnp.rint(x) --计算数组各元素的四舍五入值np.modf(x) --返回各元素的整数值、小数值np.cos(x) np.cosh(x) --计算数组各元素的普通型和双曲线型三角函数np.exp(x) --计算各元素的指数值np.sign(x) --计算数组各元素的符号值(-1,0,1)****PART TWO ...翻译 2019-07-14 23:35:08 · 146 阅读 · 0 评论 -
numpy学习3.0
矩阵+线性代数的种种基础函数很像Matlab,但稍稍复杂了些,在定义矩阵的时候。import numpy as npfrom numpy.linalg import *def main(): eye=np.eye(3) #生成三阶的单位矩阵 print(eye) m=np.array([[1,2],[3,4]]) print('Inv:') print(inv(m))#...翻译 2019-07-11 10:57:19 · 137 阅读 · 0 评论 -
Matplotlib绘图基础学习1.0---绘制子图
借鉴于 FINTHON.comaxes轴方法import matplotlib.pyplot as pltimport numpy as npfig,axes = plt.subplots(2,2) #定义分成四块#利用轴指定子图fig_one = axes[0,0]fig_two = axes[0,1]fig_three = axes[1,0]fig_four = axes[...翻译 2019-07-11 18:04:42 · 144 阅读 · 0 评论 -
Pandas库学习(2)
资料来源:Python数据分析与展示-MooC ,北京理工大学,嵩天老师数据排序方法一:在指定轴上根据索引排序,默认升序.sort_index(axis=0,ascending=True)>>> import pandas as pd>>> import numpy as np>>> b = pd.DataFrame(np.aran...原创 2019-08-08 22:58:34 · 95 阅读 · 0 评论 -
matplotlib库pyplot子库学习笔记
资料来源:中国MooC_Python数据分析与展示 北京理工大学——嵩天老师作此笔记,添加了些自己的注释。matplotlib中pyplot的基础图标函数首先引入库:import matplotlib.pyplot as pltplt.psd(x , NFFT=256 , pad_to, Fs) #绘制功率谱密度图plt.specgram(x, NFFT=256, pad_to, F...原创 2019-08-10 09:49:31 · 675 阅读 · 0 评论 -
Pandas库学习(1)
观看中国MooC_教学视频Python数据分析与展示 北京理工大学——嵩天老师作此笔记。 *******Pandas#官网平台:http://pandas.pydata.orgimport pandas as pd#两个数据类型:一维数据类型:Series; 多维数据类型:DataFrame#各类操作:基本操作、运算操作、特征类操作、关联类操作Pandas与Numpy的对比:...原创 2019-08-10 10:43:03 · 119 阅读 · 0 评论 -
Numpy学习---字符串处理
学习时,借鉴正常处理字符串的几个基本函数,较容易掌握1.add()import numpy as np#caes1: stringsprint(np.char.add('multiple\t'v,'alue')) #相接不留痕# multiple value #case2: arrayprint(np.char.add(['aaa','bbb'],['ccc','ddd'])) #...翻译 2019-07-12 22:50:34 · 982 阅读 · 0 评论