Python
文章平均质量分 71
羊羊猪
彼此心比天高 怎能没进步
展开
-
Anaconda安装nbextensions
nbextensions 是 Jupyter 非常好的插件,它是将一系列 js 脚本嵌入到 Jupyter 中,增强 Jupyter 的交互式体验,可以让你的 Jupyter 变得非常强大。原创 2023-04-28 12:50:14 · 2573 阅读 · 1 评论 -
Python连接SQL Server
使用Python连接SQL Server进行取数操作。输出:DataFrame。原创 2023-03-24 03:39:25 · 633 阅读 · 0 评论 -
dataframe排序 pd.rank()
pandas.DataFrame.rankpandas.DataFrame.rank 官方文档DataFrame.rank(axis=0, method=‘average’, numeric_only=NoDefault.no_default, na_option=‘keep’, ascending=True, pct=False)参数解释axis: axis=0为按行排名,axis=1为按列排名method: 如何对具有相同价值(即领带)的记录组进行排序:numeric_only: 对于原创 2022-03-31 16:09:07 · 5076 阅读 · 0 评论 -
Python+statsmodels实现多元线性回归和泊松回归
statsmodels是python中专门用于统计学分析的包,它能够帮我们在模型未知的情况下来检验模型的线性显著性更多回归模型见:statsmodels-formula-api在建立回归方程前首先导入库import statsmodels.api as smimport statsmodels.formula.api as smffrom statsmodels.formula.api import ols #加载ols模型from statsmodels.formula.api import原创 2022-03-13 14:53:55 · 6261 阅读 · 0 评论 -
dataframe行列索引设置与转换
1. 获取行列索引Exampledf = pd.DataFrame([('bird', 389.0), ('bird', 24.0), ('mammal', 80.5), ('mammal', np.nan)], index=['falcon', 'parrot', 'lion', 'monkey'], columns=原创 2022-03-04 02:28:09 · 15246 阅读 · 0 评论 -
开发过程最全的正则表达式匹配中英文、字母和数字
在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。1、匹配中文:[\u4e00-\u9fa5]2、英文字母:[a-zA-Z]3、数字:[0-9]4、匹配中文,英文字母和数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$同时判断输入长度:[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}5、(?!_) 不能以_开头(?!.*?_$) 不能以_结尾[a-zA-Z0-9_\u4e0转载 2022-02-17 18:22:20 · 3520 阅读 · 0 评论 -
DataFrame实现模糊查询
Example1. contains函数str 包含XXattr[attr.a_attr_single.str.contains('外套')]str以XX开头# 正则表达式attr[attr.a_attr_single.str.contains('^普通')]str以XX结尾# 正则表达式attr[attr.a_attr_single.str.contains('衬衣$')]2. startwith / endwith函数# 以XXX开头attr[attr.原创 2022-02-13 13:11:38 · 1045 阅读 · 0 评论 -
【Python】Pandas DataFrame 一维表二维表的转换
目录 一、stack & unstackunstack 将一维表转换为二维表stack 将二维表转换为一维表 二、pivot & meltpivot 将一维表转换为二维表melt将二维表转换为一维表 Tips 用pandas处理数据,我们经常获取...转载 2022-02-12 01:36:23 · 3248 阅读 · 0 评论 -
dataframe, series, list, dictionary, array之间互相转换
Example1. Dataframedataframe → series# dataframeseries_col1 = pd.seriesprint(series_col1)print(type(series_col1))dataframe → arrayarray = df.valuesprint(array)print(type(array))dataframe → listlists = df.values.tolist()print(lists)print(原创 2022-02-10 21:27:04 · 4271 阅读 · 0 评论 -
pandas.replace的用法
1. pandas.replace()介绍pandas.Series.replace 官方文档Series.replace(to_replace=None, value=NoDefault.no_default, inplace=False, limit=None, regex=False, method=NoDefault.no_default)to_replace: 需要替换的值value:替换后的值inplace: 是否在原数据表上更改,默认 inplace=Falselimit:向原创 2022-02-09 20:13:51 · 19962 阅读 · 2 评论 -
python获取list/字典的交集、并集和差集
1. ListExamplea = list([1, 3, 5, 2, 10])b = list([1, 4, 5, 10, 20])1.1 set运算符法# 求交集list(set(a) & set(b)) # [1, 10, 5]# 求并集list(set(a) | set(b)) # [1, 2, 3, 4, 5, 10, 20]# 求差集# a有而b没有list(set(a) - set(b)) # [2, 3]# b有而a没有list(set(b) - set原创 2022-02-09 02:38:46 · 3003 阅读 · 0 评论 -
pandas行和列的获取
dataframe行和列的获取分三个维度行和列选取:df[],一次只能选取行或列区域选取:df.loc[], df.iloc[],可以同时为行或列设置筛选条件单元格选取:df.at[], df.iat[],准确选取某个单元格先随机生成一个dataframeimport numpy as npimport pandas as pddf = pd.DataFrame(np.random.randn(10,5), index=list('abcdefghij'), columns=list('原创 2022-02-08 17:59:42 · 6324 阅读 · 0 评论 -
动手学数据分析之模型搭建和评估
本文为个人复现GitHub项目Hands-on data analysis第二章第四节的练习记录参考教材:《Python for Data Analysis》数据来源 Kaggle-Titanic,Hands-on data analysis三、模型搭建和评估3.1 模型搭建导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom IPython.原创 2021-06-23 23:18:35 · 585 阅读 · 0 评论 -
pandas行/列删除
pandas.DataFrame.drop()函数介绍官方文档:pandas.DataFrame.dropDataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors=‘raise’)labels: 要删除的行标签/列标签axis:默认取0删除行,取1删除列index:删除行(labels, axis=0 is equivalent to index=labels原创 2022-02-03 23:32:40 · 7060 阅读 · 0 评论 -
Pandas日期处理
做数据处理的时候有时候需要对日期进行处理或计算下面给出几种常见的日期处理和运算日期数据类型转换有时候我们拿到的日期是Object类型,这时我们需要先把日期数据转换成时间类型df2['Date'] = pd.to_datetime(df2['DATE'])df2.Date.dtypes提取日期中的信息(输出为int类型)# 提取日期中的年/月/日/小时/分钟df2['year'] = pd.to_datetime(df2['comment_Date']).dt.yeardf2['ye原创 2022-01-09 23:48:37 · 2764 阅读 · 0 评论 -
NRC Lexicon获取8种情绪
emotion analysis中往往会使用词典的方法获取句子的情绪这里使用Python和NRC词典获取句子的8种情绪总量NRC词典下载链接:NRC Word-Emotion Association Lexicon# load libraries for emotion analysisimport nltkfrom nltk.stem.snowball import SnowballStemmerfrom tqdm import tqdm_notebook as tqdmfrom tqdm原创 2022-01-07 16:16:29 · 2083 阅读 · 0 评论 -
Markdown中使用emoji
在Markdown中使用一些表情符号可以突出重点,增加趣味性,也能使文档更美观 ????但在Markdown中直接复制粘贴emoji只会显示黑白的表情图案,如果想显示彩色的emoji,则要利用表情符号所对应的编码插入emoji语法ode;emoji code 查询链接:Full Emoji List, v14.0表情对应的 Unicode 编码为 U+1F4BB,则与此表情对应的 CODE 为 1F4BB示例:💻 Start Coding...原创 2022-01-07 16:02:11 · 441 阅读 · 0 评论 -
动手学Python数据分析之数据可视化
本文为个人复现GitHub项目Hands-on data analysis第二章第四节的练习记录参考教材:《Python for Data Analysis》数据来源 Kaggle-Titanic,Hands-on data analysis二、数据可视化《利用Python进行数据分析·第2版》第9章 绘图和可视化2.7 Matplotlib & Seanborn导入numpy、pandas以及matplotlib包和数据import numpy as npimport pand.原创 2021-06-22 01:40:24 · 421 阅读 · 0 评论 -
Python数据分析之数据重构
本文为个人复现GitHub项目Hands-on data analysis第二章第二节的练习记录参考教材:《Python for Data Analysis》数据来源 Kaggle-Titanic,Hands-on data analysis二、数据重构???? 2.4 数据的合并首先导入 data 文件夹里的文件import numpy as npimport pandas as pd、dflp = pd.read_csv('./data/train-left-up.csv'原创 2021-06-20 01:44:52 · 732 阅读 · 0 评论 -
Python数据分析之数据清洗及特征处理
本文为个人复现GitHub项目Hands-on data analysis第二章第一节的练习记录参考教材:《Python for Data Analysis》数据来源 Kaggle-Titanic二、数据清洗及特征处理???? 2.1 缺失值观察与处理2.1.1 缺失值观察查看列数据df[['Age','Cabin','Embarked']].head()查看特征缺失值个数import numpy as npimport pandas as pddf = pd.read_原创 2021-06-17 20:38:25 · 1038 阅读 · 0 评论 -
Python数据分析之数据载入及初步观察
本文为个人复现GitHub项目Hands-on data analysis第一章的练习记录参考教材:《Python for Data Analysis》一、数据载入及初步观察1.1 载入数据1.1.1 导入numpy和pandasimport numpy as pyimport pandas as pd1.1.2 载入数据使用绝对路径载入数据df1 = pd.read_csv('/Users/[yourFilePath]/hands-on-data-analysis-master.原创 2021-06-16 02:15:56 · 487 阅读 · 0 评论