python
文章平均质量分 58
静听山水
Just do it
展开
-
classmethod和property
这种方式可以让你像访问实例属性那样访问类属性,同时保持类方法的功能。但是请注意,这种方式并不常见,而且可能会导致一些混淆,因为它将类方法的行为和属性的行为混合在一起。在大多数情况下,使用单独的类方法或直接访问类变量就足够了。,可能会想要为类级别的属性提供只读访问。通常不会一起直接使用在同一行代码中,因为它们各自的用途不同。更常见的做法是直接使用。来定义类方法,如果需要提供只读访问,则直接返回类变量。是一个只读属性,它实际上是一个类方法,通过。来定义只读类属性,那么可以考虑使用。需要注意的是,上述代码中的。原创 2024-08-09 13:59:13 · 202 阅读 · 0 评论 -
利用folium实现地理数据可视化
【代码】利用folium实现地理数据可视化。原创 2023-04-10 21:48:31 · 363 阅读 · 0 评论 -
Python正则表达式入门
python原创 2022-08-23 00:06:05 · 184 阅读 · 0 评论 -
python利用转置对多列同一行操作
python原创 2022-08-12 00:04:19 · 379 阅读 · 0 评论 -
python相关文档
python转载 2022-08-01 23:19:04 · 71 阅读 · 0 评论 -
python常用知识点手册
pyhthon转载 2022-08-01 17:44:36 · 99 阅读 · 0 评论 -
pandas官网
pandas.DataFrame.iterrows — pandas 1.3.5 documentationhttps://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iterrows.html转载 2021-12-31 22:05:27 · 1207 阅读 · 0 评论 -
python填充缺失值
df.isna().sum(). --判断每列有多少单元格缺失数据df.isnull().sum(). --判断每列有多少单元格缺失数据【Python】np.where()替换缺失值_Asher117的博客-CSDN博客_替换缺失值python做数据分析时缺失值填补、缺失值填充方法汇总 - it610.com在我们进行数据分析时,通常会遇到各种数据缺失的情况,针对这种情况我们该如何进行填补呢?1、人工填补该方法仅适用于小数据集,受个人因素影响。2、平均值填补对某一列的缺失值,采用该列的平均.转载 2021-12-31 21:35:59 · 303 阅读 · 0 评论 -
python用于日期常用的函数
1、strptimestrptime是将一个(时间)字符串解析为时间的一个类型对象,将字符串格式转为日期格式import datetimetime1 = datetime.datetime.strptime('2021-8-11', '%Y-%m-%d').date()time2 = datetime.datetime.strptime('2021-8-7', '%Y-%m-%d').date()time3 = datetime.datetime.strptime('2021-08-1原创 2021-12-12 01:29:00 · 4652 阅读 · 0 评论 -
python画累计概率密度图
for i in sorted(list(set(df['yearmonth']))): df_sort = df[df['yearmonth'] == i].groupby('cust_id')['y','pred'].sum().sort_values('y',ascending = False) df_sort['yearmonth'] = i df_sort['y_cum'] = np.cumsum(df_sort['y']) df_sort['y_.原创 2021-12-04 09:33:12 · 1620 阅读 · 0 评论 -
python中pandas常用语法
参考资料:python 判断为空nan, nullpython 一行代码 将小数变成百分数 - 知乎统计缺失情况:df.isnull().sum() --统计每列含有多少行数的null值,返回行数df.isnull().sum()/df.shape[0] --统计缺失的比例df.isnull().any() --统计所有列是否有null值,返回true\false,true代表含有null值df.is原创 2021-11-27 23:06:23 · 983 阅读 · 0 评论 -
Python正则表达式入门
Python3 正则表达式正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。本文主要阐述re包中的主要函数。在阐述re包中的函数之前,我们首先看议案正则表达式的模式,即使用特殊的语法来表示一个正则表达式。1.match函数re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。函数用法:re.match(pattern, string, flags=0)pattern: 所要匹配的正则表达式stri原创 2021-10-18 22:53:15 · 466 阅读 · 0 评论 -
更改Pandas中列的数据类型
df = pd.read_csv("somefile.csv", dtype = {'column_name' : str})df = pd.read_excel("somefile.xlsx", dtype = {'column_name_1' : str,'column_name_2' : str})原创 2021-10-12 18:16:30 · 842 阅读 · 0 评论 -
Python基于主成分分析的客户信贷评级
前言大样本的数据集固然提供了丰富的信息,但也在一定程度上增加了问题的复杂性。如果我们分别对每个指标进行分析,往往得到的结论是孤立的,并不能完全利用数据蕴含的信息。但是盲目的去减少我们分析的指标,又会损失很多有用的信息。所以我们需要找到一种合适的方法,一方面可以减少分析指标,另一方面尽量减少原指标信息的损失。变量压缩的方法非常多,但百法不离其中,其实最根本的都是**「主成分分析」(Primary Component Analysis,下简称PCA)。能够理解 PCA 的基本原理并将代码用于实际的业务案例是原创 2021-10-10 15:52:39 · 782 阅读 · 0 评论 -
【数据降维方法】使用Python实现因子分析
因子分析(factor analysis)是指研究从变量群中提取共性因子的统计技术。 因子分析是简化、分析高维数据的一种统计方法。因子分析又存在两个方向,一个是探索性因子分析(exploratory factor analysis)。另一个是验证性因子分析(confirmatory factor analysis)。探索性因子分析是先不假定一堆自变量背后到底有几个因子以及关系,而是我们通过这个方法去寻找因子及关系。验证性因子分析是假设一堆自变量背后有几个因子,试图验证这种假设是否正确。因子分析有两原创 2021-10-10 15:19:07 · 3319 阅读 · 0 评论 -
数据清洗(二):python数据清洗
python数据清洗Pandas数据清洗流程:1.数据的读写:read_csv、read_excel、to_csv to_excel2.数据的探索与描述:info、head、describe、shape、value_counts3.数据的选择与整理:df索引、列的选取、显式loc、隐式iloc、掩码、映射函数map、apply4.数据的分组:groupby5.数据的分割、合并:索引、drop、pop、del、append、concat、merge6.缺失值、异常值、重复值的处理:fillna原创 2021-10-04 12:03:52 · 2977 阅读 · 0 评论 -
数据清洗(一):拉勾网数据分析案例
1.导入数据# 导入相应的包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inline # %matplotlib inline 在这个notebook里显示图片df = pd.read_csv('data/2.lagou/lagou_recruitment.csv')df.head() Unnamed: 0原创 2021-10-03 11:33:52 · 6757 阅读 · 3 评论 -
pandas_demo
Table of Contents1 读取MySQL表格数据2 数据处理2.1 表格拼接2.2 去重2.3 异常值处理2.4 空值处理2.4.1 检查缺失值(isnull和notnull)2.4.2 填充空值2.4.3 删除全为空的列2.4.4 删除有空值的行2.5转载 2020-09-29 10:47:26 · 252 阅读 · 0 评论 -
jupyter notebook使用
m键可以让代码块切换进入Markdown实用Jupyter Notebook扩展工具原创 2020-09-25 18:09:04 · 102 阅读 · 0 评论 -
python读取dat文件
文件名 :ratings.datimport pandas as pddf = pd.read_table("C:\\Users\\Administrator\\Desktop\\ml-1m\\ratings.dat",sep = '::',header=None,engine='python')df.columns = (['user_id','item_id',"rating","timestamp"])df.head()原创 2020-09-24 20:26:12 · 15036 阅读 · 3 评论 -
python简单可视化
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinedf = pd.read_csv('Recommendation System.csv')df.head() 0 50 5 881250949 0原创 2020-09-24 18:42:24 · 243 阅读 · 0 评论 -
测试题
#导入数据import pandas as pdexcelFile = r'land_data.xlsx'data=pd.DataFrame(pd.read_excel(excelFile))#查看前5行data.head()#查看数据维度data.shape#描述性分析data.describe()#频数统计data.groupby("city_name").size()#缺失值统计data.isnull().sum()1. 统计每个城市每年土地成交的平均的单位价格原创 2020-05-31 22:44:54 · 169 阅读 · 0 评论 -
python替换某一列中的值
import pandas as pddata = pd.read_csv("C:/Users/admin/Desktop/beikezhaofang.csv")data.head() price unitprice region build_year house_type house_Size elevator floor_type原创 2020-05-19 16:24:50 · 7967 阅读 · 1 评论 -
Tableau进行问卷统计
数据来源:狗熊会–公众号,结合python和tableau,做了简单的频数统计:疫情期间学生在家情况调查分析对于下面的数据,每行都是用"┋"来隔开各个选项的,如果想提取里面的学习、睡觉等的频次,可以按照下面的步骤,其他列类似:import pandas as pd import reexcelFile = r'C:/Users/admin/Desktop/yiqing.xlsx'data=pd.DataFrame(pd.read_excel(excelFile))i=""for c i原创 2020-05-17 22:35:27 · 1168 阅读 · 0 评论 -
python 求简单定积分
在某个微信群里看到个积分题目,说是用六年级的知识解???其实根据后面运行的结果来看,手算可能不太行。import pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineimport numpy as npx1 = np.arange(-4,4,0.01)y1 = (16-x1**2)**0.5x2 = np.arange(-2,6,0.01)y2 = (16-(x2-2)**2)**0.5plt.figure(fig原创 2020-05-10 21:40:31 · 2039 阅读 · 0 评论 -
leetcode :返回特定频数的元素
import pandas as pdnums = [2,3,4,5,6,8,2,3]df = pd.Series(nums)a=[]for i in set(nums): if df.value_counts()[i]==1: a.append(i)print(a)python 列表统计元素频数、频率原创 2020-05-09 11:02:46 · 113 阅读 · 0 评论 -
菜鸟教程python测试笔记
1.优先级:not>and>or,。python的and和or优先级 - 陈浩然201 - 博客园其一, 在不加括号时候, and优先级大于or其二, x or y 的值只可能是x或y. x为真就是x, x为假就是y第三, x and y 的值只可能是x或y. x为真就是y, x为假就是x2.None 为 False,所以没有任何输出if None: prin...原创 2020-04-02 10:29:32 · 1588 阅读 · 0 评论 -
类(使用类和实例)
1.使用类和实例1.1创建Car类#创建一个表示汽车的类,存储有关汽车的信息,还有一个汇总这些信息的方法-get_descriptive_nameclass Car(): """一次模拟汽车的简单尝试""" def __init__(self,make,model,year): """初始化描述汽车的属性""" self.make ...原创 2020-03-22 17:40:09 · 247 阅读 · 0 评论 -
类的创建
1.创建类1.1创建Dog类#创建一个表示小狗的类#包含名字和年龄+蹲下和打滚#使用类去创建表示特定小狗的实例#创建Dog实例时,通过实参向Dog()传递名字和年龄,self会自动传递class Dog(): """一次模拟小狗的简单尝试""" #初始化属性name和age #获取存储在形参name中的值,并将其存储到变量name中,然后该变量被关联到当前创建...原创 2020-03-22 17:37:53 · 259 阅读 · 0 评论 -
python词性分析、词频统计
1.词性分析1.1直接输入数据from nltk import word_tokenize, pos_tagtext = "I am learning Natural Language Processing on Analytic Vidhya"tokens = word_tokenize(text)print(pos_tag(tokens))[('I', 'PRP'), ('am'...原创 2020-03-20 09:43:55 · 5097 阅读 · 0 评论 -
Python中append和extend的区别
网上有很多对这两个函数的区别讲解,但我觉得都讲的不是很清楚,记忆不深刻。这样解释清楚且容易记住。list.append(object) 向列表中添加一个对象objectlist.extend(sequence) 把一个序列seq的内容添加到列表中music_media = ['compact disc', '8-track tape', 'long playing record']...转载 2020-03-20 07:56:49 · 94 阅读 · 0 评论 -
python根据指定元素对列表,字典排序
根据第二个元素对列表排序:def takeSecond(elem): return elem[1] random=[(2, 2), (3, 4), (4, 1), (1, 3)]random.sort(key=takeSecond)print("排序列表:", random)排序列表: [(4, 1), (2, 2), (1, 3), (3, 4)]random...原创 2019-12-19 11:37:34 · 787 阅读 · 0 评论 -
python实现等量随机分组
给班上人进行分组,要求随机。import randomdef chouyang(a,n): p=True while p: b=random.sample(a,n) b.sort() #排序 print(b) a=list(set(a).difference(set(b))) #去除已抽样的数据 ...原创 2019-12-10 23:22:28 · 5343 阅读 · 0 评论 -
求圆周率
用python写了个脚本运行如下:def qiu_pi(n): a=1 for i in range(3,n+1,2): if ((i+1)/2)%2==0: a=a-(1/i) if abs(4*a-3.1415926)<(10**(-6)): print(i) ...原创 2019-12-10 13:12:29 · 124 阅读 · 0 评论 -
如何快速成为数据分析师?
没有什么牛逼的事情是能够速成的,越是底层的、收益周期越长的技能越是这样。但这并不代表,我们不能用一些有意思的方法,把学习的过程变得高效而有趣。学习一门技术之前,你应该知道,你想要达成的目标是什么样的,也就是说,你想通过这门技术来解决哪些问题。有了这个目标,你就可以知道要达成这样的目标,它的知识体系是怎么样的。更重要一点的是,每个部分是用来解决哪些问题,只有明确的目标导向,学习最有用的那部分知识,才...转载 2019-12-02 22:49:46 · 218 阅读 · 0 评论 -
python学习网址收藏
收藏了一些网址,方便借鉴。1.python可视化pyecharts官方链接:http://pyecharts.org/#/zh-cn/Github项目:http://pyecharts.herokuapp.com/博客1:https://www.cnblogs.com/jyroy/p/9446486.html博客2:http://www.cnblogs.com/crazyfo...原创 2019-12-01 21:28:50 · 158 阅读 · 0 评论 -
python进行因子分析(二)
终于可以了。。,具体原理可以参考:https://blog.csdn.net/qq_29831163/article/details/88915232import pandas as pdimport numpy as npimport numpy.linalg as nlgimport matplotlib.pyplot as pltfrom factor_analyzer i...原创 2019-12-01 10:30:37 · 13826 阅读 · 18 评论 -
python杂谈
1.list没有求和函数,可以转化为Serise,用pd.Series(list).sum()原创 2019-11-30 16:58:36 · 105 阅读 · 0 评论 -
python进行因子分析(一)
数据来源:https://www.cnblogs.com/wangshanchuan/p/10820326.html,自己把数据写进行了excel,然后用博主的代码一步步实现了下,发现博主的代码出现了一些问题,下面写下分析过程:import pandas as pdimport numpy as npimport numpy.linalg as nlgimport matplotlib...原创 2019-11-30 12:38:25 · 6642 阅读 · 9 评论 -
时间序列分析思维导图
原创 2019-11-29 20:14:42 · 2914 阅读 · 0 评论