python
抽象带篮子
大可不必了解我,看我笑话就好
展开
-
数据处理note
1.df[df.isnull().values == True].drop_duplicates()查看空值行的具体情况2.df.duplicated()等于True则为重复数据3.df[df.duplicated() == True].drop_duplicates()查看重复数据情况4.drop_duplicates方法是对DataFrame格式的数据,去除特定列下面的重复行。返回DataFrame格式的数据5.已知一堆日期求确定年月日:data.iloc[:, -1].apply(lambda原创 2022-02-10 19:52:23 · 426 阅读 · 0 评论 -
python实现pagerank
实验数据集:如下图所示:import numpy as np# M表示转移矩阵 x0表示初始向量 d表示阻尼因子一般取0.85,epsilon表示误差,n表示结点的个数,N表示迭代次数(默认为500)def pagerank(M, x0, epsilon, n, N=500, d=0.85): i, num = 1, 0 x = np.empty([n, 0]) x = np.append(x, x0, axis=1) A = d * M + (1 - d) /原创 2021-07-07 17:03:25 · 421 阅读 · 2 评论 -
python主成分分析法
数据集如下:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport mathpd.set_option('display.unicode.ambiguous_as_wide', True)pd.set_option('display.unicode.east_asian_width', True)plt.rcParams['font.sans-serif'] = ['Arial Unicode M原创 2021-07-07 17:01:12 · 2636 阅读 · 0 评论 -
python实现adaboost算法
数据集为:代码实现:import pandas as pdimport numpy as npimport math# 导入初始数据data = [(0, 1, 3, -1), (0, 3, 1, -1), (1, 2, 2, -1), (1, 1, 3, -1), (1, 2, 3, -1), (0, 1, 2, -1), (1, 1, 2, 1), (1, 1, 1, 1),原创 2021-04-30 00:13:24 · 474 阅读 · 0 评论 -
python实现弗洛伊德(Floyd)
示例如下:import pandas as pdimport numpy as npdata = [(0, 1, 12, np.inf, np.inf, np.inf), (np.inf, 0, 9, 3, np.inf, np.inf), (np.inf, np.inf, 0, np.inf, 5, np.inf), (np.inf, np.inf, 4, 0, 13, 15), (np.inf, np.inf, np.inf, n原创 2021-04-18 23:57:13 · 455 阅读 · 3 评论 -
python实现迪杰斯特拉(Dijkstra)算法
示例如下:import pandas as pdimport numpy as npdata = [(0, 1, 12, np.inf, np.inf, np.inf), (np.inf, 0, 9, 3, np.inf, np.inf), (np.inf, np.inf, 0, np.inf, 5, np.inf), (np.inf, np.inf, 4, 0, 13, 15), (np.inf, np.inf, np.inf, n原创 2021-04-17 16:45:22 · 2138 阅读 · 0 评论 -
python 感知机
x1 = (3,3) y1=1x2 = (4,3) y2 = 1x3 = (1,1) y3 =-1import pandas as pdimport numpy as npa = [1, 2, 3, 4]x = [(3, 3, 1), (4, 3, 1), (1, 1, -1)]data = pd.DataFrame(x, index=[1, 2, 3], columns=["x0", "x1", "类别"])print(data)w = np.transpose原创 2021-03-24 23:56:38 · 108 阅读 · 0 评论 -
matplotlib解决中文乱码问题
在代码中插入import matplotlibfont = { 'family': 'SimHei', 'weight': 'bold', 'size': 12}matplotlib.rc("font", **font)原创 2021-02-03 12:11:09 · 70 阅读 · 0 评论 -
python 拉格朗日插值法
import pandas as pdfrom scipy.interpolate import lagrangeinputfile = r'missing_data.xls'outputfile = r'new.xlsx'df = pd.read_excel(inputfile, header=None)print(len(df))print(len(df.columns))def ployinterp_column(s, n, k=5): y = s.reindex(li原创 2021-02-02 19:23:47 · 307 阅读 · 0 评论 -
python使用正则表达式查找Word文件中AABB形式的词语
安装Python扩展库python-docx,然后读取一个Word文章中所有段落的文本,查找并输出其中所有AABB形式的词语,例如踏踏实实、密密麻麻、简简单单、时时刻刻import docximport refile = docx.Document("test.docx")alist = []for i in range(len(file.paragraphs)): pat1 = r'(([\u4e00-\u9fa5])\2([\u4e00-\u9fa5])\3)' if re.原创 2020-12-30 21:03:05 · 5827 阅读 · 0 评论 -
python检测密码安全强度
一般地,可以作为密码字符的主要有数字、小写字母、大写字母和几个标点符号。密码安全强度主要和字符串的复杂程度有关系,字符串中包含的字符种类越多,认为其安全强度越高。按照这个标准,可以把安全强度分为强密码、中高、中低、弱密码。其中强密码表示字符串中同时含有数字、小写字母、大写字母、标点符号这4类字符,而弱密码表示字符串中仅包含4类字符中的一种。编写程序,输入一个字符串,输出该字符串作为密码时的安全强度。import stringdef inspect(str): dig = string.digi原创 2020-12-25 15:19:36 · 6977 阅读 · 10 评论 -
验证6174
import randomimport itertoolsx=random.randint(1000,9999)print('随机出的4位整数为:%d'%x)for i in range(1,8): a=x//1000 b=x//100-10*a c=x//10-a*100-b*10 d=x-a*1000-b*100-c*10 list1=[a,b,c,d] list2=[] for j in itertools.permutations(li原创 2020-12-06 14:05:19 · 231 阅读 · 0 评论 -
python 蒙特卡洛算法求圆周率
import randomk=0sum=0n=int(input('请输入要做的实验次数:'))for i in range(n): x,y=random.uniform(-1,1),random.uniform(-1,1) if x**2+y**2<=1: k+=1 sum+=1 else: sum+=1pi=(k/sum)*4print('经过%d次实验之后所得圆周率的值为%f'%(n,pi))...原创 2020-12-06 14:04:43 · 404 阅读 · 0 评论 -
python 用列表筛选法求素数
import mathdef prime(n):alist=[x for x in range(2,n+1)]k=0for i in range(0,math.floor(math.sqrt(n+1))):m=0for j in range(2,n+1):if j%alist[k]==0 and j!=alist[k]:m+=1if j in alist:alist.remove(j)k+=1print(“所得的素数为:”,alist)n = int(input(“请输入一个大于2原创 2020-11-29 22:53:55 · 5488 阅读 · 1 评论