python算法实现
收集各种用python实现的算法代码
宁静_致远_
write less, do more
展开
-
pyhanlp隐马尔可夫模型(HMM)中文分词
目录1、一阶和二阶隐马尔可夫模型中文分词(hmm_cws.py)2、训练(ngram_segment.py)3、标准化评测(eval_bigram_cws.py)4、微软亚洲研究院语料库 MSR(msr.py)5、下载、移动语料库文件等(test_utility.py)6、加载语料库(demo_corpus_loader.py)备注参考文献1、一阶和二阶隐马尔可夫模型中文分词(hmm_cws.py)# - 一阶和二阶隐马尔可夫模型中文分词 -# 导入pyhan原创 2021-12-24 18:33:01 · 3461 阅读 · 1 评论 -
pyhanlp词典分词
目录1、utility.py(加载词典)2、fully_segment.py(完全切分)3、forward_segment.py(正向最长匹配)4、backward_segment.py(逆向最长匹配)5、bidirectional_segment.py(双向最长匹配)备注参考文献1、utility.py(加载词典)# 导入pyhanlp库中的所有包from pyhanlp import *# 定义加载词典函数def load_dictionary():原创 2021-12-22 19:01:39 · 1535 阅读 · 0 评论 -
图像处理4
1、单阈值图像分割# -- 灰度直方图呈现双峰时考虑单阈值图像分割 --# 导入opencv库import cv2# 从matplotlib库导入pyplot包并赋予另一个简化名pltfrom matplotlib import pyplot as plt# 读入图片(自由选择)img = cv2.imread('cameraman.tif', cv2.IMREAD_GRAYSCALE)# img = cv2.imread('cameraman_256.tif', cv2.IMREA原创 2021-12-06 00:58:00 · 2825 阅读 · 0 评论 -
图像处理3
1、图像去噪(均值滤波、高斯滤波、中值滤波)# 导入opencv库import cv2# 读取图片,前面两点表示相对路径img = cv2.imread('..\\images\\lena_noise.jpg ')# 均值滤波result_blur = cv2.blur(img, (3, 3))# 高斯滤波result_GaussianBlur = cv2.GaussianBlur(img, (3, 3), 0)# 中值滤波result_medianBlur = cv2.me原创 2021-11-24 13:58:15 · 3182 阅读 · 0 评论 -
图像处理2
1、灰度图像二值化import cv2img_input = cv2.imread('cameraman.tif', cv2.IMREAD_GRAYSCALE)# 当阈值较大时,会使得像素值低于160的像素点被划分为黑色ret, im_binary = cv2.threshold(img_input, 160, 255, cv2.THRESH_BINARY)# 显示图像cv2.imshow("input",img_input)cv2.imshow("output",im_binary)#原创 2021-11-19 23:20:02 · 2653 阅读 · 0 评论 -
学习向量量化(LVQ)的python实现
# 输入CSV文件,输出平均准确率import pandas as pdimport numpy as npfrom sklearn.model_selection import KFoldfrom sklearn.metrics import accuracy_scorefrom sklearn_lvq import LgmlvqModelif __name__ == '__main__': dataset = np.array(pd.read_csv("ionosphere.转载 2021-11-08 16:16:42 · 1123 阅读 · 0 评论 -
K-近邻(KNN)的python实现
# 输入CSV文件,输出平均均方根误差import pandas as pdimport numpy as npfrom sklearn.model_selection import KFoldfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.preprocessing import MinMaxScalerdef rmse_metric(actual, predicted): sum_err = 0.0.转载 2021-11-08 15:57:46 · 169 阅读 · 0 评论 -
分类与回归树(CART)的python实现
# 输入csv数据集,输出平均准确率import pandas as pdimport numpy as npfrom sklearn.model_selection import KFoldfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.metrics import accuracy_scoreif __name__ == '__main__': dataset = np.array(pd.read_cs.转载 2021-11-08 13:11:34 · 284 阅读 · 0 评论 -
引导聚合算法(装袋;bagging)的python实现
# 输入csv格式的数据集,输出模型的平均准确率import pandas as pdimport numpy as npfrom sklearn.model_selection import KFoldfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.metrics import accuracy_scorefrom sklearn.ensemble import BaggingClassifierif __n.转载 2021-11-08 13:01:23 · 458 阅读 · 0 评论 -
反向传播算法(BP)的python实现
# 输入csv格式的数据集文件,输出平均准确率 #import pandas as pdimport numpy as npfrom sklearn.model_selection import KFoldfrom sklearn.neural_network import MLPClassifierfrom sklearn.metrics import accuracy_scorefrom sklearn.preprocessing import MinMaxScalerimport.转载 2021-11-07 23:31:15 · 205 阅读 · 0 评论 -
python元组、字典
目录元组:字典:1、元素值获取:取出的都是值2、字典元素的增加:(1)setdefault:第一个参数为字典的键,第二个参数是键对应的值(2)update:接受的是一个字典对象(3)通过键索引增加元素3、字典元素的删除:(1)pop:删除指定的键值对(2)popitem:删除任意一个键值对(3)clear:清空字典元素4、字典元素的修改:(1)update:对已有的键值进行修改(2)取而代之法:替换(3)取出某个键对应的值:(4)取出字典中的所原创 2021-11-01 13:31:17 · 210 阅读 · 0 评论 -
python列表
列表:[元素];可变类型;有顺序,下标从0开始;元素可以是不同的数值类型,也可以是不同的数据结构目录1、正向单索引:取列表中的某个元素;从左到右2、负向单索引:从右向左取元素3、切片索引:按固定步长连续取出多个元素;默认步长为1;区间左开右闭4、无限索引:第一个冒号是指从第一个元素开始获取;第二个冒号是指到最后一个元素结束(包含最后一个元素)5、列表元素的增加:(1)append:在列表的尾部增加元素,每次只能增加一个元素(2)extend:列表末尾一次可增加多个元素;要将元原创 2021-10-31 19:13:01 · 528 阅读 · 0 评论 -
利用python进行AdaBoost模型预测
以信用卡违约数据为例,该数据集来源于UCI网站,一共包30 000条记录和25个变量,其中自变量包含客户的性别、受教育水平、年龄、婚姻状况、信用额度、6个月的历史还款状态、账单金额以及还款金额,因变量y表示用户在下个月的信用卡还款中是否存在违约的情况(1表示违约,0表示不违约)。Python代码如下:(1)导入python自带包以及第三方包import pandas as pdimport matplotlib.pyplot as pltfrom sklearn import model_原创 2021-10-25 21:47:58 · 3134 阅读 · 4 评论