2020年03月_Muasci

原创 nltk corpus下载

import nltknltk.download()出现这个弹出框我要用到wordnet的提取词干，所以然后就下载好了

2020-03-31 15:29:48 542

原创支持向量机之SMO

支持向量机支持向量机一般可以分成线性可分支持向量机线性支持向量机非线性支持向量机线性可分支持向量机:什么是线性可分？超平面为什么是w*x + b = 0？考虑一个二维平面，w和x都是以原点为起点的向量，x在w上的投影长度可以写作: |x||w|cosθ，是一个定值，设为b，则 |x||w|cosθ = b。也就是说，超平面描述了一个平面，从原点出发，末尾落到该平面上的向量...

2020-03-30 22:14:18 406

原创 Strassen伪代码

Strassen(A,B):let C be a new nxn matrixif A.row == 1:C = A * Belse partition A,B,and CS1=B12-B22S2=A11-A12S3=A21+A22S4=B21-B11S5=A11+A22S6=B11+B22S7=A12-A22S8=B21+B22S9=A11-A21S10=B11+B1...

2020-03-28 23:11:41 735

感知机于1957年由Rosenblatt提出，是神经网络和支持向量机的基础。适用于二类分类的线性分类模型，通过输入特征向量，输出得到实例的类别。感知机对应于输入空间中将实例划分为正负两类的分离超平面。主要思想就是：导入基于误分类的损失函数，利用梯度下降法对损失函数最小化，求得感知机模型。在下例中，调用了鸢尾花数据集，特征集Y选取的是三类中的其中两类分类；由于想把特征可视化，选取特征集中的两类...

2020-03-27 15:12:30 273 1

原创 np.nonzero &np.count_nonzero

import numpy as nptest = np.array([[1,2,3],[2,4,5]])print(np.transpose(np.nonzero(test)).shape[0])print(np.count_nonzero(test))输出66解释：np.nonzero以元组形式返回array中非0的坐标np.count_nonzero返回array中非0项的个...

2020-03-27 13:21:17 870

转载 np.where()

参考来自massquantity的numpy.where() 用法详解

2020-03-27 13:06:12 162

原创 2020蓝桥杯第一轮模拟(暂1-9

第一题：【问题描述】在计算机存储中，15.125GB是多少MB？【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。【答】15488#include<iostream>using namespace std;int main(){ double store_num = 15.125; d...

2020-03-25 22:27:01 170

原创修饰器

def display_time(func): def wrapper(n): t1 = time.time() result = func(n) t2 = time.time() print(t2-t1) return result...

2020-03-25 16:46:03 140

原创 np.flatten()

import numpy as npa = np.array([[1,2,3],[4,5,6],[1,2,4]])print(a.flatten()) # 返回一个扁平的ndarrayb = np.mat([[1,2,3],[4,5,6],[1,2,4]])print(b.flatten()) # 返回一个扁平的matrix返回:[1 2 3 4 5 6 1 2 4][[1 2...

2020-03-25 15:03:11 877

原创 python——random.sample()

import randomdef demo(x,n): print(random.sample(x,n))demo([1,2,3,4],3)demo((1,2,3,4),3)demo(range(1,10),9)# demo({1:1,2:2,3:3},2) Population must be a sequence or set. For dicts, use lis...

2020-03-25 13:24:40 584

原创 @property

想要访问一个类的属性并且修改它下面有三种方class Demo(object): def __init__(self): self._name = "Demo" self.aim = "for fun" self.owner = "nobody" self.ownersage = 20test = Demo()pr...

2020-03-25 10:20:01 118

原创 sys、os、platform(python)

import sys# 使用的python相关信息print(sys.platform) # 解释器的系统版本print(sys.version) # 解释器版本呢print(sys.path) # 此项目的路径print(sys.getrecursionlimit()) # 最大嵌套层数import platform# 平台相关的信息print(platform.ma...

2020-03-25 08:51:40 199

原创买卖股票最佳时机1-4加注释

1:主要思想:dp(最大和子数组)class Solution(object): def maxProfit(self, prices): """ :type prices: List[int] :rtype: int """ lenth = len(prices) if lenth == ...

2020-03-16 15:28:48 157

原创 sklearnpreprocessing中scale和standardscaler的区别是什么

前言: 想要给一组特征集进行标准化处理的时候，发现以下两者都可以。import sklearn.preprocessingpreprocessing.scale(X) # X是特征集合from sklearn.processing import StandardScalerStandardScaler().fit_transform(X)看了某篇文章知道：两者都是标准化特征处理的方法...

2020-03-14 21:20:57 651

原创 standard、L1范式、线性回归(for fun)

想着standard是对数据进行预处理，那我可以选择预处理或者不预处理用L1范式对特征集进行拟合，可以得到一个稀疏的权重(里面有很多0)0代表该特征不重要，那我想试试用这个权重来预测模型，会有怎样的效果小白…暂时只用过线性回归模型，也可以拟合得到一个coef 和 intercept,想看看效果怎样第一块:没有预处理，用的是线性回归得到的参数第二块:没有预处理，用的是L1范式返回的参数第三...

2020-03-14 01:55:20 217

原创 from sklearn.linear_model import LinearRegression

前言：在线性回归中相关指数R2表示线性方程的拟合程度，拟合程度越高越好TSS(Total Sum Of Square)表示总体平方和ESS(Explained Sum Of Square)表示回归平方和RSS(Residual Sum Of Square)表示残差平方和三者关系为TSS = ESS + RSS具体公式引用参考博客中的式子:简单理解成，如果测试结果离回归线越近，也就...

2020-03-14 01:46:20 11203

原创 np.random.Normal()

np.random.normal(loc,scale,size):表示一个正态分布如图所示:loc对应的就是均值scale对应的就是标准差size可以设为一个int或者一个数组，里面的数满足正态分布如果loc = 0 scale = 1 则是一个标准正态分布把size设为10则输出十个满足标准正态分布的数import numpy as npprint(np.random.nor...

2020-03-13 23:14:40 485

转载 pd.DataFrame()

引用：pd.DataFrame()函数解析（最清晰的解释）之后结合自己的使用情况更新

2020-03-12 22:54:21 542

原创深度学习基础（不断补充

基于深度学习基础（mooc上的一门课）记录知识点，并用代码实现。打好基础，拓展地去运用不同的数据集、不同的库、不同的模型…文章目录机器学习深度学习感知机介绍支持向量机介绍深度学习基础机器学习概念：对研究问题进行模型假设，利用计算机从训练数据中学习得到模型参数。并最终对数据进行云测和分析，其基础是归纳和统计。引入：分类问题：二维分类:设定一条直线(y=w*x+b) 或设定一条曲线(...

2020-03-12 21:50:37 944

原创 2n皇后问题蓝桥杯详细注释

2n皇后问题大致题意: 两个皇后问题大致思路:递归回溯:当前行中有一位置如果能放棋子，则放，然后考虑下一行，不管最后结果怎么样，都要把当前位置放的棋子收回，考虑当前行中的下一个位置，最终得以考虑所有情况。先采用递归回溯，去求解一个n皇后问题(黑)。当n皇后(黑)求解完成，从头开始遍历数组，再求解一个n皇后问题(白)。利用取模运算的方法来对问题进行简化，即行数<n（输入的规格）时，在...

2020-03-12 11:12:46 352

原创剪枝

Sticks题目大意:乔治带着相同长度地木条，并随机地切它们，

2020-03-10 19:27:49 98

原创贪心

找零钱def fuc(n,stulst): have_lst = {25:0,50:0,100:0} # l[0]表示有用钞票的张数 for i in range(n): have_lst[stulst[i]] +=1 change = stulst[i] - 25 if change == 0: cont...

2020-03-09 09:50:12 74

原创字典树

本想了解AC自动机先掌握trie树思想来自浅谈Trie树（字典树）感谢# trie树class TrIe(object): def __init__(self): self.ise = [False for i in range(40000)] # is end? 记录是否为单词结尾 self.sum = [0 for i in range(4...

2020-03-08 20:38:40 91

原创字符串

大小写转换def fuc(n): lenn = len(n) ans = "" for i in range(0,lenn): if n[i].islower(): ans += n[i].upper() else: ans += n[i].lower() return ansn ...

2020-03-08 16:51:00 94

原创大数

阶乘:2568是因为，如果输入1000，返回值的长度是2568累加:alst比blst长是因为，运算在alst进行，可能最后有一位进位。不需要再重新开一个数组储存答案了。...

2020-03-08 16:38:02 88

原创梯度下降、L1范式

import numpy as npdef get_data(file_name): with open(file_name) as fil: X = [] X_one_line = fil.readline() while X_one_line != '': X.append([eval(i) for i in X...

2020-03-07 17:13:32 487

原创 Numpy入门

文章目录一些基础知识数组创建打印数组基本运算通函数tobecontinued一些基础知识import numpy as np# ndarray.ndim # 轴的个数，即维度的个数def basic_knowledge(arraY): print("ndim:",arraY.ndim) print("shape:",arraY.shape) print("size:...

2020-03-07 00:44:22 293

原创 np.set_printoptions()

超过1000会省略解决：import sysnp.set_printoptions(threshold=sys.maxsize)a = np.arange(1001)print(a)>[ 0 1 2 ... 998 999 1000]a = np.arange(1000)print(a)[ 0 1 2 3 4 5 6 7 ...

2020-03-06 23:36:33 938

原创 ny.dtype()

import numpy as npdt = np.dtype([('name',np.float64),('age',np.int32),('gender',np.float32)])a = np.array([[1,1],[1,1]],dtype = dt)print(a)>[[(1., 1, 1.) (1., 1, 1.)] [(1., 1, 1.) (1., 1, 1....

2020-03-06 22:59:18 103

原创 numpy.fromfunction

Numpy官网numpy.fromfunction¶numpy.fromfunction(function, shape, *, dtype=<class ‘float’>, **kwargs)[source]¶Construct an array by executing a function over each coordinate.The resulting array ...

2020-03-06 22:39:45 700

原创 arg,*arg,**kwargs

def fuc(arg): print(arg,type(arg))fuc(1)fuc([1])fuc({1:1})fuc((1,1))print("-"*24)def fuc2(*args): print(args,type(args))fuc2(1)fuc2([1])fuc2({1:1})fuc2((1,1))print("-" * 24)def f...

2020-03-06 21:03:46 125

原创 TF-IDF

在一类文档中，假如有a,b,c,d四篇文章。此时考虑某个词条t能否作为该类文章的特征。如果这个词条的LDF值较小，表示在此类文档中，出现词条t的文章频率很高，则词条t体现不了该类文档的特征。在多类文档中，假如有A,B,C,D四类文档。此时考虑某个词条t能否作为A类文档的特征词。如果A类文档中，这个词条的LDF值较小，表示在所有出现t的文档中，出自A类文档的文档频率很高，则其实词条t可以体现A类...

2020-03-05 12:07:05 76

原创 CCF201912-3

2020-03-03 22:47:04 273

原创模型评估流程

测试误差作为泛化误差的近似先使用某种评估方法得到训练集和测试机再使用分类器分的样本中的正例和负例然后计算评估指标，判断分类器好坏1、评估方法之训练集和测试集的确定留出法:直接将数据集划分为两个互斥集合训练集和测试集的划分要尽可能保持数据分布的一致性一般若干次随即划分、重复实验取平均值训练样本和测试样本的比例:2-1\3-1\4-1只一次，随机性太大，说服力不强k折交叉验证...

2020-03-03 22:45:41 981

原创背包问题

感谢AK龙，下面是大佬关于背包问题的链接，我只是把每一个小问题详细的分析了一遍https://blog.csdn.net/weixin_41162823/article/details/878788531、01背包问题由于小组讨论，换了些名词，背包->用来上课的时间，物品->课程，其他完全一致…问题描述选课问题，考虑有N节课，数组t[i](i = 0…N)表示第i节课的时长，...

2020-03-03 22:43:09 121

原创算法导论课后习题(部分)

2.2-2for i = 1 to n-1: minindex = i minum = ∞ for j = i to n: if A[i] <= minum: minum = A[i] minindex = i A[i] <=> A[minindex]循环不变式:考虑插入排序的循环...

2020-03-03 22:41:15 514

原创 Distributed Representations of Words and Phrases and their Compositionality翻译与感悟

paper地址:Distributed Representations of Words and Phrases and their Compositionality-Tomas Mikolov翻译:摘要最近发布的连续型Skip-gram，对于学习高质量分布式向量表述，是一个非常搞笑的模型，它描述了大量精确的语法语义方面的词语关系。在这篇论文中，我们将陈述数个延展，将会推进向量的质量和训...

2020-03-02 21:19:05 1072

jokerxsy的博客