- 博客(15)
- 资源 (1)
- 收藏
- 关注
原创 朴素贝叶斯实现垃圾邮件处理
当然这份是老师写的。训练数据indexindexindex是具体数据的,文件位置。spamspamspam是垃圾邮件stopstopstop是停用词,即去掉了一些非实义动词(啊,比如,其实等)数据预处理创造一个dataframedataframedataframe结构,存储类别和训练数据所在位置。def load_data(): df = pd.read_csv('index', sep=' ', names=['spam', 'path']) df.spam = df.s
2020-05-31 16:04:26 1748
原创 决策树分类实例
数据处理数据就这样,也没啥好处理的qwqqwqqwq决策树(删减版)删减在于,用的字典。所以判断returnreturnreturn的时候少了,为了方便递归。少了启发式算法,直接用信息增益率计算信息增益def calcShannonEnt(dataSet): shannonEnt = 0 classList = [example[-1] for example in dataSet]#最后一个是类别 Set = set(classList) for x in
2020-05-31 16:02:54 749
原创 决策树
源自西瓜书基本流程训练集D={(x1,y1),(x2,y2),...,(xm,ym)}D=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\}D={(x1,y1),(x2,y2),...,(xm,ym)}属性集A={a1,a2,...,ad}A=\{a_1,a_2,...,a_d\}A={a1,a2,...,ad}过程:生成结点nodenodenode;if Dif\ Dif D中样本全部属于类别C thenC\ thenC&
2020-05-27 20:41:28 207
原创 朴素贝叶斯法
PS:PS:PS: 以下大部分基于西瓜书贝叶斯决策论是概率框架下实施决策的基本方法。贝叶斯决策论假设有NNN种可能的类别标记,即{c1,c2,...,cN}\{c_1,c_2,...,c_N\}{c1,c2,...,cN},λij\lambda_{ij}λij是将一个真实标记为cjc_jcj的样本误分类为cic_ici所产生的损失,基于后验概率P(ci∣x)P(c_i|x)P(ci∣x)可获得将样本xxx分类为cic_ici所产生的期望损失,即在样本xxx上的"条件风险":R(ci∣
2020-05-26 10:28:00 198
原创 AtCoder Grand Contest 044 B
题意n2n^2n2的网格图,对于(i,j)(i,j)(i,j),编号为(i−1)∗n+j(i-1)*n+j(i−1)∗n+j。初始图上每个格子为111,按给定顺序求出每个点到达边界的最短路,路径长度为经过的111的数量,不包括自己。计算完当前的之后,令当前格子为000使得最短路总和最小。题解这题比较巧妙,容易证明初始图的最短路,每个点加起来之后是这样的一张图。最外层是111,第二层围成一个圈是222,一直到n2\frac{n}{2}2n。我们可以分成四部分计算总和,考虑左上角,最后一行是1
2020-05-24 19:25:09 197
原创 CCPC-Wannafly & Comet OJ 夏季欢乐赛(2019)部分题解
茶颜悦色题意固定kkk的矩形,能最多框住多少个点。题解假如我们固定一个矩形,以左下角为坐标。这样子对于(a,b)(a,b)(a,b),那么能够包括到这个点的矩形左下角的范围:x∈(a−k,a),y∈(b−k,b)x∈(a-k,a),y∈(b-k,b)x∈(a−k,a),y∈(b−k,b)利用扫描线的思想,从xxx轴扫过去,每次对yyy上的区间加111,表示正方形左下角为此点的时候有多...
2020-05-23 16:41:46 207
原创 牛客练习赛64 D
【容斥原理经典题】题意第iii个物品不能放在aia_iai箱子里,求每个箱子有一个物品的方案数题解经典题目之前做了一道题,需要crtcrtcrt合并(此题)也是要考虑到容斥,那题处理方式是利用dpdpdp,因为有个类似上升子序列的递推关系,dp[i]dp[i]dp[i]表示第一个不合法的情况,之后无论怎么选都还是不合法。此题类似,g(n)g(n)g(n)表示有nnn个不合法的方案数,f(n)f(n)f(n)表示任意排列的方案数。显然如果有kkk个不合法,方案数显然为G(k)=g(k)∗f(
2020-05-23 12:17:31 203
原创 2019 ICPC Asia Yinchuan Regional H
题意保证单向路径u→vu\to vu→v,不能v→uv\to uv→u。单向边可能是负值。双向边是正值。题解缩点,可以发现是个DAGDAGDAG。对于每个点内跑dijsktradijsktradijsktra,然后再拓扑序传下去即可。但还是不够好写。我们记录每个点的拓扑序,跑dijdijdij的时候,先按拓扑序再按最短路大小进行排序,拓扑序小的优先弹出。这样就能保证优先跑完当前集合的dijdijdij,再将信息传递到下一个集合。这样子,因为负边不能回来,也就是不会出现优先弹出的点,被后面
2020-05-19 12:23:50 249
原创 2019 ICPC Asia Yinchuan Regional K
题意两个矩阵,找最大公共子矩阵题解按顺序标号位置的话,两矩阵相差得到新矩阵。可以发现,相同元素构成的子矩阵的大小即我们所要求的。容易想到,记录每个点相同部分向上最远到多少。然后枚举每一行,找一行中答案即可,n3n^3n3做法,就是枚举每一行的起点终点,维护个最小值。如何进一步优化呢,考虑到一个因素,如果以你当前位置为终点,那么你只需要知道上上个最小的位置。1、当前位置为最小2、当前位置不是最小考虑这两种情况,用单调栈即可。第二种笨方法,令当前点为最小点,计算不破坏当前点最小性质的情况,
2020-05-18 19:03:23 238
原创 斯特林数
详情见:大佬第一类斯特林数Tips : 目前只学了第一类的无符号斯特林数。只要记住是将nnn个人分配到mmm个圆桌上的方案数即可。圆桌也就是圆排列,表示无头无尾的排列,相比较正常排列的差别在于:1 2 31\ 2\ 31 2 3和2 3 12\ 3\ 12 3 1是一个排列。其递推公式即,分成两种情况:新加入的人自己到了新圆桌和分配到旧圆桌上并且挑了一个位置插入。Su(n,m)=Su(n−1,m−1)+Su(n−
2020-05-17 15:31:48 175
原创 最小割小套路
1求最小花费。即将割边当做选择,u→vu\to vu→v边割开表示不让uuu和vvv属于不同集合的花费。考虑s→a→ts \to a \to ts→a→t,如果流量是111和222,显然割左边的边,即花费111留住左边。这里在介绍,对于一个点被AAA或BBB选,容易建边。但是如果uuu和vvv之间有限制,就直接建双向边即可。[1]和[2]都可以使用。2求最大贡献即转换成总贡献−-−可以不要的最小贡献(换句话说,另一种形式的花费)洛谷P4210题意最小割问题,最大贡献。在普通问题基础上
2020-05-15 22:46:23 143
原创 中国剩余定理
参考大神问题对于一系列x mod mi=aix\ mod\ m_i = a_ix mod mi=ai,求解最小的xxx。解法首先要保证mim_imi互质,mulmulmul表示mim_imi的乘积,Mi=mulmiM_i=\frac{mul}{m_i}Mi=mimul,Mi∗ti=1(mod mi)M_i*t_i=1(mod\ m_i)Mi∗ti=1(mod mi)从而可以构造出一组解,x0=∑aiMitix_0=\s
2020-05-15 19:39:14 188 1
原创 P6514 [QkOI#R1] Quark and Strings
题意题解因为每次添加的字符都不一样,即询问的区间在之前有多少个添加的区间覆盖了,就是最长的长度。对于在询问前面的操作,计算l≤nowl,r≥nowrl\leq nowl,r\geq nowrl≤nowl,r≥nowr的操作个数。因为还要保证,在自己前面即ti<nowtt_i<nowtti<nowt。所以是个三维偏序问题,可以简单的用CDQCDQCDQ解决。比赛的时...
2020-05-05 13:51:56 318
原创 树的重心
树的重心定义:以这个点为根,那么所有的子树(不算整个树自身)的大小都不超过整个树大小的一半。性质:性质 1 :树中所有点到某个点的距离和中,到重心的距离和是最小的,如果有两个距离和,他们的距离和一样。性质 2 :把两棵树通过某一点相连得到一颗新的树,新的树的重心必然在连接原来两棵树重心的路径上。性质 3 :一棵树添加或者删除一个节点,树的重心最多只移动一条边的位置。抄的某个大佬,忘了。...
2020-05-04 11:24:07 136
原创 高数教材班复习Hint(3.1-3.6)
Chapter 3Lesson 1Hint1{Hint}^1Hint1:微分中值定理——联系函数和导数费马引理:对于邻域U(x0)U(x_0)U(x0),如果对于f(x)≤f(x0)f(x) \leq f(x_0)f(x)≤f(x0)(或f(x)≥f(x0)f(x) \geq f(x_0)f(x)≥f(x0) ),那么f′(x0)=0f'(x_0)=0f′(x0)=0罗尔定理:1...
2020-05-02 14:45:37 496
数学模板.zip
2019-10-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人