自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 周志华西瓜南瓜书学习(二)

(一):https://blog.csdn.net/liuxingxing_sun/article/details/118713819文章目录支持向量机支持向量机

2021-07-29 17:27:12 170

原创 周志华西瓜南瓜书学习(一)

模型评估由于前两章内容比较熟悉,只简单总结一下公式评估方法留出法交叉验证法自助法性能度量1.均方误差:E(f;D)=1m∑i=1m(f(xi)−yi)2E(f;D)=\frac {1}{m}\sum_{i=1}^{m}(f(x_i)-y_i)^{2}E(f;D)=m1​i=1∑m​(f(xi​)−yi​)2更一般的,E(f;D)=∫x∽ D(f(xi)−yi)2p(x)dxE(f;D)=\int_{x\backsim\ D}(f(x_i)-y_i)^{2

2021-07-13 23:48:36 355

原创 用Django搭建个人博客

django安装与初始:https://blog.csdn.net/liuxingxing_sun/article/details/117969476?spm=1001.2014.3001.5501reference: datawhale&https://blog.csdn.net/xjm850552586/article/details/82845285文章目录创建项目创建首页HTML页面view.py配置url.py配置创建项目第一步: django_admin startproje

2021-06-27 23:15:14 686 6

原创 Django相关学习——安装与初始

文章目录Django简介创建第一个Django项目创建项目社区版pycharm遇到问题解决Django简介Django是一个高度抽象的Python Web框架,最初被设计用于具有快速开发需求的新闻类站点,目的是要实现简单快捷的网站开发。Django提供了对象关系映射(ORM, Object-Relational Mapping),可以通过Python代码来描述数据库结构。 通过数据模型语句来描述数据模型,并通过makemigrations及migrate等命令行工具自动生成数据模型迁移脚本并 自动创建

2021-06-16 23:25:29 147

原创 集成学习案例——工业蒸汽预测

文章目录学习背景简介背景介绍数据信息评价指标数据观测与初步处理数据具体处理进一步观测与特征工程模型训练学习背景简介背景介绍火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。我们如何使用以上

2021-05-23 22:27:39 840 9

原创 集成学习案例——幸福感预测

文章目录案例简介数据处理步骤集成学习lightBGMXGBoostRandomForestGradientBoostingKernelRidgeRegressor案例简介案例通过问卷调查收集而成,数据来源于国家官方的《中国综合社会调查(CGSS)》文件中的调查结果中的数据,数据来源可靠可依赖。通过使用包括个体变量(性别、年龄、地域、职业、健康、婚姻与政治面貌等等)、家庭变量(父母、配偶、子女、家庭资本等等)、社会态度(公平、信用、公共服务等等)等139维度的信息来预测其对幸福感的影响。赛题要求使用以

2021-05-18 21:48:41 378

原创 集成学习(四)——Blending和Stacking

文章目录Blending集成学习算法简介案例决策边界Blending集成学习算法简介Blending集成学习方式如下:(1) 将数据划分为训练集和测试集(test_set),其中训练集需要再次划分为训练集(train_set)和验证集(val_set);在此步骤中,总的数据集被分成训练集(80%)和测试集(20%),在这80%的训练集中再拆分训练集(70%)和验证集(30%)。因此拆分后的数据集由三部分组成:训练集80%* 70% 、测试集20%、验证集80%* 30% 。训练集是为了训练模型,

2021-05-11 23:53:28 333

原创 看完小i机器人诉苹果,惊呼这也行?

文章目录案件简介相关法律条文历次判决结果和争论焦点值得学习的切入思路案件简介“小i机器人”发明专利权无效宣告请求行政纠纷案被列为2020年中国法院10大知识产权案件之首,在经过长达8年的努力之后,最高人民法院撤销二审认定专利无效判决,维持一审判决认为小i机器人专利有效。小i机器人是中国发明专利ZL200410053749.9(一种聊天机器人系统)的权利人,改专利于2004年申请,2009年获得授权,可以以格式化语言命令机器人完成任务,或以自然语言完成聊天对话。经司法鉴定,苹果公司于2011年搭载的Si

2021-04-28 22:25:08 559

原创 集成学习(三)

集成学习(一):集成学习(二):origin from: datawhalereference:文章目录XGBoost简介构造目标函数叠加式训练泰勒级数近似定义一棵树如何寻找树的形状如何找到最优节点分裂XGBoost简介构造目标函数(1) 构造目标函数:假设有K棵树,则第i个样本的输出为y^i=ϕ(xi)=∑k=1Kfk(xi),fk∈F\hat{y}_{i}=\phi\left(\mathrm{x}_{i}\right)=\sum_{k=1}^{K} f_{k}\left(\mathr

2021-04-24 23:41:05 150

原创 天池项目——二手车预测(二)

天池项目——二手车预测(一):https://blog.csdn.net/liuxingxing_sun/article/details/115710876文章目录建模和调参线性回归岭回归Lasso回归建模和调参#读取数据import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')#reduce_mem_usage 函数通过调整数据类型,帮助我们减少数据在内存中占用的空间def

2021-04-22 15:44:45 286

原创 集成学习(二)

文章目录BoostingAdaboost简介案例算法实现BoostingAdaboost简介Boosting和Bagging所使用的分类器的类型都是一致的。在前者中,不同的分类器是通过串行训练而获得的,每个新分类器都根据已训练出的分类器的性能来进行训练。boosting通过集中关注被已有分类器错分的那些数据来获得新的分类器。Boosting分类的结果是基于所有分类器的加权求和结果。在bagging中分类器权重相等,而在boosting中,分类器的权重并不是相等,每个权重代表的是其对应分类器在上一轮

2021-04-19 15:53:51 131

原创 天池项目——二手车预测(一)

origin from: datawhale文章目录Baseline数据分析特征工程Baseline数据分析特征工程

2021-04-15 18:27:33 481

原创 集成学习(一)

origin from: datawhale文章目录投票法简介案例Bagging简介案例投票法简介投票法是一种少数服从多数原则的集成学习模型。通过多个模型的集成降低方差,从而提高模型的鲁棒性。理想情况下,好的预测效果应当优于任何一个基模型的预测效果。对于回归模型来说,投票法最终的预测结果是多个其他回归模型预测结果的平均值。对于分类模型,硬投票法预测结果是多个模型预测结果中出现次数最多的类别;软投票对各类预测结果的概率进行求和,最终选取概率之和最大的类标签。在投票法中,我们还需要考虑到不同的基模型可

2021-04-14 22:01:05 133 1

原创 特征工程基础知识(二)

特征工程基础知识(一):https://blog.csdn.net/liuxingxing_sun/article/details/110539139这里写目录标题分类变量one-hot编码虚拟编码效果编码处理大型分类变量特征散列化分箱计数最小计数图无界计数各自优缺点使用PCA(主成分分析)挤压数据非线性特征化与K-均值模型堆叠K-均值聚类分类变量变量是用来表示类别或者是标记的,大型分类变量如id值,Ip地址等。one-hot编码虚拟编码One-hot编码的问题是它允许有k个自由度,而变量本身

2021-04-12 21:25:07 219

原创 Solidity固定位数数组转字符与逻辑运算

啊啊啊,不好意思,我真的做不出来,搜了好多也做不出来啊,球球公布答案吧!!!bytestostringpragma solidity ^0.4.0;contract bytes32tostring{ bytes10 testword=0x68656c6c6f776f726c64; //为helloworld function bytes32ToString(bytes32 _bytes32) public pure returns (string memory)

2021-03-20 12:29:54 147

原创 爬虫的法律风险

作为一名Python学习者,对python在爬虫方面的应用一直有兴趣,然而大家都说“爬虫爬的好,牢饭吃得早”, 但是招聘网站也一直有招爬虫工程师,那么在法律层面,什么程度的爬虫是在允许范围,什么程度是不可触碰呢?如果因为爬取的内容触犯法律,后果该由爬虫程序员还是公司来承担呢?有可能构成侵犯著作权在各地法院、检察院关于互联网案件的示范案例中,不少爬虫案例都作为示范案例出现。比如《2019年度检察机关保护知识产权典型案例》中安徽许某、王某侵犯著作权案,被告人用爬虫软件非法采集复制他人文字作品上传个人运

2021-03-07 19:23:48 1799

原创 重装解决jupyternotebook kernel error

jupyter突然一直报错,不得已只好重装,记录一下:1. 先进prompt卸载:pip install pip-autoremovepip-autoremove jupyter -y2. 安装jupyterPip install jupyter3. 配置文件地址输入 jupyter notebook --generate-config 回车:然后会显示当前文件夹,进入文件夹找到jupyter_notebook_config.py,定位到#c: NotebookApp.noteboo

2021-03-01 19:48:15 310

原创 剑指Offer习题重建二叉树

```pythonclass Solution: def buildTree(self, preorder: List[int], inorder: List[int]) -> TreeNode: def recur(root,left,right): if left>right: return #递归终止 node=TreeNode(preorder[root]) #根节点为前序遍历.

2021-02-01 19:58:54 79

原创 Leetcode习题反转字符串

python反转字符串class Solution: def reverseString(self, s: List[str]) -> None: """ Do not return anything, modify s in-place instead. """ l=0 r=len(s)-1 while l<r: s[l],s[r]=s[r],s[l]

2021-01-29 10:46:40 93

原创 Leetcode习题删除链表中的节点,除自身以外的乘积等

删除链表中的节点class Solution: def deleteNode(self, node): """ :type node: ListNode :rtype: void Do not return anything, modify node in-place instead. """ node.val=node.next.val node.next=node.next.next除自身以外数

2021-01-28 21:49:25 63

原创 Leetcode习题2的幂,二叉树的最近公共祖先

2的幂class Solution: def isPowerOfTwo(self, n: int) -> bool: return n>0 and n&(n-1)==0二叉搜索树的最近公共祖先class Solution: def lowestCommonAncestor(self, root: 'TreeNode', p: 'TreeNode', q: 'TreeNode') -> 'TreeNode': ancestor=

2021-01-27 22:04:11 84

原创 Leetcode习题数组中的第K个最大值

数组中的第K个最大值 class Solution: def findKthLargest(self, nums: List[int], k: int) -> int: n=len(nums) target=n-k left=0 right=n-1 while True: index=self.partition(nums,left,right) if inde

2021-01-26 22:39:22 128

原创 Leetcode习题相交链表,多数元素,反转链表

相交链表class Solution: def getIntersectionNode(self, headA: ListNode, headB: ListNode) -> ListNode: h1,h2=headA,headB while h1!=h2: h1=h1.next if h1 else headB h2=h2.next if h2 else headA return h1多数元素

2021-01-25 19:39:00 54 1

原创 Leetcode习题LRU缓存机制,排序链表,最小栈

LRU缓存机制class ListNode: def __init__(self,key=None,value=None): self.key=key self.value=value self.prev=None self.next=Noneclass LRUCache: def __init__(self, capacity: int): self.capacity=capacity

2021-01-23 23:44:06 105

原创 Leetcode习题只出现一次的数字,环形链表I,II

只出现一次的数字class Solution: def singleNumber(self, nums: List[int]) -> int: return reduce(lambda x,y: x^y, nums) #XOR环形链表 class Solution: def hasCycle(self, head: ListNode) -> bool: if not head or not head.next: retu

2021-01-22 22:44:49 85 1

原创 Leetcode习题买卖股票最佳时期,二叉树最大路径和

买卖股票的最佳时期class Solution: def maxProfit(self, prices: List[int]) -> int: inf=int(1e9) minprice=inf maxProfit=0 for prices in prices: maxProfit=max(prices-minprice,maxProfit) #动态规划,遍历边更新边求差值 mi

2021-01-21 11:19:01 114

原创 Leetcode习题合并两个有序数组,格雷编码等

合并两个有序数组class Solution: def merge(self, nums1: List[int], m: int, nums2: List[int], n: int) -> None: """ Do not return anything, modify nums1 in-place instead. """ p1,p2=m-1,n-1 #倒指针 p=m+n-1 while p1

2021-01-20 19:42:00 88

原创 Leetcode习题不同路径,爬楼梯,子集

不同路径class Solution: def uniquePathsWithObstacles(self, obstacleGrid: List[List[int]]) -> int: f=[[1]*n]+[[1]+[0]*(n-1) for _ in range(m-1)] #设置为1的边界和路径 print(f) for i in range(1,m): for j in range(1,n):

2021-01-19 22:48:21 73

原创 Leetcode习题螺旋矩阵,旋转链表

螺旋矩阵class Solution: def spiralOrder(self, matrix: List[List[int]]) -> List[int]: if not matrix: return [] m=len(matrix) #行 n=len(matrix[0]) #列 layer_num=(min(m,n)+1)//2 #有多少层 res_list=[] #保持结果 for l

2021-01-18 23:59:59 113

原创 知识图谱Neo4j相关——Cypher查询

Cypher Query LanguageIntroduction to CypherGet started: nodes, relationships, variables, properties, patternsQuerying with Cypher: match, returnUpdating: create, update, deleteFiltering Query ResultsControlling Query ProcessDates, datetimes, and durations

2021-01-17 23:04:00 460

原创 Leetcode习题字符串相乘,全排列,最大自序和

字符串相乘class Solution: def multiply(self, num1: str, num2: str) -> str: if num1=="0" or num2=="0": return "0" m,n=len(num1),len(num2) ansArr=[0]*(m+n) for i in range(m-1,-1,-1): #从m-1开始,逐一递减,递减至-1的前面那个元素的值

2021-01-17 22:05:00 98

原创 Leetcode习题合并K个排序链表,旋转排序数列等

合并K个排序链表class Solution: def mergeKLists(self, lists: List[ListNode]) -> ListNode: n=len(lists) if not lists: return else: return self.merge(lists,0,n-1) def merge(self, lists, L, R): if

2021-01-16 21:55:15 48

原创 Leetcode习题最接近的三数之和,有效的括号,合并两个有序链表

最接近的三数之和class Solution: def threeSumClosest(self, nums: List[int], target: int) -> int: nums.sort() n=len(nums) bestNum=nums[0]+nums[1]+nums[2]for i in range(n-2): L=i+1 R=n-1 while L<R:

2021-01-15 23:25:52 62

原创 自然语言处理NPL

Word2VecWord vectors我们将为每个单词构建一个稠密的向量,使得它能够与相似文本里的词向量相近,word meaning 作为一种神经词向量,在我们对向量空间进行可视化:注:word vector 有时也叫做 word embedding 或者 word representations,他们都是一种表示结构。Word2vec:OverviewWord2vec(Mikolov et al. 2013) 是一种学习词向量的框架,包含大量的文本语料,固定词表中的每一个单词由一个词向量表

2021-01-15 23:20:52 749

原创 Leetocde习题三数之和,盛最多水容器等

三数之和:双指针+排序+遍历class Solution: def threeSum(self, nums: List[int]) -> List[List[int]]: res=[] nums.sort() for i in range(len(nums)-2): if(nums[i]>0): return res #空值 if(i>0 and n

2021-01-13 21:46:55 72

原创 Neo4j | Python Driver

from :www.neo4j.comfrom neo4j import GraphDatabaseimport loggingfrom neo4j.exceptions import ServiceUnavailableclass App: def __init__(self, uri, user, password): self.driver = GraphDatabase.driver(uri, auth=(user, password)) def clo

2021-01-13 21:41:35 328

原创 Pycharm导入ahocorasick模块的快捷方法

运行kpqa需要一个模块叫ahocorasick,提示需要装visualc++builder,但是实际上不需要,在pycharm终端输入以下语句:anaconda search -t conda pyahocorasick然后执行:conda install -c https://conda.anaconda.org/conda-forge pyahocorasickyes or no选y就可以使用问答系统了...

2021-01-12 22:43:50 1273

原创 Leetcode习题整数反转,字符串转整数等

整数反转class Solution: def reverse(self, x: int) -> int: ans=0 INTMAX10 = 214748364 INTMIN10 = -214748364 while x: pop=x%10 if x>0 else x%-10 x=x//10 if x>0 else int(x/10) if ans>INTMAX10 or (ans=

2021-01-12 22:25:20 107

原创 Leetcode习题两数相加,最长回文子串等

两数相加方法一:class Solution: def twoSum(self, nums: List[int], target: int) -> List[int]: n = len(nums) for i in range(n): for j in range(i + 1, n): if nums[i] + nums[j] == target: return

2021-01-11 18:09:31 74

原创 Windows安装jdk和Neo4j

Windows下安装jdk和Neo4j下载和配置jdk1.下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html配置java环境变量​ 1.我的电脑 --> 右键属性 --> 高级系统设置 --> 环境变量–>添加(1) JAVA_HOME =E:\software\Java\jdk1.8.0_171(JDK的根目录)(2) CLA

2021-01-11 17:53:30 228

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除