自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 POJ 1029 false coin

POJ 1029 false coin题目链接一堆硬币中有且仅有一枚假币,假币质量与其他币不等,根据给出的等式或不等式,判断哪一枚是假币,也有可能无法判断是否有假币等式两边的必须是真币不等式中一定有假币,且每一个不等式中,假币只会一直在大于的那边或者一直在小于的那边normal set 记录正常的币,light 数组记录币在不等式中小的次数,heavy 数组记录币在不等式中大的次数light/heavy中次数 = 不等式次数的,且不在normal set中的,且只有1个币符合这两个条件,那么

2020-09-03 23:14:50 304

原创 爬虫(三):数据解析(XPath语法&贴吧爬虫)

学习获取响应后如何从响应中提取我们需要的数据响应内容的分类结构化数据***json***用于解析的模块json模块re模块jsonpath模块xml现在用得比较少了,因为要写开闭标签,传输数据比较大re模块lxml模块非结构化数据htmlre模块:速度快lxml模块:速度中等beautifulsoup模块:可以接收xpath,正则,css选择器,速度慢pyquery:css选择器xml与html的区别html是超文本标记语言,xml是可扩展标记语言,样子和html很像

2020-09-03 19:33:45 544

原创 爬虫(二):requests模块

requests模块简介用于发送请求、获取响应,有很多替代模块,比如urllib,但requests代码简洁易懂requests在底层实际上封装了urllib知识点headers参数发送带参数的请求headers中携带cookiecookies参数的使用cookieJar的转换方法超时参数timeout代理参数proxies使用verify参数忽略CA证书发送post请求使用requests.session状态保持模块的文档文档中需要着重学习的部分:学习路径安装模块(

2020-08-30 17:40:15 319

原创 机器学习知识点补充

基础概念偏差与方差概念:偏差是预测值的期望与真实值的差距,差距越大,越偏离真实数据方差是预测值的与期望值的距离,距离越大,代表分布越离散偏差与方差用于衡量模型泛化误差的两个方面:偏差用于描述模型的拟合能力方差用于描述模型的稳定性导致偏差和方差的原因:偏差通常是对学习算法做了错误的假设,比如模型复杂度不够,通常偏差可以在训练误差上体现方差通常是优于模型复杂度过高造成,导致过拟合,通常方差体现在测试误差上深度学习中的偏差与方差:神经网络的学习能力很强,所以训练误差一般较小

2020-08-29 14:14:46 221

原创 爬虫(一):爬虫基础

基本介绍网络爬虫是模拟客户端(主要是浏览器)发送请求/接收响应,自动抓取互联网信息的程序没有明确的法律法规,尽量不要采集个人信息原则上,只要是客户端能做的事情,爬虫都能做爬虫只能获取客户端所能展示的数据学习路径requests模块非常重要,需要掌握selenium可以实现非常简单但能用的爬虫反爬机制mongodb只需要知道怎么用mongodb以及怎么与python交互scrapy爬虫框架appium用于手机的数据采集爬虫的作用数据采集(用于机器学习舆情监控/数据挖掘)软

2020-08-28 22:39:44 943

原创 LaTex报错:Environment keywords undefined

\begin{keywords} Cluster\end{keywords}报错Environment keywords undefined,在\begin{document} 前面加一句\\providecommand{\keywords}[1]{\textbf{\textit{Index terms---}} #1}用来定义keyword,然后就能参考:https://tex.stackexchange.com/questions/137291/latex-error-environme

2020-08-27 21:20:35 7200

原创 re中match(),search(),findall()区别

match如果不是一开头就匹配到的话,就返回None,如果从一开头就匹配到,就返回1个search只要匹配到1个就返回findall匹配所有import rem = re.match("de","deupoadesa")print(m.group())print("m的类型:",type(m))print("m.group()的类型:",type(m.group()))s = re.search("de","8723deupoadesa")print(s.group())print("s

2020-08-26 23:31:50 153

原创 约瑟夫环

约瑟夫环N个人坐成一个圆环(编号为1 - N),从第1个人开始报数,数到K的人出列,后面的人重新从1开始报数。问最后剩下的人的编号。例如:N = 3,K = 2。2号先出列,然后是1号,最后剩下的是3号。(2 <= N, K <= 10^6)方法一:超时每出一个人,就要把出的人后面的人提到前面,O(n^2)每次出人的序号(p+m-1)%n#include <bits/stdc++.h>using namespace std;int maxlen = 1e6;vec

2020-08-22 20:13:32 155

原创 算法笔记(一):C++语法特性

C++基本语法起名不要和库函数冲突,比如prev,next,count,sortendl可以清空缓存区,cf交互题有可能需要清空C++中char * 和 string:char* 是指针,可以指向一个字符串数组,使用string需要包含<string>库string的内存管理由系统进行,而char * 的内存管理由用户进行,容易出现内存不足的问题getline():因为cin>>不接受空格,tab等空白,它从第一个非空白的字符开始读取,直到第一个空白的字符

2020-08-22 00:15:18 338

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除