自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 POJ 1029 false coin

POJ 1029 false coin题目链接 一堆硬币中有且仅有一枚假币,假币质量与其他币不等,根据给出的等式或不等式,判断哪一枚是假币,也有可能无法判断是否有假币 等式两边的必须是真币 不等式中一定有假币,且每一个不等式中,假币只会一直在大于的那边或者一直在小于的那边 normal set 记录正常的币,light 数组记录币在不等式中小的次数,heavy 数组记录币在不等式中大的次数 light/heavy中次数 = 不等式次数的,且不在normal set中的,且只有1个币符合这两个条件,那么

2020-09-03 23:14:50 424

原创 爬虫(三):数据解析(XPath语法&贴吧爬虫)

学习获取响应后如何从响应中提取我们需要的数据 响应内容的分类 结构化数据 ***json***用于解析的模块 json模块 re模块 jsonpath模块 xml 现在用得比较少了,因为要写开闭标签,传输数据比较大 re模块 lxml模块 非结构化数据 html re模块:速度快 lxml模块:速度中等 beautifulsoup模块:可以接收xpath,正则,css选择器,速度慢 pyquery:css选择器 xml与html的区别 html是超文本标记语言,xml是可扩展标记语言,样子和html很像

2020-09-03 19:33:45 776

原创 爬虫(二):requests模块

requests模块简介 用于发送请求、获取响应,有很多替代模块,比如urllib,但requests代码简洁易懂 requests在底层实际上封装了urllib 知识点 headers参数 发送带参数的请求 headers中携带cookie cookies参数的使用 cookieJar的转换方法 超时参数timeout 代理参数proxies 使用verify参数忽略CA证书 发送post请求 使用requests.session状态保持 模块的文档 文档中需要着重学习的部分: 学习路径 安装模块(

2020-08-30 17:40:15 461

原创 机器学习知识点补充

基础概念 偏差与方差 概念: 偏差是预测值的期望与真实值的差距,差距越大,越偏离真实数据 方差是预测值的与期望值的距离,距离越大,代表分布越离散 偏差与方差用于衡量模型泛化误差的两个方面: 偏差用于描述模型的拟合能力 方差用于描述模型的稳定性 导致偏差和方差的原因: 偏差通常是对学习算法做了错误的假设,比如模型复杂度不够,通常偏差可以在训练误差上体现 方差通常是优于模型复杂度过高造成,导致过拟合,通常方差体现在测试误差上 深度学习中的偏差与方差: 神经网络的学习能力很强,所以训练误差一般较小

2020-08-29 14:14:46 336

原创 爬虫(一):爬虫基础

基本介绍 网络爬虫是模拟客户端(主要是浏览器)发送请求/接收响应,自动抓取互联网信息的程序 没有明确的法律法规,尽量不要采集个人信息 原则上,只要是客户端能做的事情,爬虫都能做 爬虫只能获取客户端所能展示的数据 学习路径 requests模块非常重要,需要掌握 selenium可以实现非常简单但能用的爬虫 反爬机制 mongodb只需要知道怎么用mongodb以及怎么与python交互 scrapy爬虫框架 appium用于手机的数据采集 爬虫的作用 数据采集(用于机器学习舆情监控/数据挖掘) 软

2020-08-28 22:39:44 1108

原创 LaTex报错:Environment keywords undefined

\begin{keywords} Cluster \end{keywords} 报错Environment keywords undefined,在\begin{document} 前面加一句 \\providecommand{\keywords}[1]{\textbf{\textit{Index terms---}} #1} 用来定义keyword,然后就能 参考:https://tex.stackexchange.com/questions/137291/latex-error-environme

2020-08-27 21:20:35 8908

原创 re中match(),search(),findall()区别

match如果不是一开头就匹配到的话,就返回None,如果从一开头就匹配到,就返回1个 search只要匹配到1个就返回 findall匹配所有 import re m = re.match("de","deupoadesa") print(m.group()) print("m的类型:",type(m)) print("m.group()的类型:",type(m.group())) s = re.search("de","8723deupoadesa") print(s.group()) print("s

2020-08-26 23:31:50 251

原创 约瑟夫环

约瑟夫环 N个人坐成一个圆环(编号为1 - N),从第1个人开始报数,数到K的人出列,后面的人重新从1开始报数。问最后剩下的人的编号。 例如:N = 3,K = 2。2号先出列,然后是1号,最后剩下的是3号。 (2 <= N, K <= 10^6) 方法一:超时 每出一个人,就要把出的人后面的人提到前面,O(n^2) 每次出人的序号(p+m-1)%n #include <bits/stdc++.h> using namespace std; int maxlen = 1e6; vec

2020-08-22 20:13:32 315

原创 算法笔记(一):C++语法特性

C++基本语法 起名不要和库函数冲突,比如prev,next,count,sort endl可以清空缓存区,cf交互题有可能需要清空 C++中char * 和 string: char* 是指针,可以指向一个字符串数组,使用string需要包含<string>库 string的内存管理由系统进行,而char * 的内存管理由用户进行,容易出现内存不足的问题 getline():因为cin>>不接受空格,tab等空白,它从第一个非空白的字符开始读取,直到第一个空白的字符

2020-08-22 00:15:18 469

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除