学习笔记
文章平均质量分 61
W-S-M
这个作者很懒,什么都没留下…
展开
-
用Python写网络爬虫——学习笔记(1)
【网站背景调研】 网站自身的robots.txt/Sitemap Google/WHOIS1.检查robots.txt爬虫限制、与网站结构相关的显示如何查看robots.txt?在网站后打/robots.txt即可2.检查Sitemap 估算网站大小 大小衡量?目标网站的URL的个数1)检查Google爬虫的结原创 2017-07-21 11:53:35 · 492 阅读 · 0 评论 -
用Python写网络爬虫——学习笔记(2)
【3个简单的爬虫实例】**3种爬取网站的常用方法: 爬取网站地图(sitemap,包含了一个网站所有链接的xml格式文件) 遍历每个网页的数据库ID 跟踪网页链接下载感兴趣的网页(下载html) 为后文的三个爬虫的实现做铺垫原创 2017-07-21 10:51:14 · 715 阅读 · 0 评论 -
Python如何运行程序
程序执行的标准流程Python安装在机器上,它包含一个解释器和支持的库。Python程序开始执行之前不需要预编译和连接,大大缩短开发周期。字节码编译当Python运行脚本时,第一步需要将脚本编译成“字节码”,字节码是源代码底层的、与平台无关的表现形式,扩展名为“.py”的脚本源文件编译成扩展名为“.pyc”字节码文件,此过程对程序员是不可见的(即透明的)。如果源文件没有被修改,下一次运行程序时将自原创 2017-07-27 16:16:02 · 4968 阅读 · 0 评论 -
Python的对象类型
内置对象数字—-1234, 3.1415, 3+4j 字符串(str)—-‘spam’ 列表(list)—-[1, [2, ‘three’], 4] 字典(dict)—-{‘food’: ‘spam’, ‘taste’: ‘yum’} 元组(tuple)—-(1, ‘spam’, 4) 文件(file)—-myfile = open(‘filename’, ‘r’) 其他类型:集合(s原创 2017-07-27 18:12:27 · 432 阅读 · 0 评论 -
MATLAB--文件I/O大全(2)
文本数据I/O 函数 说明 csvread 以逗号为分隔符,将文本数据(csv文件)读入MATLAB工作区 csvwrite 以逗号为分隔符,将MATLAB工作区变量写入文本文件(csv文件) dlmread 以指定的ASCII字符为分隔符,将文本数据读入MATLAB工作区 dlmwrite 以指定的ASCII字符为分隔符,将MATLAB变量写入ASCII文本文原创 2017-11-12 21:26:02 · 523 阅读 · 0 评论 -
机器学习中的梯度下降法总结
目录什么是梯度下降法?运用梯度下降算法所面临的的挑战梯度下降法的变式梯度下降的代码实现不同梯度下降算法的选择1. 什么是梯度下降?我会以经典的登山案例来解释梯度下降的含义。假设你现在在山顶处,必须抵达山脚下(也就是山谷最低处)的湖泊。但让人头疼的是,你的双眼被蒙上了无法辨别前进方向。那么,你会采取什么办法抵达湖泊处呢?最好的办法就是查看一下周围的地势,观察有下降趋势的地面,这会帮助你迈出原创 2017-11-29 10:36:13 · 761 阅读 · 0 评论 -
在BBDM-LAB摸爬滚打的日子(1)
今天是2018年5月25日,纠正了对交叉验证的错误认识,还在努力实现AUC和AUPr的计算。 MATLAB的矩阵计算思维我还掌握不了,好难受……交叉验证,以5折交叉验证为例。 已知数据为n个links、一个反应矩阵interaction。 5折交叉验证所说的“将数据集分为5份,其中4份为训练集,另一份为测试集”,这里的“数据集”指的是links,而不是interaction。解释一下为...原创 2018-06-03 14:07:55 · 609 阅读 · 0 评论