自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(75)
  • 收藏
  • 关注

原创 深度学习之Dropout

​ dropout一大缺点就是代价函数J不再被明确定义,每次迭代,都会随机移除一些节点,如果再三检查梯度下降的性能,实际上是很难进行复查的。我通常会关闭dropout函数,将keep-prob的值设为1,运行代码,确保J函数单调递减。​ 直观上理解:不要依赖于任何一个特征,因为该单元的输入可能随时被清除,因此该单元通过这种方式传播下去,并为单元的四个输入增加一点权重,通过传播所有权重,dropout将产生收缩权重的平方范数的效果,和之前讲的L2正则化类似;

2024-11-04 14:39:44 852

原创 深度学习之学习率

​ 在梯度下降法中,都是给定的统一的学习率,整个优化过程中都以确定的步长进行更新, 在迭代优化的前期中,学习率较大,则前进的步长就会较长,这时便能以较快的速度进行梯度下降,而在迭代优化的后期,逐步减小学习率的值,减小步长,这样将有助于算法的收敛,更容易接近最优解。​ 分段常数衰减需要事先定义好的训练次数区间,在对应区间置不同的学习率的常数值,一般情况刚开始的学习率要大一些,之后要越来越小,要根据样本量的大小设置区间的间隔大小,样本量越大,区间间隔要小一点。容易训练的网络,便于较快的收敛,其更新规则如下。

2024-11-01 14:01:38 1184 2

原创 深度学习之权重、偏差

​ 将偏差初始化为零是可能的,也是很常见的,因为非对称性破坏是由权重的小随机数导致的。:因为并不知道在训练神经网络中每一个权重最后的值,但是如果进行了恰当的数据归一化后,我们可以有理由认为有一半的权重是正的,另一半是负的。​ 另一种解决未校准方差问题的方法是把所有的权重矩阵都设为零,但是为了打破对称性,每个神经元都是随机连接地(从如上面所介绍的一个小的高斯分布中抽取权重)到它下面的一个固定数量的神经元。把后两个公式代入,可以看出所得到的梯度下降法的偏导相同,不停的迭代,不停的相同,不停的迭代,不停的相同…

2024-11-01 13:55:19 1050

原创 深度学习之预训练与微调

​ 用别人的参数、修改后的网络和自己的数据进行训练,使得参数适应自己的数据,这样一个过程,通常称之为微调(fine tuning).​ 我们知道,CNN 在图像识别这一领域取得了巨大的进步。如果想将 CNN 应用到我们自己的数据集上,这时通常就会面临一个问题:通常我们的 dataset 都不会特别大,一般不会超过 1 万张,甚至更少,每一类图片只有几十或者十几张。这时候,直接应用这些数据训练一个网络的想法就不可行了,因为深度学习成功的一个关键性因素就是大量带标签数据组成的训练集。

2024-10-31 15:47:48 873

原创 深度学习之归一化

​ 以前在神经网络训练中,只是对输入层数据进行归一化处理,却没有在中间层进行归一化处理。要知道,虽然我们对输入数据进行了归一化处理,但是输入数据经过 $ \sigma(WX+b) $ 这样的矩阵乘法以及非线性运算之后,其数据分布很可能被改变,而随着深度网络的多层运算之后,数据分布的变化将越来越大。如果我们能在网络的中间也进行归一化处理,是否对网络的训练起到改进作用呢?答案是肯定的。​ 这种在神经网络中间层也进行归一化处理,使训练效果更好的方法,就是批归一化Batch Normalization(BN)。

2024-10-31 15:46:00 1346

原创 深度学习之bactch_size

​ 假如每次只训练一个样本,即 Batch_Size = 1。线性神经元在均方误差代价函数的错误面是一个抛物面,横截面是椭圆。此时,每次修正方向以各自样本的梯度方向修正,横冲直撞各自为政,难以达到收敛。因为如果数据集足够充分,那么用一半(甚至少得多)的数据训练算出来的梯度与用全部数据训练出来的梯度是几乎一样的。​ 既然 Batch_Size 为全数据集或者Batch_Size = 1都有各自缺点,可不可以选择一个适中的Batch_Size值呢?Batch的选择,首先决定的是下降的方向。

2024-10-30 20:34:25 451

原创 深度学习之激活函数

PiexpθiTx∑k1KexpθiTxPi∑k1K​expθiT​xexpθiT​x​​ 其中,$ \theta_i $ 和 $ x $ 是列向量,$ \theta_i^T x $ 可能被换成函数关于 $ x $ 的函数 $ f_i(x) $​ 通过 softmax 函数,可以使得 $ P(i) $ 的范围在 $ [0,1] $ 之间。

2024-10-30 20:33:17 1341

原创 深度学习之超参数

​超参数: 在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。1. 定义关于模型的更高层次的概念,如复杂性或学习能力。2. 不能直接从标准模型培训过程中的数据中学习,需要预先定义。3. 可以通过设置不同的值,训练不同的模型和选择更好的测试值来决定。

2024-10-29 07:30:00 394

原创 深度学习之网络与计算

​超参数: 在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。1. 定义关于模型的更高层次的概念,如复杂性或学习能力。2. 不能直接从标准模型培训过程中的数据中学习,需要预先定义。3. 可以通过设置不同的值,训练不同的模型和选择更好的测试值来决定。

2024-10-29 07:15:00 1128

原创 深度学习基础概念

​ 参数空间中学习的退化速度减慢,导致减少了模型的有效维数,网络的可用自由度对学习中梯度范数的贡献不均衡,随着相乘矩阵的数量(即网络深度)的增加,矩阵的乘积变得越来越退化。而深度学习可以从大数据中先学习简单的特征,并从其逐渐学习到更为复杂抽象的深层特征,不依赖人工的特征工程,这也是深度学习在大数据时代受欢迎的一大原因。:是一种特殊的机器学习,具有强大的能力和灵活性。梯度消失是指通过隐藏层从后向前看,梯度会变的越来越小,说明前面层的学习会显著慢于后面层的学习,所以学习会卡住,除非梯度变大。

2024-10-28 21:46:42 1068

原创 深度学习之降维和聚类

​ 选取专门用于测试分类、聚类算法的国际通用的UCI数据库中的IRIS数据集,IRIS数据集包含150个样本数据,分别取自三种不同 的莺尾属植物setosa、versicolor和virginica的花朵样本,每个数据含有4个属性,即萼片长度、萼片宽度、花瓣长度、花瓣宽度,单位为cm。​ 上图所示的只采用2个特征的线性分类器分错了一些训练样本,准确率似乎没有图2.21.1.e的高,但是,采用2个特征的线性分类器的泛化能力比采用3个特征的线性分类器要强。散落在角落的数据要比处于中心的数据难于分类。

2024-10-28 21:41:35 1332

原创 深度学习之EM算法

​ 最大期望算法(Expectation-Maximization algorithm, EM),是一类通过迭代进行极大似然估计的优化算法,通常作为牛顿迭代法的替代,用于对包含隐变量或缺失数据的概率模型进行参数估计。,则第(1)式是我们的包含隐藏数据的对数似然的一个下界。​ 考虑上一节中的(a)式,表达式中存在隐变量,直接找到参数估计比较困难,通过EM算法迭代求解下界的最大值到收敛为止。​ 第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值**;Q_i(z^{(i)}) $的期望。

2024-09-30 19:05:42 725

原创 深度学习之贝叶斯分类器

通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本出现的概率为最大,则称为极大似然估计。于是,朴素贝叶斯(Naive Bayesian,简称NB)采用了“属性条件独立性假设”:对已知类别,假设所有属性相互独立。​ 一般的根据经验想法,会猜测这只黑球最像是从2号箱取出,此时描述的“最像”就有“最大似然”的意思,这种想法常称为“最大似然原理”。​ 总结起来,最大似然估计的目的就是:利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值。是标签属性,那么我们可以通过计数的方法估计。

2024-09-30 18:45:19 1480

原创 深度学习之支持向量机

​ 支持向量:在求解的过程中,会发现只根据部分数据就可以确定分类器,这些数据称为支持向量。​ 支持向量机(Support Vector Machine,SVM):其含义是通过支持向量运算的分类器。​ 在一个二维环境中,其中点R,S,G点和其它靠近中间黑线的点可以看作为支持向量,它们可以决定分类器,即黑线的具体参数。​ 支持向量机是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是边界最大化,最终转化为一个凸二次规划问题来求解。

2024-08-12 13:45:51 1046

原创 深度学习之决策树

一个困难的预测问题,通过树的分支节点,被划分成两个或多个较为简单的子集,从结构上划分为不同的子问题。​ 思想:计算所有特征划分数据集D,得到多个特征划分数据集D的信息增益,从这些信息增益中选择最大的,因而当前结点的划分特征便是使信息增益最大的划分所使用的特征。​ 预剪枝:在决策树生成过程中,在每个节点划分前先估计其划分后的泛化性能, 如果不能提升,则停止划分,将当前节点标记为叶结点。特征个数较少时,惩罚参数较大。5、对于各类别样本数量不一致的数据,在决策树当中,信息增益的结果偏向于那些具有更多数值的特征。

2024-08-12 13:41:47 893

原创 深度学习之模型评估

它通常发生在模型过于复杂的情况下,如参数过多等,会使得模型的预测性能变弱,并且增加数据的波动性。举例来说,对于图中的第4个样本,其“Score”值为0.6,那么样本1,2,3,4都被认为是正样本,因为它们的“Score”值都大于等于0.6,而其他样本则都认为是负样本。​ 现在假设有一个训练好的二分类器对10个正负样本(正例5个,负例5个)预测,得分按高到低排序得到的最好预测结果为[1, 1, 1, 1, 1, 0, 0, 0, 0, 0],即5个正例均排在5个负例前面,正例排在负例前面的概率为100%。

2024-08-04 21:32:36 1237 1

原创 深度学习之主成分分析(PCA)

PCA就是将高维的数据通过线性变换投影到低维空间上去。投影思想:找出最能够代表原始数据的投影方法。被PCA降掉的那些维度只能是那些噪声或是冗余的数据。去冗余:去除可以被其他向量代表的线性相关向量,这部分信息量是多余的。去噪声,去除较小特征值对应的特征向量,特征值的大小反映了变换后在特征向量方向上变换的幅度,幅度越大,说明这个方向上的元素差异也越大,要保留。对角化矩阵,寻找极大线性无关组,保留较大的特征值,去除较小特征值,组成一个投影矩阵,对原始样本矩阵进行投影,得到降维后的新样本矩阵。

2024-08-04 21:00:25 1017

原创 深度学习之自然梯度法和线性判别分析

若度量模型参数变化引起的概率分布变化,常用的“距离”度量是KL散度(Kullback-Leibler divergence)。设模型概率分布为px;θp(x;\theta)px;θDKLpx;θ∣∣px;θδθ∫px;θlogpx;θpx;DKL​px;θ∣∣px;θδθ))∫px;θlogpx;θδθpx;θ​dx。

2024-05-16 15:48:05 1313

原创 深度学习基础之梯度下降

1 梯度下降1.1 机器学习中为什么需要梯度下降梯度下降是机器学习中常见优化算法之一,梯度下降法有以下几个作用:(1)梯度下降是迭代法的一种,可以用于求解最小二乘问题。(2)在求解机器学习算法的模型参数,即无约束优化问题时,主要有梯度下降法(Gradient Descent)和最小二乘法。(3)在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。(4)如果我们需要求解损失函数的最大值,可通过梯度上升法来迭代。梯度下降法和梯度上升法可相互转换。(5)

2024-05-16 15:42:53 815

原创 深度学习之损失函数

深度学习之损失函数

2024-05-13 14:29:13 903

原创 深度学习之代价函数

深度学习之代价函数

2024-05-13 14:27:37 1175

原创 深度学习基础之逻辑回归

深度学习基础逻辑回归

2024-05-10 23:25:39 858

原创 深度学习分类算法

深度学习分类算法

2024-05-10 23:23:08 1688

原创 深度学习基础之机器学习学习方式

机器学习学习方式

2024-05-08 17:43:19 536

原创 深度学习之机器学习基础

深度学习之机器学习基础1

2024-05-08 17:38:35 680

原创 深度学习数学基础之: 期望、方差、协方差、相关系数

深度学习数学基础之:期望、方差、协方差、相关系数

2024-05-07 02:29:41 592

原创 深度学习数学基础:概率论基础

深度学习数学基础之概率论

2024-05-07 02:25:20 812

原创 CentOS系统中常用的50个命令

Centos常用的50个命令,不来看看嘛》

2024-05-06 01:16:06 613

原创 深度学习数学基础:特征值和特征向量

深度学习数学基础之特征值和特征向量

2024-05-06 01:02:43 419

原创 深度学习之数学基础:偏导数

深度学习数学基础---偏导数

2024-05-06 00:59:34 1132

原创 NPM从浅入深

npm详解

2024-05-05 19:55:12 265 1

原创 深度学习数学基础1

深度学习 数学基础1

2024-05-05 18:10:00 987

原创 浅谈深度学习

天天总是在下载安装CUDA和CUDNN,他们居然是这样的

2024-05-05 13:36:11 1053

原创 win下Ubuntu 18.10 双系统安装及深度学习GPU配置

还在为Ubuntu+win 双系统安装发愁吗?深度学习GPU配置不会配置嘛?

2024-05-04 21:05:37 1981

原创 用GPU加速深度学习:

GPU加速深度学习,别再踩坑了,快来看

2024-05-04 15:26:41 731 1

深度学习 人脸动漫风格最强模型AnimeGAN PyTorch版本

## PyTorch Implementation of [AnimeGANv2](https://github.com/TachibanaYoshino/AnimeGANv2) **Updates** * `2021-10-17` Add weights for [FacePortraitV2](#additional-model-weights). [![Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/bryandlee/animegan2-pytorch/blob/main/colab_demo.ipynb) ![sample](https://user-images.githubusercontent.com/26464535/142294796-54394a4a-a566-47a1-b9ab-4e715b901442.gif) * `2021-11-07` Thanks to [ak92501]

2024-11-30

深度学习 c++ yolo

# DAMO YOLO C++ ![](https://github.com/tinyvision/DAMO-YOLO/raw/master/assets/logo.png) This is an industrial application which do inference on the DAMO YOLO tiny models. Be note, this repo contains source code inference DAMO in C++ via our own DL framework, but didn't include DL framework it-self. You gonna need link our static lib, **Linux version will be supported soon**. Currently, we only support **test on windows**. ![](https://jihulab.com/mingliu/pics/-/raw/main/pictures/2023/03/2

2024-11-30

计算机毕业设计:c++ 深度学习 yolo

# DAMO YOLO C++ ![](https://github.com/tinyvision/DAMO-YOLO/raw/master/assets/logo.png) This is an industrial application which do inference on the DAMO YOLO tiny models. Be note, this repo contains source code inference DAMO in C++ via our own DL framework, but didn't include DL framework it-self. You gonna need link our static lib, **Linux version will be supported soon**. Currently, we only support **test on windows**. ![](https://jihulab.com/mingliu/pics/-/raw/main/pictures/2023/03/2

2024-11-30

计算机毕业设计:java+进销存+企业进销存管理系统

企业进销存管理系统使用说明书 配置源程序 附加数据库SQL Server 2000 (1)将TM\01\Database文件夹中的扩展名为db_JXC_Data.MDF和db_JXC_Log.LDF的两个文件拷贝到SQL Server安装路径下的Data文件夹中。 (2)打开SQL Server 2000中的“企业管理器”,然后展开本地服务器,在“数据库”数据项上单击鼠标右键,在弹出的快捷菜单中选择“所有任务”/“附加数据库”菜单项。 (3)将弹出“附加数据库”对话框,在该对话框中单击【】按钮,选择所要附加数据库的db_JXC_Data.MDF文件,单击【确定】按钮,即可完成数据库的附加操作。 发布与运行 (1)将光盘\TM\01\JXCManager文件夹拷贝到Eclipse的工作空间中。 (2)启动Eclipse。 (3)选择“文件”/“导入”菜单项,展开“常规”节点,选择“现有项目到工作空间中”子节点

2024-11-26

计算机毕业设计:JAVA+爬虫

一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习

2024-11-26

计算机毕业设计:VB+学校用电收费管理系统

目 录 引 言…………………………………………………………………………………1 一 系统分析………………………………………………………………………………2 ㈠ 业务流程分析……………………………………………………………………………2 ㈡ 功能模块划分……………………………………………………………………………2 1 功能介绍…………………………………………………………………………………2 2 档案管理…………………………………………………………………………………3 3 通知管理…………………………………………………………………………………4 4 抄表系统…………………………………………………………………………………5 5 查询系统…………………………………………………………………………………6 6 报表系统…………………………………………………………………………………7 7 交费系统…………………………………………………………………………………8 8 维护系统…………………………………………………………………………………9 9 辅助功能……………………………

2024-11-20

计算机毕业设计:小城西+企业OA小程序

# mobile attendance ## 多语言支持相关数据结构 ### 语言相关全局变量 > Sample Code ```js //app.js App({ onLaunch: function () { //进入应用时检查语言设置 var language = wx.getStorageSync('selectedLanguage'); if(language){ this.globalData.settings.language = language; }else{ //TODO 使用系统语言设定 user-info COUNTRY this.globalData.settings.language = 0; //暂时默认为中文 }, globalData:{ settings:{ language: null }, userInfo:null } }) ``` - App启动时读取LocalStorage, 取得当前语言设置, 并写

2024-11-20

计算机毕业设计:小程序+装修预约小程序

小程序+装修预约小程序

2024-11-19

计算机毕业设计:小程序+家具装修团购小程序

家具装修团购小程序

2024-11-19

计算机毕业设计:java+•基于 J2EE 架构的在线考试系统

现阶段,学校与社会上的各种考试大都采用传统的考试方式,在此方式下,组织一次考试至少要经过五个步骤,即人工出卷、考生考试、人工阅卷、成绩评估和试卷分析。显然,随着考试类型的不断增加及考试要求的不断提高,教师的工作量将会越来越大,并且其工作将是一件十分烦琐和非常容易出错的事情,可以说传统的考试方式已经不能适应现代考试的需要。随着计算机应用的迅猛发展,网络应用不断扩大,如远程教育和虚拟大学的出现等等,且这些应用正逐步深入到千家万户。人们迫切要求利用这些技术来进行在线考试,以减轻教师的工作负担及提高工作效率,与此同时也提高了考试的质量,从而使考试更趋于公证,客观!更加激发学生的学习兴趣。例如目前许多国际著名的计算机公司所举办的各种认证考试绝大部分采用这种方式。为了适应新形势的发展,目前,国内有很多公司团体研究开发了许多基于web的考试系统。 二、系统介绍 基于数据库和网络应用的系统实现技术有多种,可以采用传统的客户机/服务器(C/S)架构,也可以采用目前流行的基于WEB的方式。 所谓客户机/服务器(C/S)模式,即数据库(比如,试题库)内容放在远程的服务器上,在客户机上安装相应软件; C/S

2024-11-15

计算机毕业设计:小程序+体育圈招聘小程序

体育圈招聘小程序

2024-11-15

计算机毕业设计:小程序+电器租赁

计算机毕业设计:小程序+电器租赁

2024-11-15

计算机毕业设计论文:java+信息查询与后端信息发布系统

WML信息查询与后端信息发布系统实现 ——WML信息查询设计 摘 要 21世纪,人类社会已进入崭新的信息化时代,信息技术正以前所未有的速度发展,人们对信息的交互需求也与日俱增。无线通讯技术以及手机终端的发展,从一定程度上满足了人们的需求,人们随时随地上网已经基本实现。首先,无线通讯技术的发展使基于WAP方式的信息浏览查询存在技术前提,这也是我们系统存在的前提;其次,随着无线通讯技术以及手机终端的发展,在当前的无线网络环境下,通过本信息发布系统,人们可以自由发布信息和查询信息,从而实现随时随地的信息交互。结合系统开发所需要的及现行的数据管理技术,系统采用了tomcat+My eclipse +SQL server 2005数据库进行开发,开发语言为java + WML + WML script。系统完成就酒店、景区等信息的发布,管理,维护等功能,并实现了Internet WEB与WAP两种方式对信息的浏览查询。系统以提供操作简单方便、快捷,易懂易用为开发目标,用户界面设计简洁,操作使用方便,及具有高效的数据处理能力。而SQL SERVER 2005数据库以其强大的数据管理功能保证用

2024-11-14

计算机毕业设计:小程序+柠檬树婚纱照

# wechat_wending ### 微信小程序做一个柠檬树摄影的页面交互 #### 先上效果动态图 #### 个人信息<br> ![微信个人信息](https://github.com/chocolate1/wechat_wending/blob/master/image/%E4%B8%AA%E4%BA%BA%E4%BF%A1%E6%81%AFGIF.gif) #### 预约<br> ![微信预约](https://github.com/chocolate1/wechat_wending/blob/master/image/%E5%BE%AE%E4%BF%A1%E9%A2%84%E7%BA%A6GIF.gif) ## 微信上的滑动模块 #### 微信官方网站上有这个组件叫做sroll-view 你可以直接进行引用他的wxml,但是有个问题是你的css里scroll-view中需写入 white-space: nowrap;(强制换行即文本不会换行,文本会在在同一行上继续,直到遇到 <br> 标签为止。)而且拖动的元素需在一行内,使用inline-block即可。

2024-11-14

计算机毕业设计:小程序+装修预约

#wxapp_newRestaurant <image src="https://github.com/A13253565831/wxapp_decoration/blob/master/images/galler/01.jpg"></image> <image src="https://github.com/A13253565831/wxapp_decoration/blob/master/images/galler/02.png"></image> <image src="https://github.com/A13253565831/wxapp_decoration/blob/master/images/galler/03.png"></image> <image src="https://github.com/A13253565831/wxapp_decoration/blob/master/images/galler/04.png"></image> <image src="https://github.com/A13253565831/wxapp_decoration/bl

2024-11-13

计算机毕业设计:python+scrapy

17部署scrapy到 scrapyd 16_scrapy 的部署工具介绍-scrapyd 15_抓取过程中的常见问题3-js的处理技巧 14_抓取过程中的常见问题2-cookie的处理 13_抓取过程中的常见问题1-代理ip的使用 12_实用技巧2-图片的抓取 11_实用技巧1-多级页面的抓取技巧 10_Scrapy 框架解读一深入理解爬虫原理 09_“西刺”网站爬虫的核心代码解读 08_抓取进阶-对“西刺”网站的抓取 07_scrapy 内置服务介绍 06_基本概念介绍3-scrapy中的重要对象 05_基本概念介绍2-scrapy的重要组件 03_scrapy的基本使用步骤 02_初步使用scrapy 01_scrapy 是什么

2024-11-13

计算机毕业设计:小程序+大学生阅读

# BookShare "BookShare"是以大学生为主要适用对象,专注于大学生而设计的一款APP,鼓励当代大学生阅读

2024-11-12

计算机毕业设计:小程序+IT书单

# symphony-weapp Symphony 社区平台的微信小程序,提供一些实用工具服务,比如[『书单』](https://hacpai.com/tag/book_share)。小程序暂不支持注册,体验需前往[注册](https://hacpai.com/register?r=Vanessa) ![hacpai 小程序](http://git.oschina.net/uploads/images/2017/0109/095544_a27820f2_301269.png "在这里输入图片标题") ## 登录 ![login](http://git.oschina.net/uploads/images/2017/0108/131646_c5875567_301269.png) * 对 md5.js 进行封装,使其可以在小程序中进行使用 * 微信提交登录请求 * 使用微信数据缓存存储用户标识以实现类似 Cookie 的作用 ## 书单 ![isbn](http://git.oschina.net/uploads/images/2017/0108/131547_5e30

2024-11-12

计算机毕业设计:python+爬虫+百度云爬虫

# BaiduyunSpider 包含百度云网盘爬虫、网站前后端、搜索,整套服务。http://www.githubs.cn/project/16085 ![爱百应](screenshot1.png) ![爱百应](screenshot2.png) ## 技术栈 * 网站: PHP Codeigniter * 爬虫:Python * 搜索引擎:Xunsearch * 数据库:MySql ## 演示站点 * [爱百应搜索](http://pan.ibying.com) - [ ] 分布式爬虫 - [ ] 爬虫IP代理 - [ ] Web 控制面板 - [ ] 死链检

2024-11-12

计算机毕业设计:python+爬虫+b站爬虫

# bilibili-user Bilibili用户爬虫 **该爬虫仅供学习使用** ## 文件介绍 * `bilibili_user.py`:爬虫文件 * `bilibili_user_info.sql`:数据库文件 * `get_face.py`:用户头像下载器 ## Bilibili用户报告(Web App) 演示地址:[http://ursb.me/bilibili-report](http://ursb.me/bilibili-report) GitHub:[https://github.com/airingursb/bilibili-report](https://github.com/airingursb/bilibili-report) **跪求Star Orz...** ## 用户数据初步分析 > 转自我的博客 [B站2000万用户分析](http://ursb.me/2016/02/23/B%E7%AB%992000%E4%B8%87%E7%94%A8%E6%88%B7%E5%88%86%E6%9E%90/) ### 基本概况 - 总数据数:201

2024-11-12

计算机毕业设计:python+爬虫+分布式爬虫

distribute_crawler ================== 使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现, 爬虫状态显示使用graphite实现。 这个工程是我对垂直搜索引擎中分布式网络爬虫的探索实现,它包含一个针对http://www.woaidu.org/ 网站的spider, 将其网站的书名,作者,书籍封面图片,书籍概要,原始网址链接,书籍下载信息和书籍爬取到本地: * 分布式使用redis实现,redis中存储了工程的request,stats信息,能够对各个机器上的爬虫实现集中管理,这样可以 解决爬虫的性能瓶颈,利用redis的高效和易于扩展能够轻松实现高效率下载:当redis存储或者访问速度遇到瓶颈时,可以 通过增大redis集群数和爬虫集群数量改善。 * 底层存储实现了两种方式: * 将书名,作者,书籍封面图片文件系统路径,书籍概要,原始网址链接,书籍下载信息,书籍文件系统路径保存到mongodb 中,此时mongodb使用单个服务器,对图片采用图片的

2024-11-08

计算机毕业设计:python+爬虫+cnki网站爬

##bug报告 1. issue 2. pull request 3. 联系 颜登程<yanzhou@mail.ustc.edu.cn> ##使用说明 1. 在src/CnkiSpider.py设置检索条件 2. 执行src/CnkiSpider.py抓取数据 3. 抓取数据存储在/data目录下,文件名格式为"data-keyword-年月日时分秒.txt.txt",如"data-新媒体-20131128224556.txt" 4. 每个数据文件的第一行为字段名称 5. 每次运行都根据当前时间生成新的数据文件 6. 如果抓取过程中断,可以在src/CnkiSpider.py中设置startPage为中断时的页码,并重新运行src/CnkiSpider.py从中断的页面继续抓取,最后将各个数据文件合并 7. 生成的文本文件直接修改后缀名为.csv然后用LibreOffice打开并在LibreOffice中设置字段分隔符为src/CnkiSpider.py中变量fieldsSep设置的字符串 8. Windows下打开Excel 2013,然后【打开】->【浏览】->

2024-11-08

计算机毕业设计:python+爬虫+爬爱书网

distribute_crawler ================== 使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现, 爬虫状态显示使用graphite实现。 这个工程是我对垂直搜索引擎中分布式网络爬虫的探索实现,它包含一个针对http://www.woaidu.org/ 网站的spider, 将其网站的书名,作者,书籍封面图片,书籍概要,原始网址链接,书籍下载信息和书籍爬取到本地: * 分布式使用redis实现,redis中存储了工程的request,stats信息,能够对各个机器上的爬虫实现集中管理,这样可以 解决爬虫的性能瓶颈,利用redis的高效和易于扩展能够轻松实现高效率下载:当redis存储或者访问速度遇到瓶颈时,可以 通过增大redis集群数和爬虫集群数量改善。 * 底层存储实现了两种方式: * 将书名,作者,书籍封面图片文件系统路径,书籍概要,原始网址链接,书籍下载信息,书籍文件系统路径保存到mongodb 中,此时mongodb使用单个服务器,对图片采用图片的

2024-11-08

计算机毕业设计:python+爬虫

doubanspiders ============= 豆瓣电影、书籍、小组、相册、东西等爬虫集 writen by Python. PS: 哎, 八个月后自己尝试设计了下爬虫框架, 感觉doubanspiders代码简直糟蹋了Scrapy, 阿弥陀佛! ###依赖服务 1. MongoDB ###依赖包 1. pip install scrapy 2. pip install pybloom 3. pip install pymongo ###运行豆瓣电影爬虫 1. 进入douban/movie目录 2. 执行scrapy crawl movie ###运行豆瓣相册爬虫 1. 进入douban/album目录 2. 执行scrapy crawl album

2024-11-04

计算机毕业设计:Python+去哪儿携程机票爬虫

# Findtrip说明文档 ## 介绍 Findtrip是一个基于Scrapy的机票爬虫,目前整合了国内两大机票网站(去哪儿 + 携程) ## Introduction Findtrip is a webspider for flight tickets by Scrapy,which contains two major china ticket websites ---- Qua & Ctrip ## 安装 在用户目录下执行,将代码clone到本地 ``` git clone https://github.com/fankcoder/findtrip.git ``` 所需运行环境,请看 ./requirements.txt 本程序使用selenium+ phantomjs模拟浏览器行为获取数据,phantomjs浏览器下载地址(当然使用Firefox也可以,不过打开速度就会慢很多) http://npm.taobao.org/dist/phantomjs 数据库使用Mongodb存储,运行需要安装Mongodb,安装传送门 https://www.mongo

2024-11-04

计算机毕业设计:python+爬虫可视化

欢迎使用 SpiderKeeper SpiderKeeper** 是一款基于[scrapyd](https://github.com/scrapy/scrapyd)服务的scrapy爬虫管理程序,实现了对scrapy爬虫的可视化管理,包括爬虫的启动与取消,定时抓取任务的设置和周期执行,并可对在运行爬虫的日志,运行状态进行查看。

2024-11-01

计算机毕业设计:python2+爬虫+股票

一个股票数据(沪深)爬虫和选股策略测试框架,数据基于雅虎YQL和新浪财经。 * 根据选定的日期范围抓取所有沪深两市股票的行情数据。 * 根据指定的选股策略和指定的日期进行选股测试。 * 计算选股测试实际结果(包括与沪深300指数比较)。 * 保存数据到JSON文件、CSV文件。 * 支持使用表达式定义选股策略。 * 支持多线程处理。 能干什么 如果你想基于沪深股市行情数据进行一些工作,它可以帮助你导出指定时间范围内所有沪深A股的行情数据和一些技术指标,包括代码、名称、开盘、收盘、最高、最低、成交量、均线、KDJ等。<br \> 如果你对于技术分析有兴趣,它可以帮你根据你自定义的规则在所有沪深A股的范围内进行选股,并回测选股策略的收益情况(详细说明后面会有)。这样就能够非常方便快捷地测试和调整基于技术分析的选股策略。<br \> 还有些什么问题 行情数据目前来源于雅虎YQL,每日数据的更新时间不太稳定(一般在中国时间午夜左右)。<br \> 目前支持的技术指标还不多,还有一些指标如

2024-11-01

计算机毕业设计:网络爬虫之链家爬取+爬虫

链家爬虫 爬取北京地区链家历年二手房成交记录。[链家爬虫](http://lanbing510.info/2016/03/15/Lianjia-Spider.html)一文的全部代码,包括链家模拟登录代码。 爬取数据的部分截图 ![Aaron Swartz](https://github.com/lanbing510/LianJiaSpider/raw/master/screenshots/lianjia.jpg)

2024-10-31

计算机毕业设计:QQ群爬去 python+爬虫

QQ-Groups-Spider QQ Groups Spider(QQ 群爬虫) 批量抓取 QQ 群信息,包括群名称、群号、群人数、群主、群简介等内容,最终生成 XLS(X) / CSV 结果文件。 代码说明 运行环境 * Python (2.7) * [bottle](http://bottlepy.org/) (0.12.9) 第三方库支持 * [requests](http://python-requests.org) * [pyexcel](https://github.com/pyexcel/pyexcel) * [XlsxWriter](https://github.com/jmcnamara/XlsxWriter) * [unicodecsv](https://github.com/jdunck/python-unicodecsv) 本地运行 ``` $ python app.py ``` SAE 上运行 参照 [https://www.sinacloud.com/doc/sae/python/tutorial

2024-10-31

计算机毕业设计:QQ空间采集分析 python+爬虫

如果出现报错: ``` Traceback (most recent call last): File ".\init.py", line 20, in <module> my_messages.backups() # 备份爬虫信息 NameError: name 'my_messages' is not defined ``` 多半的原因是 BitVector 模块用不了,可自行调试。 如果确定是BitVector用不了的话可以用 "BitVector模块报错解决" 里面的两个文件替换掉原有文件,不使用BitVector判重,改用python的list判重(数据量不大的话效果是一样的)。

2024-10-30

计算机毕业设计:网络爬虫之Selenium使用代理登陆爬取去哪儿 python+爬虫+金融数据

### 网络爬虫之Selenium使用代理登陆:爬取[去哪儿](http://flight.qunar.com/)网站 一些说明: * 使用selenium模拟浏览器登陆,获取翻页操作。 * 代理可以存入一个文件,程序读取并使用。 * 支持多进程抓取。

2024-10-30

python+爬虫+淘宝天猫爬虫+计算机毕业设计

python+爬虫+淘宝天猫爬虫+计算机毕业设计

2024-10-29

python+爬虫+微博爬虫+计算机毕业设计

python+爬虫+微博爬虫+计算机毕业设计

2024-10-29

爬虫+python+微信公众号爬虫接口+计算机毕业设计

爬虫+python+微信公众号爬虫接口+计算机毕业设计

2024-10-29

JAVA语言考试系统的设计与实现(论文+源代码+文献综述+外文翻译+开题报告)

JAVA语言考试系统的设计与实现(论文+源代码+文献综述+外文翻译+开题报告)

2024-10-28

计算机毕业设计-JAVA在线考试管理系统(源代码+论文+开题报告+外文翻译+英文文献+答辩PPT)

计算机毕业设计-JAVA在线考试管理系统(源代码+论文+开题报告+外文翻译+英文文献+答辩PPT)

2024-10-28

计算机毕业设计-java-作业管理系统

计算机毕业设计-java-作业管理系统

2024-10-28

计算机毕业设计-java信息查询与后端信息发布系统实现

计算机毕业设计-java信息查询与后端信息发布系统实现

2024-10-28

计算机毕业设计-Python2-乌云公开漏洞、知识库爬虫和搜索

计算机毕业设计-Python2-乌云公开漏洞、知识库爬虫和搜索,压缩密码私聊

2024-09-30

爬虫-Python2-计算机毕业设计

爬虫-Python2-计算机毕业设计,解压密码私聊

2024-09-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除