自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 朴素贝叶斯邮件过滤(赋代码)

在主观条件的基础上,不了解客观的事实情况下可以先估计一个数值,然后根据结果不断进行修正,基于条件概率这个概念发展而来,因此要理解朴素贝叶斯的思想首先需要知道什么是条件概率。

2024-04-27 12:49:32 900 4

原创 LSTM时间序列+NLP写诗-实践

本次需要tensorflow第三方库,同时需要的是1.X版本其次通过我的上一偏的文章,对LSTM的基础理论做了一个简单的处理,在这通过实战加深对这个模型的印象,同时,这篇是对文本操作做处理,用到了自然语言处理(NLP)的一些理论。本次主要是实践为主,关于一些自然语言的内容也会简单的概述。

2024-04-18 20:06:45 803 1

原创 循环神经网络LSTM做预测

梯度和导数是密切相关的概念,实际上是导数对多元函数的推广,是多远函数对各个自变量求偏导形成的向量,指的是函数在一个点的导数方向最大值,就是函数在这个点的方向最大,最快长短期记忆网络(LST)是一种特殊的循环神经网络(RNN),适合处理和预测时间序列的数据,主要由四个基本组件组成(遗忘门,输入门,细胞状态更新,输出门),和RNN的区别在于处理数据的时候要是时间序列边长RNN会出现梯度消失或者梯度爆照的问题,但是LSTM确解决了这个问题xt:输入ct-1:上一层的隐藏层(也可以叫单元状态)

2024-03-01 17:07:18 1206 2

原创 爬虫数据存储到数据库/增量爬虫+多级页面获取=====安居客信息爬取

文章目录前言 一、增量爬虫是什么? 二、python数据存储到数据库 三、多级页面的跳转获取 四:遇到的问题以及解决 五:代码 总结前言:这次的爬取内容是安居客网页里面的信息,首先是我爬取的页面是属于需要动态加载,获取到的数据是加载获得到的数据,这次做的主要是将数据存储到数据库的操作,使用跳转页面获取具体的详细数据一、增量爬虫是什么?增量爬虫是将需要爬取的数据保存,在已经存在的数据上面每天都有更新的数据,然而下次获取的数据就是已经跟新的数据,已有的数据变保持不变,...

2021-09-06 13:44:09 5109

原创 多线程+多几页面抓取+手动输入招聘岗位==腾讯招聘爬虫

爬虫小白,最近跟着b站的一个up主学习到的技能,在这里如遇大佬请多多指教运行结果:一:多线程:cpu密集的程序适合使用多线程,可以充分利用计算机的多核,平时爬取网络数据的时候都是使用单线程获取数据的速度较慢,多线程就是多条线路执行一个任务返回进程threading模块==============================》》》》线程模块使用流程:T=thread(target=事件函数名)T.start()T.join()#阻塞等待线程,避免堵塞线程的产生...

2021-08-31 22:55:44 2055

原创 python爬虫手动输入淘宝名称获取淘宝信息

使用主要爬取手段urllib.request模块python爬虫小白,欢迎来点赞成果图运行结果制作过程#淘宝import urllib.requestimport urllib.parseimport time,random,csvclass TaoBao(): #获取请求头和网页链接作为以下使用 def __init__(self): self.url='https://s.taobao.com/search?q={}&bc...

2021-08-02 15:21:13 2408

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除