WOHHH234
码龄4年
关注
提问 私信
  • 博客:18,694
    18,694
    总访问量
  • 10
    原创
  • 111,101
    排名
  • 61
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2020-11-12
博客简介:

qq_52491868的博客

查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    82
    当月
    11
个人成就
  • 获得104次点赞
  • 内容获得7次评论
  • 获得105次收藏
创作历程
  • 1篇
    2025年
  • 6篇
    2024年
  • 3篇
    2021年
成就勋章
TA的专栏
  • 链接数据库
    1篇
  • 爬虫小白
    2篇
兴趣领域 设置
  • 大数据
    hadoop
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

油猴下载小红书评论区

【代码】油猴下载小红书评论区。
原创
发布博客 2025.01.09 ·
66 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

MYSQL pymysql.err.DataError: (1406, “Data too long for column ‘字段‘ at row 1“)

插入的时候莫一个字段过长插入失败,追加字段长度依旧失败,处理方式。
原创
发布博客 2024.11.19 ·
213 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Transformer从0-1模型详解通俗易懂(附代码)

位置编码一方面通过正弦和余弦函数来编码位置信息,能够使得不同位置的编码在空间上有良好的分布。另一方面分别使用正弦和余弦函数来编码偶数和奇数的位置,以确保位置编码可以捕捉到位置之间的关系代表遮掩,码是张量中的数值,尺寸不一定,一般里面只有1和0,代表位置是否被遮掩,0代表遮掩,1可以自定义,因此他的作用就是让另一个张量中的一些树值被遮掩观察事物的时候,之所以可以快速判断一种事物,是因为我们大脑可以很快的把注意力把事物具有辨别度的部分区分开,而不是从头到尾的观察,基于这样的理论,产生了注意力机制;
原创
发布博客 2024.09.26 ·
1106 阅读 ·
28 点赞 ·
0 评论 ·
21 收藏

用Text_cnn做NLP文本分类实践

本次项目是文本分类任务,在做这个任务之前犹豫过是不是先写有个文本生成类的,前段时间也做了个对中文的词预测(只有数据处理和用到的模型不一样),但是考虑到文本分类在NLP也是最普遍的,很多项目的开始都会出现,以下将整理我的知识点,必要的时候会放一些代码。
原创
发布博客 2024.09.07 ·
435 阅读 ·
5 点赞 ·
0 评论 ·
9 收藏

朴素贝叶斯邮件过滤(赋代码)

在主观条件的基础上,不了解客观的事实情况下可以先估计一个数值,然后根据结果不断进行修正,基于条件概率这个概念发展而来,因此要理解朴素贝叶斯的思想首先需要知道什么是条件概率。
原创
发布博客 2024.04.27 ·
972 阅读 ·
15 点赞 ·
4 评论 ·
12 收藏

LSTM时间序列+NLP写诗-实践

本次需要tensorflow第三方库,同时需要的是1.X版本其次通过我的上一偏的文章,对LSTM的基础理论做了一个简单的处理,在这通过实战加深对这个模型的印象,同时,这篇是对文本操作做处理,用到了自然语言处理(NLP)的一些理论。本次主要是实践为主,关于一些自然语言的内容也会简单的概述。
原创
发布博客 2024.04.18 ·
889 阅读 ·
27 点赞 ·
1 评论 ·
15 收藏

循环神经网络LSTM做预测

梯度和导数是密切相关的概念,实际上是导数对多元函数的推广,是多远函数对各个自变量求偏导形成的向量,指的是函数在一个点的导数方向最大值,就是函数在这个点的方向最大,最快长短期记忆网络(LST)是一种特殊的循环神经网络(RNN),适合处理和预测时间序列的数据,主要由四个基本组件组成(遗忘门,输入门,细胞状态更新,输出门),和RNN的区别在于处理数据的时候要是时间序列边长RNN会出现梯度消失或者梯度爆照的问题,但是LSTM确解决了这个问题xt:输入ct-1:上一层的隐藏层(也可以叫单元状态)
原创
发布博客 2024.03.01 ·
1371 阅读 ·
21 点赞 ·
2 评论 ·
28 收藏

爬虫数据存储到数据库/增量爬虫+多级页面获取=====安居客信息爬取

文章目录前言 一、增量爬虫是什么? 二、python数据存储到数据库 三、多级页面的跳转获取 四:遇到的问题以及解决 五:代码 总结前言:这次的爬取内容是安居客网页里面的信息,首先是我爬取的页面是属于需要动态加载,获取到的数据是加载获得到的数据,这次做的主要是将数据存储到数据库的操作,使用跳转页面获取具体的详细数据一、增量爬虫是什么?增量爬虫是将需要爬取的数据保存,在已经存在的数据上面每天都有更新的数据,然而下次获取的数据就是已经跟新的数据,已有的数据变保持不变,...
原创
发布博客 2021.09.06 ·
9022 阅读 ·
2 点赞 ·
0 评论 ·
10 收藏

多线程+多几页面抓取+手动输入招聘岗位==腾讯招聘爬虫

爬虫小白,最近跟着b站的一个up主学习到的技能,在这里如遇大佬请多多指教运行结果:一:多线程:cpu密集的程序适合使用多线程,可以充分利用计算机的多核,平时爬取网络数据的时候都是使用单线程获取数据的速度较慢,多线程就是多条线路执行一个任务返回进程threading模块==============================》》》》线程模块使用流程:T=thread(target=事件函数名)T.start()T.join()#阻塞等待线程,避免堵塞线程的产生...
原创
发布博客 2021.08.31 ·
2083 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

python爬虫手动输入淘宝名称获取淘宝信息

使用主要爬取手段urllib.request模块python爬虫小白,欢迎来点赞成果图运行结果制作过程#淘宝import urllib.requestimport urllib.parseimport time,random,csvclass TaoBao(): #获取请求头和网页链接作为以下使用 def __init__(self): self.url='https://s.taobao.com/search?q={}&bc...
原创
发布博客 2021.08.02 ·
2506 阅读 ·
1 点赞 ·
0 评论 ·
10 收藏