自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (2)
  • 收藏
  • 关注

原创 爬虫入门实战(如何解析页面源码)

本文所属专栏:爬虫方法论 - DaveCui的专栏 - 掘金 (juejin.cn)专栏记录了我本人在工作室接爬虫单的几个经典的真实案例,干货满满,这可是吃饭的家伙,还不关注一波。接上篇文章:爬虫入门实战(如何解析一个页面以及构建requests请求) - 掘金 (juejin.cn)前言在上篇文章中,我们整个爬虫任务进行了分析,同时也通过一个简单的requests.get()方法获取到了页面源码。接下来我们要做的就是通过页面源码解析获取到我们想要的数据。(在这里是每个律师的个人界面的链接

2022-10-15 20:29:13 425 1

原创 爬虫入门实战(如何分析页面和构建requests请求)

其实我们或多或少都是听说过爬虫这个概念,这个东西的技术栈其实也比较成熟了。其实在我的理解中,爬虫嘛,就是给自己伪装一下,装成是正常的访问请求,然后获取到网站或者APP中的数据资源的一种技术手段。当然目前大部分爬虫都是python写的,毕竟python丰富的第三方库资源还有语言优势摆在这里。所以,这里也是通过python进行爬虫的编写。一、项目需求一个香港的老板应该是,他给个网址里面大概是这样的点进去那个箭头的之后是个超链接,然后,要把这个信息爬下来。需求挺明确的,而且这个网站,连一些基础的

2022-10-14 22:21:42 863

原创 大数据基础

大数据hadoop,spark,hive离线数仓的基本常识。

2022-10-08 17:56:06 727

原创 Git 将已有项目上传新建仓库

git把已有的项目搞上仓库开源

2022-10-03 19:40:37 1266

原创 三、实际开发接口上传服务器交给前端调用

SpringBoot实际接口上传到服务器流程

2022-10-03 00:27:55 310

原创 二、SpringBoot项目简单接口实例

SpringBoot 中helloword接口实例

2022-10-02 23:53:56 1149

原创 一、IDEA 2022 中Maven创建SpringBoot项目流程

IDEA2022版本MAVEN创建springboot项目演示

2022-10-01 09:51:26 5554 3

原创 剑指offer LeetCode 刷题笔记

剑指offer刷题笔记

2022-07-16 19:08:52 1563

原创 文本分类入门实战

多模态情感分析——文本分类入门实战环境:python3.8CSDN训练数据地址:还在审核中。gitee地址为:https://gitee.com/huadeng863/text-classification-practice有两个版本,一个是没有运行过的,可以运行体验一下,一般一个py文件要运行5-6分钟。还有一个是将预处理全部做完的了,可以对照文章截图理解一下自然语言处理的实际操作。为了方便立即将文章分为几个部分来讲解。第一步:划分训练集和测试集(choosed.py)数据已经全部放入da

2021-11-22 21:12:06 3024 6

原创 文本分类入门理论

多模态情感分析——文本分类入门实战环境:Python3.8此项目为2021年软件杯赛题,挂个赛题链接(http://www.cnsoftbei.com/plus/view.php?aid=599)可以查看具体题目要求。因为当时是个菜鸡,bert参数传不进去怎么也跑不动,所以最后用的贝叶斯进行的文本分类,效果也还算不错,能跑到90以上,但是因为最后忘记一个其他分类,无缘决赛。(主要原因还是菜)但是正是当时的思路比较简单,也非常适合自然语言处理中文本分类的入门。自然语言处理基本流程第一步:语料库的获

2021-11-21 23:38:47 5893

原创 Python量化分析(1)——Tushare的使用介绍

1.Tushare简介Tushare是国内免费库中最好的财经数据获取接口。数据包含股票、基金、期货、债券、外汇、行业大数据,同时包括了数字货币行情等区块链数据的全数据品类的金融大数据。最重要的是,免费!免费!免费!虽然初始注册账户的积分只有行情日线数据的权限,但是也足以胜任大部分的数据分析工作。当然,如果你想要从事更加深入的数据分析,可以联系工作人员,高校学生会有1000积分的一季度免费使用权限。这个时候你的权限就可以做很多数据分析的工作了。官网:https://tushare.pro/2.Tu

2021-11-15 14:20:50 6519 1

原创 Linux实验搭建个人网页

关于搭建个人网页,目前资源都是关于有root权限,所以写一个普通用户的,实验练练手。一、下载PUTTY,PUFTPputty用来连接老师的远程服务器(部分服务器要求必须在校园网才能正常登陆连接)。puftp用来将windows中的文件传到linux虚拟机中。挂个链接,自行下载:putty官网二、在个人目录下创建public_html个人目录就是你连接服务器输入自己的用户名和密码,然后直接进入的目录。正常情况下你ls查看一下目录是空的。如图(糊掉的是自己的用户名):我这里因为已经创好了p

2021-10-15 23:27:41 5680 1

原创 人工智能实验:动物专家系统python实现

只给两个课时的人工智能作业动物专家系统实验,局限性很多。设置规则时1-8时已经最大可能避免的规则冲突,所以基本没有规则冲突处理。对规则9-15采用FIRST法处理冲突。一 实验目的 熟悉掌握基于规则系统的表示与推理二 实验内容设计一个动物识别专家系统,规则库至少包含15条规则,可以识别至少7种动物,规则可增加;界面显示要求:1)有若干选择动物特征的选择列表;2)表现判断动物时,使用了哪些规则;3)表现数据库的变化;4)显示规则的调用次序;5)显示最后的结果,包含动物能识别出来和动物不

2021-06-19 12:58:26 8664 3

原创 人工智能实验:王浩算法python实现(附算法设计图)

人工智能王浩算法python实现(附算法设计图)实验课作业,没什么实际价值,不过还挺难的,copy一下应付作业没问题。原作者: 王浩算法—DMU.他的版本写的比较晦涩,我改了很多,效率提高不少,当然也容易理解了,顺便把算法设计图写出来了。一、算法设计图:二、完整代码注:实验环境python3.8,pycharm直接跑就行,在main函数那里可以改问题输入import copy# 列表转字符串def listtostr(m): s = '' for i in m:

2021-06-05 18:04:46 2447 3

20类新闻文本数据集(20w+数据数据非常齐全)

20w+新闻文本数据包含标题,正文,关键字,爬取链接,共20类,种类齐全。

2021-11-25

新闻文本分类数据(9类,10w+)

新闻文本分类数据集,详情见https://editor.csdn.net/md/?articleId=121462685

2021-11-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除