- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 爬虫入门实战(如何解析页面源码)
本文所属专栏:爬虫方法论 - DaveCui的专栏 - 掘金 (juejin.cn)专栏记录了我本人在工作室接爬虫单的几个经典的真实案例,干货满满,这可是吃饭的家伙,还不关注一波。接上篇文章:爬虫入门实战(如何解析一个页面以及构建requests请求) - 掘金 (juejin.cn)前言在上篇文章中,我们整个爬虫任务进行了分析,同时也通过一个简单的requests.get()方法获取到了页面源码。接下来我们要做的就是通过页面源码解析获取到我们想要的数据。(在这里是每个律师的个人界面的链接
2022-10-15 20:29:13 425 1
原创 爬虫入门实战(如何分析页面和构建requests请求)
其实我们或多或少都是听说过爬虫这个概念,这个东西的技术栈其实也比较成熟了。其实在我的理解中,爬虫嘛,就是给自己伪装一下,装成是正常的访问请求,然后获取到网站或者APP中的数据资源的一种技术手段。当然目前大部分爬虫都是python写的,毕竟python丰富的第三方库资源还有语言优势摆在这里。所以,这里也是通过python进行爬虫的编写。一、项目需求一个香港的老板应该是,他给个网址里面大概是这样的点进去那个箭头的之后是个超链接,然后,要把这个信息爬下来。需求挺明确的,而且这个网站,连一些基础的
2022-10-14 22:21:42 863
原创 文本分类入门实战
多模态情感分析——文本分类入门实战环境:python3.8CSDN训练数据地址:还在审核中。gitee地址为:https://gitee.com/huadeng863/text-classification-practice有两个版本,一个是没有运行过的,可以运行体验一下,一般一个py文件要运行5-6分钟。还有一个是将预处理全部做完的了,可以对照文章截图理解一下自然语言处理的实际操作。为了方便立即将文章分为几个部分来讲解。第一步:划分训练集和测试集(choosed.py)数据已经全部放入da
2021-11-22 21:12:06 3024 6
原创 文本分类入门理论
多模态情感分析——文本分类入门实战环境:Python3.8此项目为2021年软件杯赛题,挂个赛题链接(http://www.cnsoftbei.com/plus/view.php?aid=599)可以查看具体题目要求。因为当时是个菜鸡,bert参数传不进去怎么也跑不动,所以最后用的贝叶斯进行的文本分类,效果也还算不错,能跑到90以上,但是因为最后忘记一个其他分类,无缘决赛。(主要原因还是菜)但是正是当时的思路比较简单,也非常适合自然语言处理中文本分类的入门。自然语言处理基本流程第一步:语料库的获
2021-11-21 23:38:47 5893
原创 Python量化分析(1)——Tushare的使用介绍
1.Tushare简介Tushare是国内免费库中最好的财经数据获取接口。数据包含股票、基金、期货、债券、外汇、行业大数据,同时包括了数字货币行情等区块链数据的全数据品类的金融大数据。最重要的是,免费!免费!免费!虽然初始注册账户的积分只有行情日线数据的权限,但是也足以胜任大部分的数据分析工作。当然,如果你想要从事更加深入的数据分析,可以联系工作人员,高校学生会有1000积分的一季度免费使用权限。这个时候你的权限就可以做很多数据分析的工作了。官网:https://tushare.pro/2.Tu
2021-11-15 14:20:50 6519 1
原创 Linux实验搭建个人网页
关于搭建个人网页,目前资源都是关于有root权限,所以写一个普通用户的,实验练练手。一、下载PUTTY,PUFTPputty用来连接老师的远程服务器(部分服务器要求必须在校园网才能正常登陆连接)。puftp用来将windows中的文件传到linux虚拟机中。挂个链接,自行下载:putty官网二、在个人目录下创建public_html个人目录就是你连接服务器输入自己的用户名和密码,然后直接进入的目录。正常情况下你ls查看一下目录是空的。如图(糊掉的是自己的用户名):我这里因为已经创好了p
2021-10-15 23:27:41 5680 1
原创 人工智能实验:动物专家系统python实现
只给两个课时的人工智能作业动物专家系统实验,局限性很多。设置规则时1-8时已经最大可能避免的规则冲突,所以基本没有规则冲突处理。对规则9-15采用FIRST法处理冲突。一 实验目的 熟悉掌握基于规则系统的表示与推理二 实验内容设计一个动物识别专家系统,规则库至少包含15条规则,可以识别至少7种动物,规则可增加;界面显示要求:1)有若干选择动物特征的选择列表;2)表现判断动物时,使用了哪些规则;3)表现数据库的变化;4)显示规则的调用次序;5)显示最后的结果,包含动物能识别出来和动物不
2021-06-19 12:58:26 8664 3
原创 人工智能实验:王浩算法python实现(附算法设计图)
人工智能王浩算法python实现(附算法设计图)实验课作业,没什么实际价值,不过还挺难的,copy一下应付作业没问题。原作者: 王浩算法—DMU.他的版本写的比较晦涩,我改了很多,效率提高不少,当然也容易理解了,顺便把算法设计图写出来了。一、算法设计图:二、完整代码注:实验环境python3.8,pycharm直接跑就行,在main函数那里可以改问题输入import copy# 列表转字符串def listtostr(m): s = '' for i in m:
2021-06-05 18:04:46 2447 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人