- 博客(43)
- 收藏
- 关注
原创 Python+Django+爬虫+情感分析+机器/深度学习==搭建舆情分析系统——上篇(某博热搜数据用户主题与评论数据为例:代码非常仔细,值得借鉴,由于篇幅过长,分为上中下篇)
Python+Django+爬虫+情感分析+机器/深度学习==搭建舆情分析系统——上篇(某博热搜数据用户主题与评论数据为例:代码非常仔细,值得借鉴,由于篇幅过长,分为上下篇)
2024-05-14 17:48:22 1422 3
原创 Python爬虫实战:爬取【某旅游交通出行类网站中国内热门景点】的评论数据,使用Re、BeautifulSoup与Xpath三种方式解析数据,代码完整
class RenrenLogin(object) : def __init__(self) : # 设置存储数据文件路径self . excellj = '' self . excellj1 = r "C:\XXXXXXXXXXXX\qne1.xlsx" self . excellj2 = r "C:\XXXXXXXXXXXX\qne2.xlsx" def get_html(self , url , names) : # 因此f12查看时,数据为json格式。
2024-05-11 09:38:33 2079 3
原创 Python爬虫基础知识学习(以爬取某二手房数据、某博数据与某红薯(书)评论数据为例)
但如果这是动态网页,我们便无法通过简单的传递网页地址栏的URL给get请求来获取网页数据,往往这个时候,我们进行翻页的时候还会发现网页地址栏中的URL是不会发生变化的。关于requests库的更多使用方式,大家可以前往(https://requests.readthedocs.io/zh_CN/latest/ 或 https://www.cnblogs.com/aaronthon/p/9332757.html)查看。当我们获取了到想要的数据后,便可以写入本地了。其他房源信息,大家可以自行处理!
2024-05-08 16:51:01 798
原创 Python的基础知识学习路线3—条件控制、循环语句、推导式、迭代器与生成器(使用jupyter notebook进行操作:最全路线,每部分附有代码操作结果)
条件控制、循环语句、推导式、迭代器与生成器
2024-04-30 17:38:44 230
原创 Python的基础知识学习路线2—运算符与变量类型(使用jupyter notebook进行操作:最全路线,每部分附有代码操作结果)
本章节主要说明Python的运算符。举个简单的例子 4 +5 = 9。例子中,4 和 5 被称为操作数,+ 称为运算符。Python语言支持以下类型的运算符:算术运算符、比较(关系)运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符、运算符优先级。
2024-04-11 15:10:30 562
原创 Python的基础知识学习路线1—python简介与环境配置(最全路线,每部分附有代码操作结果)
Anaconda指的是一个开源的Python发行版本,其包含了Conda、Python等 180 多个科学包及其依赖项。因为包含了大量的科学包,Anaconda 的下载文件比较大,如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包Conda和Python)。Anaconda利用工具 / 命令Conda来进行package和environment的管理,并且已经包含了Python和相关的配套工具。这里先解释下Conda、Anaconda这些概念的差别。
2024-04-08 14:12:51 621
转载 YoLov9从环境搭建到训练自己的数据,以车牌检测与多标签视网膜疾病的分类为例(非常详细,包括项目源码和模型权重下载、配置运行环境、代码改写、数据集制作、训练、预测和优化)等
yolov9实现目标检测与分类
2024-04-07 16:07:03 1402
原创 本地部署离线通义千问-1_8B-Chat与通义千问-14B-Chat模型及使用Lora方法对它们进行微调与验证(非常详细,值得大家借鉴且效果比Chatglm3-6B微调效果好)
Centos7下部署和微调通义千问大模型,效果优于chatglm3-6B,且效果很佳
2024-03-22 17:06:52 6054 21
原创 解决Anaconda环境下利用gradio启动web页面生成的链接报错Could not create share link
(1)首先查看虚拟环境中gradio所在路径:我这里是/home/Zeroad/Envs/chatglm/lib/python3.9/site-packages/gradio。意思就是:首先下载frpc_linux_amd64文件,然后再将文件重命名为frpc_linux_amd64_v0.2,最后将文件移动到虚拟环境中的gradio文件夹中。1、下载frpc_linux_amd64文件:需要关闭防火墙同时还可能需要代理才可以下载成功。2、将文件重命名为frpc_linux_amd64_v0.2。
2024-03-19 10:22:01 2529
原创 在Ubuntu中安装Anaconda和创建虚拟环境(保姆级教学,值得借鉴与信任)
至此在Ubuntu中安装Anaconda和创建虚拟环境就顺利完成了!
2024-02-29 15:05:53 6798 3
原创 清华大模型Chatglm2-6B基于P-Tuning的微调方法和微调模型使用方式(非常仔细,值得借鉴且使用自己的数据集微调未发生灾难性遗忘,效果很好)
chatglm2-6b的模型下载地址:这里面很多模型,选择自己需要的下载就可以了1 、安装所需要的库等环境,如下图所示的两个地方的依赖2 、下载官方所示的微调数据集(你也可以自己按照训练数据的输入格式,创建数据集)【json的数据集】3 、因为微调训练的文件为sh格式,因此需要Linux环境的操作命令。这里有两种方法解决在window环境下运行sh文件:方法一:安装git bash;方法二:将sh文件转化为bat文件格式,再运行训练。4 、对train . sh文件内的配置进行调整修改,再训练。
2024-01-22 13:09:27 7200 15
原创 YoLov5从环境搭建到训练自己的数据,以良性皮肤痣和恶性皮肤痣的分类与血红细胞类型目标检测识别为例(非常详细,包括环境安装配置、源码下载、配置运行环境、代码改写、数据集制作、训练、预测和优化)等
到这里项目的打开和运行环境的设置就完成了!下载文件解压后,里面有三个文件夹,分别是训练集(train)、测试集(test)和数据(data);而训练集中又包含两个文件夹,分别是:“malignant” 常用来描述恶性的、有害的或恶意的事物;“benign” 常用来描述良性的、无害的或温和的事物。测试集里面也是一样,只是数据量不同,data里面就是测试集和训练集。其中:train文件夹中malignant有1197张图片,benign有1440张图片;
2024-01-06 15:25:06 2452 7
原创 Python五种方式实现可视化,包括炫酷的动态图(matplotlib、seaborn、plotly、bokeh、pyecharts)——matplotlib传记
matplotlib是一个功能强大的Python绘图库,用于创建各种类型的图形和可视化数据。它提供了广泛的绘图功能和灵活的配置选项,可以满足不同需求下的数据可视化需求。
2024-01-02 20:57:09 4245
原创 三种方式在ASP.NET Core中实现代理功能请求获取数据的接口(以请求百度统计数据接口为例)
set;} = 0;set;} = "";set;地址:https : //tongji.baidu.com/api/manual/Chapter2/openapi.html地址:https : //tongji.baidu.com/api/manual/Chapter1/overview_getTimeTrendRpt.html其中里面有很多接口:以其中 【网站概况(趋势数据)】为例:里面包含请求的关键参数与接口地址以上就是一个基本介绍,详细内容大家可以在官网里面仔细查看!
2024-01-02 16:57:41 1234
原创 Asp.net Core MVC模型实现HTML使用jQuery的AJAX方法来获取后端数据并以柱状图、饼图以及表格形式展示(GET请求时是否允许返回JSON数据)
【代码】Asp.net Core MVC模型实现HTML使用jQuery的AJAX方法来获取后端数据并以柱状图、饼图以及表格形式展示(GET请求时是否允许返回JSON数据)
2023-12-26 20:59:24 526
原创 Python+Django+Mysql+SimpleUI搭建后端用户管理系统(非常详细,每一步都清晰,列举了里面所有使用的方法属性)
用户基本信息表。
2023-12-23 15:25:48 2672 2
原创 Asp.net (C#)实现上传文件到指定位置保存并将文件数据存入数据库,同时请求百度地图中地理编码Api接口,获取请求地区对应的位置坐标数据并将数据存入sql server数据库
注意:因为前面的文章中已经使用python实现了,因此在这里有一部分是相同的,主要不同是代码方面,大家可以参考一下。
2023-12-21 16:05:07 937
原创 python实现上传文件到指定位置保存并将文件数据存入sql server数据库,同时请求百度地图中地理编码Api接口,获取请求地区对应的位置坐标数据并将数据存入sql server数据库
包括省份、所在市区县、具体位置名称。
2023-12-21 15:32:42 878
原创 安装git.bash运行sh命令定时执行python脚本并在服务器启动时执行sh
1. 把该应用程序的快捷方式放到【系统启动文件夹】里:C:\ProgramData\Microsoft\Windows\Start Menu\Programs\Startup 文件夹中。2. 按【Windows +R】打开运行窗口,在输入框输入【shell:Common Startup】回车打开启动目录,将需要开机启动的应用程序快捷方式放入即可。
2023-12-20 15:43:38 874
原创 Asp.net core(c#)实现在微信公众号定时推送模板消息(包括获取access_token、openid与unionid)
至此,在微信公众号上进行模板添加的步骤已经完成,大家可以参考,详细添加可以看看官方介绍。到这里全部介绍完毕,大家可以参考一下!//设置时间间隔为1分钟执行代码。
2023-12-20 09:41:56 3444
原创 新建ASP.NET Core Web API项目,通过requests定时请求百度统计api接口数据并将数据存入sql server
(1)建立步骤如下图所示:(2)建立后的目录:其中 Helper文件夹里面是自己写的一些通用方法类,主要完成代码在Program.cs进行编写。
2023-12-15 19:29:43 471
原创 本地部署清华大模型ChatGlm-6b、ChatGlm2-6b与ChatGlm3-6b(api接口、demo界面、流式非流式)(非常详细)
(1)百度网盘下载地址(下载文件中附了非常详细的安装教程):https://pan.baidu.com/s/1KQNOlYU-GMKbkPGcip1Hzw?pwd=5678(2)直接网上百度下载和安装,非常多教程,这里直接略过。
2023-12-15 18:25:34 7640 2
原创 爬取百度统计内全部来源标签与地域标签数据并保存至sql server数据库中(https://tongji.baidu.com/main/overview/demo/overview/index)
q=0.9,en;Win64;爬取结果如下图:发现需要获取的数据在javascript文件里面,因此需要利用正则re根据其特点去提取所需要的数据。
2023-12-15 15:22:40 593
原创 首先创建sh文件执行python脚本,其次在windows下设置重启服务后自动执行sh文件
【代码】首先创建sh文件执行python脚本,其次在windows下设置重启服务后自动执行sh文件。
2023-12-15 14:36:52 1009
原创 解决:本地可以ping github.com,但是无法打开/访问github相关的网址
这种方法可能不是太稳定,可能需要定期更新hosts。
2023-10-22 17:33:35 3784 1
原创 pandas 、split 、replace 文本处理大全
通过使用split方法可以某个指定的字符作为分割点拆分文本。其中,expand参数可以让拆分的内容展开,形成单独的列,n参数可以指定拆分的位置来控制形成几列。代码如下(示例):文本替换有几种方法:replace,slice_replace,repeat。repl:为新内容字符串,也可以是一个被调用的函数。pal:为被替代的内容字符串,也可以为正则表达式。regex:用于设置是否支持正则,默认是True。
2023-10-03 14:52:49 246 1
原创 pandas 构建dataframe
代码如下(示例):list(data.index)【行索引】;list(data.columns)【列索引】
2023-10-03 14:40:59 76 1
本地部署离线通义千问-1-8B-Chat与通义千问-14B-Chat模型及使用Lora方法对它们进行微调与验证
2024-04-08
解决Anaconda环境下利用gradio启动web页面生成的链接报错Could not create share link
2024-03-20
YoLov5从环境搭建到训练自己的数据,以良性皮肤痣和恶性皮肤痣的分类与血红细胞类型目标检测识别为例
2024-01-06
YoLov5从环境搭建到训练自己的数据,以良性皮肤痣和恶性皮肤痣的分类与血红细胞类型目标检测识别为例
2024-01-06
Python+Django+Mysql+SimpleUI搭建后端用户管理系统(每一步都清晰,列举了里面所有使用的方法属性)
2023-12-23
Asp.net (C#)实现上传文件到指定位置保存并将文件数据存入数据库,同时请求百度地图中地理编码Api接口
2023-12-21
python上传文件到指定位置保存同时请求百度地图中Api接口,获取请求地区对应的位置坐标数据并存入sql server数据库
2023-12-21
asp.net core+微信公众号消息推送+获取openid等
2023-12-20
ARIMA用来预测时间序列预测模型
2022-09-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人