- 博客(10)
- 收藏
- 关注
原创 律师助手(爬取数据可视化和诉讼案件的批量插入)
数据类型分布饼图:直观展示宪法、法律等类型的数量占比;爬取历史折线图:显示近十日每日爬取次数,支持悬停查看具体数据;进度条:实时展示全量爬取进度(如 "已爬取 xxx条数据,进度 x%")。
2025-06-15 22:22:18
317
原创 律师助手(爬虫控制、前端界面和爬取流程可视化)
实现前的思考:要实现爬虫程序的可控性,前端每次点击时要为爬虫程序建立一个线程必要时可以随时杀死线程,要实现这个逻辑的话最好还是要实现一个爬虫的管理类,管理每一个爬虫线程的信息和状态,此外要实现管理员对爬虫流程的可视化,并实现交互,就必须展现整个爬取流程这里考虑采用前端对后端进行轮询的方式实现,下面是本次的具体实现方式和实现效果。每次创建线程时利用类型和当前时间创建一个方便后续管理的taskId,分外小心的是在新的全量爬取任务开始前我终止管理中的所有全量爬取线程,再开启新的全量爬取线程,防止出现冲突。
2025-06-12 19:22:38
382
原创 律师助手(爬虫增量更新的改进和封装与爬取记录的修改)
本次主要修改爬虫程序的增量爬取逻辑,之前的增量更新的爬取逻辑是利用最新的爬取记录的爬取时间获取爬取数量,进行更新,但是由于每次爬取并不一定将当前日期前的所有文件全部爬取下来,这样再下次爬取时从上次爬取记录的时间开始爬取就会出现遗漏大量数据的情况,故而,这里考虑利用国家法律法规数据库文件更新的时序性,每次开始增量爬取时,先获取数据库中发布日期最晚的法律法规的发布日期,利用该日期计算当前应该开始爬取的位置,并在爬取的同时更新爬虫的状态,实现增量爬取的效率、正确性和可追踪性。计算当前爬取的理论位置。
2025-06-10 21:01:54
816
原创 律师助手(法律文书生成的修改)
通过这次优化,我们显著提升了法律文书生成接口的易用性和输出质量。增加模板智能选择算法,根据案件详情自动推荐最合适的模板实现文书内容的自动校验,确保生成的法律文书符合规范开发更友好的前端编辑器,支持文书预览和在线编辑这次技术改进不仅解决了实际问题,也为团队积累了宝贵的经验。在处理 Unicode 编码和 API 设计时,我们深刻认识到细节决定成败,对用户体验的关注至关重要。
2025-06-08 23:35:36
318
原创 律师助手(法律文书生成和代码规范化)
本次开发通过代码规范化重构提升了系统可维护性,并成功实现了法律文书生成的核心流程。后续将继续优化用户体验与系统性能,逐步完善律师助手系统的智能化功能,为法律从业者提供更高效的文书处理工具。
2025-06-01 23:47:05
618
原创 律师助手(爬虫脚本的嵌入和PDF文件下载及编码的规范化)
这次的工作主要是将爬虫脚本完善并嵌入原本的项目框架中,实现数据库的实时更新,此外调整了原来的law和lawsuit部分,使之更加符合我的小伙伴起司起司酱的编码要求,为law的文本内容部分提供了转为PDF格式下载的接口。首先将准备好的爬虫脚本放在了deepseek文件夹下的crawler文件夹下然后修改chat.py文件,加入新的接口。没啥太大问题,不过word的下载不知道出啥问题了,下次再改吧,之后的任务重点会主要放在中国裁判文书网的爬取上(大的来了)对新增加的下载功能进行一下简单的测试。
2025-04-28 00:24:27
695
原创 律师助手(国家法律法规数据库爬虫部分的自动更新功能及日志)
至于定时更新的功能实现,我的思路是给每条法律法规设置创建时间字段和更新时间字段,根据数据库中对应类型的法律法规的最晚更新时间,对网站内容进行筛选,认定更新时间晚于爬虫上次的最晚更新时间的数据为新数据,并对这部分数据进行爬取。这次的工作主要是完善上次的爬虫,加入日志信息,并增加守护进程模式、全量爬取、增量爬取与指定内容的爬取的模式,为后续嵌入整个项目框架做准备,以下所有内容仅供学习使用。并利用schedule实现脚本的守护进程模式的实现设置为每六小时执行一次,并每分钟检查一次。下面是这次的完整代码。
2025-04-27 16:17:58
1565
原创 律师助手(爬虫和处理脚本部分)
分几个模块,分别处理数据库连接、信息状态的映射、网络不稳情况下的重试、对数据库的插入操作(这里爬到后面出现mysql1292错误,回头一看发现是有些公布时间为空,导致插入空串出现的问题。所以加了对公布时间的格式验证)、获取数据总页数、获取单条数据、对不同法律爬取的映射和主要日志信息输出、对宪法内容的爬取(内容比较少并且和其它几种有点不一样所以单独一个模块)这次主要的重点也还是细致和耐心吧,网页的数据有时会出现出乎意料的情况,要对可能出现的各种情况进行处理,还是不可以想当然。这次主要是编写爬虫程序爬取。
2025-04-26 17:53:12
1140
原创 律师助手网站(案例和法律法规检索数据库和后端接口定义与实现部分)
这是我们的项目实训任务,项目是一个基于deepseek api的律师助手,提供包括为律师提供直观的案件管理界面、阶段性帮助建议、日程安排与提醒、智能案件分析、相关案例与判决趋势提供等律师助手功能,和案件分析与预测、智能法律搜索功能、法律通俗解释、法律文档生成与模板等基础功能。经过简单的测试,没有问题,这两个模块暂时差不多,就不赘述了,这次做的都是些简单重复的工作,最主要的要求就是要细致与严谨吧,难点应当是在之后的实时更新数据库与爬虫的实现,这些功能也会在接下来的项目推进中逐步实现并完善增强。
2025-04-20 22:09:28
328
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人