Python
文章平均质量分 58
November's chopin
这个作者很懒,什么都没留下…
展开
-
【scrapy、flask】如何在社区版 PyCharm 中调试 scrapy爬虫和 flask web 服务
在社区版 PyCharm 中如何调试 scrapy 爬虫和 flask web 服务原创 2022-11-04 19:52:50 · 1010 阅读 · 0 评论 -
【celery】celery 初体验
软件环境fedora 33python 3.7.0celery 4.3.0redis 6.0.9初识 celerycelery 是一个分布式队列任务处理系统,她为我们提供了一系列的任务处理工具。结识 celery 缘于企业(媒体行业)生产中的一个文章抓取需求:把官方微信公众号上面不定期发布的文章同步到企业自己的信息库中。当然,celery 不仅给我们提供了定时,还提供了定期处理任务的工具。基于此背景,给出本文探究 celery 的一张导图:在本文中,我们使用 redis 作原创 2021-01-08 09:53:56 · 199 阅读 · 1 评论 -
【python】为项目创建 virtualenv 环境
如果一台服务器上跑有多个需要不同 python 版本的项目,那么为每一个项目创建一个 virtualenv 环境就很有必要了。本文将以搭建一个轻量级 web 服务器 flask 为例探讨如何搭建这一环境。软件环境fedora 33python 3.9.1搭建步骤创建项目创建项目的 virtualenv 环境用到命令 python -m venv --clear venv,第一个 venv 代表 python 的 venv 模块,第二个 venv 代表创建的目录名称。安装项目所需包原创 2020-12-31 16:34:22 · 228 阅读 · 0 评论 -
【Python】TF-IDF 比较文本相似度
文本相似度TF-IDF 算法如果某个词在给定文档中很少出现,但是在给定文档中的某一篇文章中出现的次数很大, 该词在很大程度上反映了该文章的特性,我们称该词为这篇文章的关键字 参考链接:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html余弦相似性参考链接:http://www.ruanyifeng.com/blog/201...原创 2018-09-12 17:29:48 · 4648 阅读 · 0 评论