python 文本挖掘实战中遇到的问题

最新推荐文章于 2024-01-07 02:04:23 发布

小猴子跳跳

最新推荐文章于 2024-01-07 02:04:23 发布

阅读量355

点赞数

分类专栏： python 文章标签： python 大数据文本挖掘

本文链接：https://blog.csdn.net/qq_37372115/article/details/114156265

版权

今天开始大规模爬取数据了，花了5个小时爬了700多万条的数据，从来没做过大数据分析，不知道这是啥概念，但直觉太多了。

一、python日志文件

运行程序在自动爬取数据，已经进行了好长时间，突然发现程序自动关闭了，也没有出现任何异常错误。但是问题就来了，那么程序结束时爬取到哪里了呢？这时候就十分需要日志文件，来记录程序执行过程。

感谢下列文章，作者指出‘培养码代码的好习惯，设置日志，打印程序运行中的细节，以便调试代码’。

（文本挖掘从小白到精通（二）---语料库和词向量空间，来源Scottish Fold Cats Social Listening与文本挖掘 2019-05-08）

代码如下，注意，要生成log文件的话，一定要加上filemode="w",不然写不进去。

import logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO,filemode="w",filename=r"E:/Result/logmsg.log")

二、Python 自定义模块的相互应用

在pycharm中建立了多个python文件，各个文件间，可以相互引用。用‘import 文件名’的形式进行引用。注意：这些文件要在同一个文件夹中，

最低0.47元/天解锁文章

小猴子跳跳

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python 文本挖掘实战中遇到的问题

一、python日志文件运行程序在自动爬取数据，已经进行了好长时间，突然发现程序自动关闭了，也没有出现任何异常错误。但是问题就来了，那么程序结束时爬取到哪里了呢？这时候就十分需要日志文件，来记录程序执行过程。感谢下列文章，作者指出‘培养码代码的好习惯，设置日志，打印程序运行中的细节，以便调试代码’。（文本挖掘从小白到精通（二）---语料库和词向量空间，来源Scottish Fold CatsSocial Listening与文本挖掘2019-05-08）代码如下，注意，要生成log文件..
复制链接

扫一扫