![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
文章平均质量分 51
smallyoki
这个作者很懒,什么都没留下…
展开
-
使用HTMLParser时无报错情况下异常中止
使用HTMLParser时无报错情况下异常中止今天在使用Python写一个爬虫时出现HTMLParser没有完全将整个页面解析完就中止的情况,且没有出现任何报错。问题已经解决了,特意把内容分享一下避免大家继续入坑。错误结果: 上图显示出没有任何报错,HTMLParser最后解析到一个含href的超链接后中止。之前没有遇到过此类问题,百度上也找不到相关结果。为了找到问题的起因,直接把爬取的网页提取到原创 2016-11-05 19:37:04 · 545 阅读 · 0 评论 -
利用生成器产生数据训练word2vec
参考网站: https://github.com/RaRe-Technologies/gensim/wiki/Recipes-&-FAQ https://www.ibm.com/developerworks/cn/opensource/os-cn-python-yield/ 该问题是解决当数据量过大时数据集占用内存过多导致的崩溃问题,利用生成器训练word2vec模型以减少内存使原创 2018-01-05 21:37:04 · 1240 阅读 · 0 评论