python 学习笔记
dandan_xiaoa
这个作者很懒,什么都没留下…
展开
-
scrapy 传入自定义参数的多个spider 同时启动
在spiders 同级目录下新建一个commands 文件夹在commands文件夹里新建crawlall.py 和__init__.py文件__init.py 文件为空crawlall.py 内容如下:里面包含了传入自定义参数 ,input() id = input('请输入id:') # 传入自定义参数 for name in spider_list: self.crawler_process.crawl(name, ID = id,**op.原创 2020-06-29 11:53:47 · 361 阅读 · 0 评论 -
网页的基本结构,css
<!DOCTYPE html><html lang="en"><head> >head标签内定义一些页面的配置和引用 <meta charset="UTF-8"> <title>This is a Demo</title> >titl...原创 2020-05-06 19:22:16 · 388 阅读 · 0 评论 -
python生态之中文文本分词处理,jieba库
jieba是 Python 第三方中文分词库;共有以下三种模式-精确模式把文本精确的切开,不存在冗余-全模式把文本中可能的词语都扫描出来,有冗余-搜索引擎模式在精确模式的基础上,对长词再次切分[实例 ] import jieba str = '中华人民共和国是伟大的' #精确模式,返回一个列表类型的分词结果 result_1 = jieba.lcut(str) #...原创 2020-05-04 20:23:51 · 777 阅读 · 0 评论 -
正则表达式的一点使用
正则表达式 常用语句原创 2020-05-04 19:04:54 · 309 阅读 · 0 评论