python-爬虫
SeanC52111
这个作者很懒,什么都没留下…
展开
-
淘宝网页价格爬虫
目标:获取淘宝搜索页面信息,提取其中的商品名称和价格 理解:淘宝的搜索接口、翻页的处理 技术路线: requests re 使用chrome浏览器搜索淘宝商品得到url: https://s.taobao.com/search?initiative_id=tbindexz_20170527&ie=utf8&spm=a21bo.50862.201856-taobao-item.2&source原创 2017-09-09 20:01:54 · 2037 阅读 · 0 评论 -
正则表达式
regular expression, regex, RE 正则表达式是用来简洁表达一组字符串的表达式 正则表达式的优势:简介、一行胜千言、一行就是特征(模式) 正则表达式在文本处理中十分常用: 表达文本类型的特征(病毒、入侵等) 同时查找或替换一组字符串 匹配字符串的全部或部分 编译:将符合正则表达式语法的字符串转换成正则表达式特征正则表达式语法正则表达式是由字符和操作符构成正则表原创 2017-09-09 20:04:36 · 359 阅读 · 0 评论