scrapy的helloworld

最新推荐文章于 2020-09-18 21:44:46 发布

linux内核控

最新推荐文章于 2020-09-18 21:44:46 发布

阅读量178

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leafrenchleaf/article/details/84688861

版权

python 专栏收录该内容

33 篇文章 0 订阅

订阅专栏

http://scrapy.org/

安装python virlualenv
yum install libxslt-devel
yum install python-devel libffi-devel
cp /usr/lib64/python2.6/lib-dynload/bz2.so Scrapy/lib/python2.7/
否则可能汇报bz2的错误

pip install scrapy



from scrapy import Spider, Item, Field

class Post(Item):
    title = Field()

class BlogSpider(Spider):
    name, start_urls = 'blogspider', ['http://blog.scrapinghub.com']

    def parse(self, response):
        return [Post(title=e.extract()) for e in response.css("h2 a::text")]

EOF
 scrapy runspider myspider.py

参考
http://scrapy-chs.readthedocs.org/zh_CN/0.24/intro/tutorial.html

scrapy shell "http://app.shafa.com/apk/baobaoanquanjiaoyu.html"

response.xpath('//title')
response.xpath('//title').extract()
response.xpath('//title/text()')
response.xpath('//title/text()').re('(\w+):')
response.xpath('//section[@class="app-info"]//div[contains(@class,"meta-info")][2]//div[@class="info-title"]/following-sibling::span[1]/text()').extract()

http://www.shumeipai.net/forum.php?mod=viewthread&tid=20894&highlight=%D0%A1%B3%B5

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy的helloworld

http://scrapy.org/安装python virlualenvyum install libxslt-develyum install python-devel libffi-develcp /usr/lib64/python2.6/lib-dynload/bz2.so Scrapy/lib/python2.7/否则可能汇报bz2的错误pip insta...
复制链接

扫一扫

专栏目录

linux内核控 CSDN认证博客专家 CSDN认证企业博客

码龄17年

641: 原创

8万+: 周排名

10万+: 总排名

26万+: 访问

: 等级

1859: 积分

36: 粉丝

35: 获赞

12: 评论

148: 收藏

私信

关注

热门文章

分类专栏

最新评论

blender使用faceit绑定自己的表情动作
CSDN-Ada助手: 恭喜你写了第9篇博客！看到你在使用blender绑定自己的表情动作，我感到非常兴奋。这个主题非常有趣，我希望你能继续分享更多关于blender和表情动作的内容。或许你可以考虑分享一些实用的技巧，或者展示一些创意的案例，让我们可以更好地理解和运用这一技术。期待你的下一篇作品！
ffmpeg编译成wasm
CSDN-Ada助手: 恭喜您写了第8篇博客，非常有耐心和毅力。看到您已经成功地将ffmpeg编译成了wasm，非常感谢您分享您的经验和技巧。下一步，建议您可以尝试将wasm应用到实际项目中，并分享您的实践心得。同时，也欢迎您继续分享您的技术成果和经验，让更多人受益。感谢您的付出和分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
wasm编译mame游戏到h5中
廖阳斌: 你尝试过加载cfg文件么，我按他上面的方法加载cfg文件不起作用啊
tap的方式使用qemu建立虚拟机NAT网络
Stride Max Zz: 有没有哥们试过这个教程？
多个wasm之间的交互
啊啊啊啊不知道叫什么名字: ../../common/load-wasm.js 这个js似乎并没有说明。按照作者的流程下来，并不能正常工作，浏览器提示 > Uncaught (in promise) LinkError: WebAssembly.instantiate(): Import #0 module="env" function="add" error: function import requires a callable

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。