各位同学大家好,好久没有更新文章了,最近看到好多同学在学习python,而且python的排名越来越靠前,好像不会用python都不能一起玩耍了,但是我还是要强烈建议大家,学编程一定要从C语言开始(至于为什么,你们是知道的!因为我是教C语言的)
没有对比,就没有伤害,下面咱们就讲讲,爬取百度新闻这个例子,python我花了3分钟搞定的,C语言我用了5个小时。
python语言实现大概过程:1,requests.get得到网页内容,2,转换为soup对象,3,过滤信息并打印。其中解析器选择遇到困难:lxml 和 html.parser选哪个?最终百度一下没看懂,结论是:随便了,选个短的,少敲几个字母!百度新闻得到了!太有成就感了,我学会了,爬虫,我厉害了~~哇哈哈!
C语言实现过程:1,域名解析,2,发起TCP请求连接,3,伪装成浏览器数据发http请求,4,得到http响应数据,5,分析数据
本以为很简单,但是还是低估了,主要是Apache发的数据跟我想象的不一样,此处耗费了很多时间~,借助wireshark分析理解了,最
没有对比,就没有伤害,下面咱们就讲讲,爬取百度新闻这个例子,python我花了3分钟搞定的,C语言我用了5个小时。
python语言实现大概过程:1,requests.get得到网页内容,2,转换为soup对象,3,过滤信息并打印。其中解析器选择遇到困难:lxml 和 html.parser选哪个?最终百度一下没看懂,结论是:随便了,选个短的,少敲几个字母!百度新闻得到了!太有成就感了,我学会了,爬虫,我厉害了~~哇哈哈!
C语言实现过程:1,域名解析,2,发起TCP请求连接,3,伪装成浏览器数据发http请求,4,得到http响应数据,5,分析数据
本以为很简单,但是还是低估了,主要是Apache发的数据跟我想象的不一样,此处耗费了很多时间~,借助wireshark分析理解了,最