本文实现了最简单的python抓取股票贴吧(东方财富)内容,为后面将进行大数据处理做准备
实现最终效果为:将贴吧内容进行TXT文本进行股票分类保存。
股票贴吧查看源码文件内容:
<div class="articleh normal_post">
<span class="l1 a1">7273</span>
<span class="l2 a2">1</span>
<span class="l3 a3"><a href="/news,cfhpl,951069996.html" title="频频违规放贷,理财业务漏洞百出:浦发银行陷入了内控混乱的窘境">频频违规放贷,理财业务漏洞百出:浦发银行陷入了内控</a></span>
<span class="l4 a4"><a href="http://i.eastmoney.com/4019515194869314" data-popper="4019515194869314" data-poptype="1" target="_blank"><font>中国资本观察</font></a><input type