![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python网络数据采集
pengsel
信仰圣光吧。
展开
-
简单数据清洗
数据清洗代码清理或者使用OpenRefine开源软件 代码清理 转义字符\n Unicode字符 剔除单字符单词 引用标记 标点符号 input = re.sub('\n+', " ", input) input = re.sub('\[[0-9]*\]', "", input) input = re.sub(' +', " ", input) input = byt...原创 2018-11-27 20:51:24 · 187 阅读 · 0 评论 -
表单和cookie(requests库简要使用)
一个表单 <form method="post" action="processing.php"> First name: <input type="text" name="firstname"><br> Last name: <input type="text" name="lastname"原创 2018-11-27 21:30:26 · 465 阅读 · 0 评论 -
JavaScript和Selenium
客户端语言成功的前提是浏览器拥有正确地解释和执行这类语言的能力。 JavaScript 可以收集用户的跟踪数据,不需要重载页面直接提交表单,在页面嵌入多媒体文件,甚至运行网页游戏 &amp;lt;script&amp;gt; alert(&quot;This creates a pop-up using JavaScript&quot;); &amp;lt;/script&amp;gt; 所有的变量都用v原创 2018-11-27 23:09:29 · 386 阅读 · 0 评论