![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Tools
文章平均质量分 50
csdanteng
这个作者很懒,什么都没留下…
展开
-
Java语言汉语转换为拼音
最近做东西需要将汉语转换为拼音,在网上正好有开源的包可以实现,下载地址:http://pinyin4j.sourceforge.net/。Mark一下,以后可能用得到,示例代码如下: import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType原创 2017-08-07 21:44:03 · 403 阅读 · 0 评论 -
利用页面分析获取json数据
今天项目需要抓取车次信息,开始用jsoup访问制定的url,发现返回的只是静态页面,没有查询的数据。原来网站为了防止别人爬取数据,采用ajax异步加载数据。网上搜到的API接口要收费,后来发现可以页面分析找到数据真正的提交地址。这里以在某网站,查询济南到上海8月13号的火车信息为例说明。在某网站按F12,查询,可以抓取很多信息。点XHR看到很多get和post信息。从第一个开始找(如果原创 2017-08-09 12:40:24 · 2005 阅读 · 0 评论 -
抓取HTML页面表格中的某一列数据
今天需要抓取的内容在HTML页面中存在,但是需要的只是表格中的某一列数据,而且在页面中存在多个table。这里采用采用逐层抓取的方法。正则表达式用的6的就不用往下看了。需要获取的的table的某一行数据如下所示:这里需要抓取的是时间下面的“1179”。关键的地方就是先找到需要的table,再获取table的所有行,然后在每一行找到需要的列。实现如下所示: private static vo原创 2017-08-10 15:07:14 · 10380 阅读 · 0 评论