最近在写个爬虫,要去爬一些网站获得数据,这个过程中遇到字符串截取的问题,超哥指点了我,帮了个大忙啊
http://regexpal.com/还有http://www.regexr.com/这两个网站可以测试你的正则表达式~
除此之外,谷歌浏览器的开发者工具也很好用,F12后在console里面可以直接进行操作
例如:http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f 这样一个字符串,我要取得 iid
在console里面输入 var item =" http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f"
item.match(/iid=([0-9a-z]+)&iaction=(\w+)&st=(\w+)/)
会返回 ["iid=1407246132s7jn1j8b&iaction=view&st=0f", "1407246132s7jn1j8b", "view", "0f"] 这样一个数组
利用捕获可以简单方便得获得想要的字符。