1. 创建一个mysql数据库 crawler,创建一个采集文章表articles:
CREATE TABLE `articles` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`title` varchar(100) DEFAULT NULL,
`time` datetime DEFAULT NULL,
`content` varchar(3000) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=65 DEFAULT CHARSET=utf8;
用爬虫工具,比如网络矿工,谋数台 爬一些文章到数据表中
2.
论坛文件source\class\discuz\discuz_application.php修改
private function _xss_check() {
/*
static $check = array(‘”‘, ‘>’, ‘<‘, ‘\”, ‘(‘, ‘)’, ‘CONTENT-TRANSFER-ENCODING’);
if(isset($_GET[‘formhash’]) && $_GET[‘formhash’] !== formhash()) {
system_error(‘request_tainting’);
}
if($_SERVER[‘REQUEST_METHOD’] == ‘GET’ ) {
$temp = $_SERVER[‘REQUEST_URI’];
} elseif(empty ($_GET[‘formhash’])) {
$temp = $_SERVER[‘REQUEST_URI’].file_get_contents(‘php://input’);
} else {
$temp = ”;
}
if(!empty($temp)) {
$temp = strtoupper(urldecode(urldecode($temp)));
foreach ($check as $str) {
if(strpos($temp, $str) !== false) {
system_error(‘request_tainting’);
}
}
}
*/
$temp = strtoupper(urldecode(urldecode($_SERVER[‘REQUEST_URI’])));
if(strpos($temp, ‘<‘) !== false || strpos($temp, ‘”‘) !== false || strpos($temp, ‘CONTENT-TRANSFER-ENCODING’) !== false) {
system_error(‘request_tainting’);
}
return true;
return true;
}
3.上传文件inset_article_by_xml.php到论坛目录
4.用通用Discuz!批量发帖工具步骤
第一步: 清空数据表 clear table
第二步: 采集文章
第三部:清除采集文章中的Html tag,标签
第四步:清除临时目录
第五步:生成xml文件
第六步:发布xml文件到论坛
论坛fid指的是diszuz论坛数据库表ly_forum_forum中的fid字段
工具下载:
需要详细文档和服务的请联系qq:409242642或者加微信cxs409242642