1、目的:城市成语接龙
2、步骤:
1)爬取城市名的数据。
2)删除省市一类的后缀,删除民族名,去掉一个字的城市,事实上还有很多不准确,例如:清新*区和滨海*新区,新字很不好处理。
3)获取城市名的拼音。这步多音字处理不好。使用了插件,不过目前没有太好的插件
4)接龙最多100次
2、步骤:
1)爬取城市名的数据。
2)删除省市一类的后缀,删除民族名,去掉一个字的城市,事实上还有很多不准确,例如:清新*区和滨海*新区,新字很不好处理。
3)获取城市名的拼音。这步多音字处理不好。使用了插件,不过目前没有太好的插件
4)接龙最多100次
3、本来是为了小库公司的面试准备的,结果呵呵呵。
package www.xyb.com;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.Iterator;
import java.util.Map;
import java.util.Scanner;
import java.util.Set;
import java.util.TreeMap;
import java.util.TreeSet;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
//汉字转拼音,插件
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
public class idiom {
/***
* 存储所有从网页上爬到的地名,使用set为了直接去除重复(存在市辖区一类的重复)
*/
public Set<String> treeSet = new TreeSet<String>();
/***
* 存储处理过的地名
*/
public Map<String, TreeSet<String>> Toponym = new TreeMap<String, TreeSet<String>>();
/***
* 用来存储行政区域名,要在地名中删除掉
*/
public String area[] = { "省", "自治区", "市", "特别行政区", "地区", "盟", "自治州", "自治县", "县", "联合旗", "自治旗", "旗", "特区", "新区",
"区" }; // 新区并不是真正的行政区域
/***
* 用来存储民族,要在地名中删除掉
*/
public String nation[] = { "蒙古族", "回族", "藏族", "维吾尔族", "苗族", "彝族", "壮族"