不用AI实现中文句子拆分成词语
前两天老师布置了一样作业,就是把输入英文句子中D打头的单词全部拆分出来,题目没有说输入好的文字是怎么样的。
可能是这样的:This is a apple
也可能是这样的:Thisisaapple
看起来很复杂。。。
我当时想到的是用人工智能来进行语义识别。但是学校作业不可能这么麻烦。而且找不到现成的接口。
后面发现题目单词是一个一个输入的。。。
所以我们就加大难度,来拆分中文句子中的词语。。
原理很简单:
用中文词库的词语去输入句子中找就好了。
步骤:
我们先去下载一个 《现代汉语词汇表》
然后把它放在json数组中:
通过$.getJSON来获取json文件,用indexOf()把每个词语和输入的字符串比较。
完整的代码:
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8" />
<title></title>
<script src="https://cdn.staticfile.org/jquery/1.10.2/jquery.min.js"></script>
</head>
<body>
<script>
function run() {
var s = ""
var st = document.getElementById("ipt").value;
$.getJSON('json/word.json', function(word) {
var word = JSON.parse(JSON.stringify(word));
var x = word.word
for (var i = 0 ;i<x.length;i++){
var zf = word.word[i]
var t = st.indexOf(zf);
if (t != -1){
s = s + " " + zf
}
}
console.log(s);
});
}
</script>
请输入中文句子:<input type="text" id="ipt"><br><br>
<button onclick="run()"> 确定</button>
</body>
</html>
效果:
这是一个比较烂的方法。。。仅供参考