数学问题,组合数学的问题?
关键词倒排序,就是不懂数学的人弄出来的。
特别的语义分析,词之间的计算。
原本一句话就明白的事,愣是拆成词,加载,查询在拼凑。
世界上的语言组成的语句在数学意义上事可以小范围穷尽的,而文字的组合排列问题则不可以。
设计的人还不懂语文,不是什么什么都可以在一块的,字字也一样。
音乐好听在于有谱,谱的元素简单;所以搜索可以简单点。
我家的搜索以语句为单位,这点估计所有的语言都一样,简化为数学问题,解决小范围穷尽的数据问题即可。
语句有长有短,可以hash来个统一的,一字以hash,顺序再hash,文字在语句的不同位置得到不同的hash,同样的文字排列hash值一样。
于是问题再简化为统一长度的信息检索问题。