php 字符中提取域名,php – 以编程方式从域名中提取关键字

好吧,我运行了我为

this SO question编写的脚本,进行了一些小的更改 – 使用日志概率来避免下溢,并修改它以读取多个文件作为语料库.

对于我的语料库,我从项目Gutenberg下载了一堆文件 – 没有真正的方法,只需从etext00,etext01和etext02中获取所有英语文件.

以下是结果,我保存了每个组合的前三名.

expertsexchange: 97 possibilities

- experts exchange -23.71

- expert sex change -31.46

- experts ex change -33.86

penisland: 11 possibilities

- pen island -20.54

- penis land -22.64

- pen is land -25.06

choosespain: 28 possibilities

- choose spain -21.17

- chooses pain -23.06

- choose spa in -29.41

kidsexpress: 15 possibilities

- kids express -23.56

- kid sex press -32.65

- kids ex press -34.98

childrenswear: 34 possibilities

- children swear -19.85

- childrens wear -25.26

- child ren swear -32.70

dicksonweb: 8 possibilities

- dickson web -27.09

- dick son web -30.51

- dicks on web -33.63

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值