1.牛津高阶词典源码:https://pan.baidu.com/s/1hzFFTouUj5nHmeuy1p7ytg?pwd=rfrb
2.解压我们获得的源码(牛津高阶(第10版 英汉双解) V11_8.mdx):使用GetDict,将mdx转化成txt文件
3.我们获得的是html形式的文件,你可以取其中一条(即使是一条,数据量也非常大),在vscode中复制并命名为example.html。接下来,格式化该文件(右键->formatted with->HTML language features)。
4.阅读格式化后的文件,找到命名规律。
5.设计你的数据库结构,sqlite3是您的不二之选。
6.用python将html爬虫到你的数据库中。
7.实现Oxford10.db。
提示:
充分利用chatgpt以解决代码报错
不可以商用,你不能逆向了人家的数据还光明正大地指望用它赚W