数据资源
文章平均质量分 73
帅帅的Python
python爱好者,高级数据分析师
展开
-
23万条数据集,可以用来区分钓鱼网站!
是一份大小为100M左右的csv文件,我们可以用pandas来读取数据。PhiUSI IL网络钓鱼URL数据集是一个由134,850个合法和100,945个网络钓鱼URL组成的实质性数据集,我们在构建数据集时分析的大部分URL都是最新的URL,特征是从网页和URL的源代码中提取的,Char连续率、URL标题匹配分数、URL Char Prob和TLD合法Prob等特征是从现有特征中派生出来的。原创 2024-03-14 10:49:05 · 1075 阅读 · 2 评论 -
数据资源整理【三】:最全中国各省份城市编码以及经纬度Excel数据【附获取方式】
数据来源于高德地图网站公开数据,原创 2023-03-31 11:43:28 · 7551 阅读 · 1 评论 -
数据资源整理【二】:爬虫获取329万多条姓名数据并保存为sqlite3、Excel、csv文件【文末下载链接】
公开网站《姓名大全》获取,数据和源码仅供学习交流使用。原创 2023-03-25 11:43:15 · 320 阅读 · 1 评论