Python3常用模块之langdetect

安装

第三方库

pip3 install langdetect

导入

import langdetect

基本用法

PS: 貌似必须要指定文件编码,要不然会报错

# -*- coding: utf-8 -*-
from langdetect import detect
from langdetect import detect_langs
# 如果要让结果唯一,添加以下两行:
from langdetect import DetectorFactory
DetectorFactory.seed = 0
str1 = '【一点资讯】“别上飞机!”埃航遇难中国女学生微博留言看哭了 www.yidianzixun.com首页段子汽车娱乐军事体育游戏一点号动漫比赛NBA财经科技数码美女健康时尚搞笑电台旅游“别上飞机!”埃航遇难中国女学生微博留言看哭了原标题:浙江女大学生在埃航空难中遇难 她微博下的留言看哭了北京头条客户端3月11日消息,据外交部领事保护中心11日消息,埃航失事客机上8名遇难中国公民身份初步确认,4人为中国公司员工,2人为联合国系统国际职员(包括1名香港居民),另2人分别来自辽宁和浙江,为因私出行。驻埃塞使馆已与埃方建立协调联络机制,并同遇难中国公民家属取得联系,为家属处理善后提供积极协助。救援人员在封锁坠机现场进行搜救处理工作。东方IC 图ET 302航班的残骸。东方IC 图据@浙江之声报道,今天(03.11)中午从浙江万里学院党委宣传部了解到,校方经过与学生家属及大使馆方面核实,确认埃航空难事件中遇难的浙江女孩为浙江万里学院大四学生,接下来,学校方面将协助做好相关善后工作。记者了解到,该女学生来自金华兰溪,97年出生,今年即将毕业,此次乘坐埃航航班,是准备去非洲旅游。另据浙江新闻客户端报道,记者向浙江万里学院核实后确认,该女生为新闻专业大四学生。记者找到了失事客机上遇难的女大学生的微博,在3月9日,她发布了最后一条微博,定位正是在上海浦东机场。而在她的表述中,此次前往非洲旅行,是为了观看长颈鹿。同时,她将和一位朋友在目的地汇合。不少网友在她的微博留言,表示哀悼。埃塞俄比亚宣布3月11日为全国哀悼日坠机事故发生后,埃塞俄比亚宣布3月11日为全国哀悼日,悼念所有事故遇难者。埃塞俄比亚总理阿比·艾哈迈德宣布,将对事故展开深入调查。责任编辑:李欢收藏举报相关新闻'
# 当文本过短或模糊时,判断出来的结果会不确定;
# 判断语言种类
print(detect(text=str1))  # zh-cn
# 概率
res = detect_langs(text=str1)
print(res, type(res), res[0], res[0].__class__)
# [zh-cn:0.9999974947801593] <class 'list'> zh-cn:0.9999974947801593 <class 'langdetect.language.Language'>

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值