FastText中文词向量的使用

faxttext中文

词向量下载地址

调用方法

官方文档

from gensim.models.keyedvectors import FastTextKeyedVectors
wv = FastTextKeyedVectors.load("data/fasttext/cc.zh.ftv")
wv.get_vector("齐次方程的通解")
Out[4]: 
array([-0.02770528, -0.01940057, -0.00155423, -0.00623327, -0.03702749,
       -0.00690734,  0.00132118, -0.03920605,  0.0003689 ,  0.02432604,
       -0.00343145, -0.00634525,  0.01728246, -0.01439409,  0.00236067,
       -0.00289405,  0.02843424, -0.00097948,  0.00583924,  0.01231529,
       -0.03100128,  0.01156239, -0.00680694,  0.00094301, -0.01547958,
        0.0077299 ,  0.00751489,  0.01592178, -0.03957854,  0.00964979,
        0.0044807 , -0.01453753,  0.00710117,  0.01314075,  0.01425264,
        0.03803091, -0.0091995 , -0.0136196 ,  0.0045022 , -0.022723  ,
       -0.00032682, -0.00499234, -0.01086006,  0.0011895 , -0.03108007,
       -0.00415922, -0.01814952, -0.00455354,  0.00497562,  0.01084334,
        0.01273701,  0.00389506,  0.00847115,  0.00440748, -0.01313938,
        0.01552561,  0.00277355, -0.01287873,  0.00466544, -0.0073945 ,
        0.01031001, -0.00748088, -0.00804983,  0.02573756,  0.00877401,
        0.01190013, -0.00954799, -0.02087725,  0.02140302, -0.02945632,
        0.00132381, -0.02526976,  0.0159622 ,  0.0016231 , -0.00555376,
        0.02165438, -0.01303895,  0.02886597,  0.01332908,  0.02119413,
        0.0217433 ,  0.01670258,  0.02963465,  0.00951478, -0.02103903,
        0.02111733, -0.00011307,  0.02238687,  0.01577717, -0.02792673,
        0.01054026,  0.00523125,  0.00144492, -0.01466708, -0.02596621,
       -0.00096878,  0.00942538, -0.01048814, -0.02157109,  0.03101451,
        0.00557971,  0.00886945,  0.00436569, -0.01355057, -0.00414133,
       -0.0238845 ,  0.00524544, -0.0121206 , -0.00595451, -0.00850328,
       -0.01070436,  0.03202352, -0.02924015, -0.00939905, -0.00973766,
        0.03194467,  0.01241933,  0.01057136,  0.0061421 , -0.01014839,
        0.01046439,  0.00259275,  0.02567853,  0.00913086,  0.00491641,
       -0.00776988, -0.00802085,  0.00465507,  0.02730826,  0.02127333,
       -0.02182401,  0.01569831,  0.01977419, -0.00087911, -0.01346703,
        0.00718763, -0.00223741, -0.00895895,  0.01081999,  0.02379143,
        0.0131931 , -0.00668924, -0.00956822,  0.01767019, -0.06572688,
        0.00525941,  0.03237703, -0.00212714,  0.00381643,  0.02148647,
        0.03570746, -0.01569255,  0.00930035,  0.02522128,  0.00313984,
       -0.00214189,  0.02906055, -0.02909016,  0.02421694, -0.02852829,
       -0.00023564,  0.03686526, -0.01195082,  0.0030988 ,  0.00752129,
       -0.01934787, -0.00400132,  0.01888735, -0.01827173,  0.04846204,
        0.03962749,  0.00959804, -0.02653589,  0.01485417, -0.01556092,
       -0.01371702,  0.00330527,  0.01246037, -0.0034099 , -0.0137812 ,
        0.00327434,  0.00292469, -0.00094473,  0.0043035 , -0.01822643,
       -0.01303349,  0.02134749,  0.02018705, -0.01369897,  0.05368842,
        0.0196601 , -0.01711259, -0.00048394, -0.00561686, -0.01467973,
        0.01123364, -0.03325021, -0.01721912,  0.04285329, -0.00715051,
       -0.00485801,  0.01880258, -0.01212107,  0.01101887,  0.01492605,
        0.01348591, -0.00113208, -0.00581867, -0.00868604,  0.00326946,
       -0.01378596,  0.01499698, -0.00037066, -0.01323319,  0.01549012,
        0.00025271, -0.01112719, -0.01482856,  0.01116403,  0.0012931 ,
       -0.01440499,  0.00407554, -0.02058306, -0.02844767, -0.00558925,
       -0.00789439, -0.01337096, -0.00483002,  0.01600403,  0.01178123,
       -0.00214079,  0.04410514,  0.00527514, -0.00495032,  0.00473957,
       -0.02659005,  0.04083819,  0.02417161,  0.00695672, -0.01637241,
        0.03720611, -0.01910962,  0.00214158,  0.00553989,  0.00398967,
       -0.01670013,  0.00065715, -0.00940218, -0.01750198,  0.0381637 ,
       -0.00782963,  0.02342749, -0.01228353, -0.0020781 , -0.00244336,
       -0.00570503,  0.01906461,  0.02160338,  0.00882312,  0.00203404,
       -0.00310014, -0.01708252, -0.01386752,  0.00605795,  0.004504  ,
        0.00690902,  0.01037846, -0.00808828, -0.00048305, -0.01928573,
        0.03381735,  0.0037837 ,  0.00265101,  0.02909622,  0.00188754,
       -0.01172526, -0.02343269, -0.03091168,  0.01300145, -0.02605992,
       -0.04595874, -0.01210633,  0.00022056,  0.00138075, -0.00716891,
        0.00127432,  0.0145096 , -0.00135081, -0.01810584, -0.04203109,
        0.03009902, -0.01527129, -0.00190694, -0.02493262,  0.06431199,
       -0.00668367, -0.0072659 , -0.02381454, -0.04280134, -0.02137613],
      dtype=float32)
wv.vocab
Out[6]: 
{',': <gensim.models.keyedvectors.Vocab at 0x17bf7c7e0f0>,
 '的': <gensim.models.keyedvectors.Vocab at 0x17bf7e3dba8>,
 '。': <gensim.models.keyedvectors.Vocab at 0x17beb3ad940>,
 '</s>': <gensim.models.keyedvectors.Vocab at 0x17beb3ad080>,
 '、': <gensim.models.keyedvectors.Vocab at 0x17bf7eb2f98>,
 '是': <gensim.models.keyedvectors.Vocab at 0x17bf7eb2fd0>,
 '一': <gensim.models.keyedvectors.Vocab at 0x17bf7ec1048>,
 '在': <gensim.models.keyedvectors.Vocab at 0x17bf7ec1080>,
 ':': <gensim.models.keyedvectors.Vocab at 0x17bf7ec10b8>,
 '了': <gensim.models.keyedvectors.Vocab at 0x17bf7ec10f0>,
 '(': <gensim.models.keyedvectors.Vocab at 0x17bf7ec1128>,
 ')': <gensim.models.keyedvectors.Vocab at 0x17bf7ec1160>,
 "'": <gensim.models.keyedvectors.Vocab at 0x17bf7ec1198>,
 '和': <gensim.models.keyedvectors.Vocab at 0x17bf7ec11d0>,
 '不': <gensim.models.keyedvectors.Vocab at 0x17bf7ec1208>
 ...}
wv.vector_size
Out[7]: 300
wv.similarity("3","120")
Out[8]: 0.5710426
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
东南亚位于我国倡导推进的“一带一路”海陆交汇地带,作为当今全球发展最为迅速的地区之一,近年来区域内生产总值实现了显著且稳定的增长。根据东盟主要经济体公布的最新数据,印度尼西亚2023年国内生产总值(GDP)增长5.05%;越南2023年经济增长5.05%;马来西亚2023年经济增速为3.7%;泰国2023年经济增长1.9%;新加坡2023年经济增长1.1%;柬埔寨2023年经济增速预计为5.6%。 东盟国家在“一带一路”沿线国家中的总体GDP经济规模、贸易总额与国外直接投资均为最大,因此有着举足轻重的地位和作用。当前,东盟与中国已互相成为双方最大的交易伙伴。中国-东盟贸易总额已从2013年的443亿元增长至 2023年合计超逾6.4万亿元,占中国外贸总值的15.4%。在过去20余年中,东盟国家不断在全球多变的格局里面临挑战并寻求机遇。2023东盟国家主要经济体受到国内消费、国外投资、货币政策、旅游业复苏、和大宗商品出口价企稳等方面的提振,经济显现出稳步增长态势和强韧性的潜能。 本调研报告旨在深度挖掘东南亚市场的增长潜力与发展机会,分析东南亚市场竞争态势、销售模式、客户偏好、整体市场营商环境,为国内企业出海开展业务提供客观参考意见。 本文核心内容: 市场空间:全球行业市场空间、东南亚市场发展空间。 竞争态势:全球份额,东南亚市场企业份额。 销售模式:东南亚市场销售模式、本地代理商 客户情况:东南亚本地客户及偏好分析 营商环境:东南亚营商环境分析 本文纳入的企业包括国外及印尼本土企业,以及相关上下游企业等,部分名单 QYResearch是全球知名的大型咨询公司,行业涵盖各高科技行业产业链细分市场,横跨如半导体产业链(半导体设备及零部件、半导体材料、集成电路、制造、封测、分立器件、传感器、光电器件)、光伏产业链(设备、硅料/硅片、电池片、组件、辅料支架、逆变器、电站终端)、新能源汽车产业链(动力电池及材料、电驱电控、汽车半导体/电子、整车、充电桩)、通信产业链(通信系统设备、终端设备、电子元器件、射频前端、光模块、4G/5G/6G、宽带、IoT、数字经济、AI)、先进材料产业链(金属材料、高分子材料、陶瓷材料、纳米材料等)、机械制造产业链(数控机床、工程机械、电气机械、3C自动化、工业机器人、激光、工控、无人机)、食品药品、医疗器械、农业等。邮箱:market@qyresearch.com

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值