摘 要:公益众筹是我国当今公益模式中的重要组成部分,而捐款式公益众筹以其广泛的波及面成为现代公益活动中的重要形式。本文通过文本抓取与挖掘,对腾讯公益、水滴筹、轻松筹三个网络平台上爬取的297个公益众筹项目文本进行深度分析,探究其文本特征与项目筹款效率的关系。在对项目文本分词建立了网络众筹词典后,本文利用LDA模型得到了帮助类词语、金融类词语、慈善类词语、感叹类词语、第一人称词语五个主要的词汇主题,经过回归得出结论为帮助类词语、金融类词语、慈善类词语、感叹类词语、第一人称词语所发出的信号对捐款者行为有正向作用;参考HowNet词典对五个主题包含的词汇进行同义词合并,并提取了其中词频较高的20个词语进行回归分析,我们得出结论为“帮”、“谢”作为关键字词对于项目筹款效率存在显著正向关系。
关键词:公益众筹;文本分析;LDA模型;计量实证
Analysis of Factors on Affecting the Efficiency of Internet Public Welfare Crowdfunding
----based on text mining from the project text perspective
Abstract: Public welfare crowdfunding is an important part of China’s current public welfare model, and donated public welfare crowdfunding has become an important form of modern public welfare activities with its wide spread. Through text grabbing and text mining, this paper conducts an in-depth analysis of 297 texts of public welfare crowdfunding projects from Tencent Public Welfare, Water Drop and Easy Network. We explore the relationship between text characteristics and project fundraising efficiency. After establishing the online crowdfunding dictionary for the project text segmentation analysis, we use the LDA model to obtain the five main vocabulary themes: help, financial, charity, exclamatory, first person words. After regression, the result shows that these five themes have a positive effect on donor behavior. Referring to the HowNet dictionary for synonym vocabulary of the five topics, and extracting 20 words with higher frequency, we analyzed these words by regression. The conclusions were that “help” and “thank you” as keyword words have a significant positive relationship with the fundraising efficiency of the project.
一 引言
1.1研究背景
众筹指人们通过互联网媒介对某个项目实施金钱资助的过程。每个个体付出的金钱数额可大可小,但能起到聚沙成塔、集腋成裘的效果。现代众筹运作主要有债券、股权、回报和捐赠四种模式。公益众筹则为其中无偿捐赠的形态。在中国,公益众筹已经形成了一定的规模。互联网金融的迅速崛起加之其与我国公益、慈善相结合促进了公益众筹的迅速发展,使得公益众筹内涵随之发生了变化。广义的公益众筹是指公众筹资,面向公众筹集资金或者其他资源;狭义的公益众筹是指公益机构或个人在回报众筹平台发起的公益筹款项目,包括网络平台如腾讯乐捐、轻松筹、水滴筹等,以及一些综合类网站如京东众筹、淘宝众筹、众筹网等。移动互联网介入前,个人求助仅能停留在求助者身边有限的范围内,只有少数人或凭借自己的资源或是运气,得以借助媒体等力量获得广泛的关注和支持。而在移动互联网的环境下,以橙心筹为例,求助者的求助信息,通过微信、QQ、微博、贴吧、论坛、自媒体等各种渠道得以被传播,从身边的亲朋友,到远方一个素不相识的陌生人,都能通过这个过程被连接到一起给予求助者帮助。同时,互联网也带来了传统货币的数字化,通过信息链接和数字货币,让信息和现金在一定地域环境自由流动。便捷的金融科技使人们何时何地都可以奉献爱心;互联网自身所具有的互动性、跨地域性以及便捷性等特点,也使得推广慈善活动更加便利化、快速化和社会化。
但由于网络捐款过程中,筹资人和捐款人通过公益众筹平台这一媒介进行接触,双方信息不对称,捐赠者只有通过平台这一条路径来对求助者的信息进行判断。而近年“骗捐”事件的频频发生使捐助人的捐款意愿大大下降。在捐助过程中,捐款人往往难以获取充足的关于求助者项目真实性的有效硬信息,故会转向借助软信息对求助者的项目真实性进行判断。互联网公益众筹中的软信息尽管难以验证,但会在一定程度上激发捐款者的捐助意愿,提高筹款效率。描述性文本作为互联网公益众筹中一类典型的软信息,包含了求助者对于求助原因和家庭财务状况的详细描写,其中的某些情感词语会对捐助者的分析判断和捐助行为产生影响。因此本文展开对于项目描述性文本的深度挖掘,探究其文本特征对于筹款效率的影响。
1.2研究目的及意义
1.2.1研究目的
通过文本抓取与挖掘,对互联网公益众筹项目文本进行深度分析,探究其文本特征与项目筹款效率的关系,利用所得结果为筹款人和平台提出合理建议。
1.2.2研究意义
理论意义:公益众筹是我国当今公益模式中的重要组成部分,而互联网公益众筹以其广泛的波及面成为现代公益活动中的重要形式。本研究通过对各大公益众筹网站中有关大病众筹的文本的获取与挖掘,探究求助者在进行项目筹款过程中所需要的项目文本特征,进而分析在文本信息对于大众心理的调动作用,填补相关研究领域的空白。
实践意义:捐献式公益众筹在大众中的流传范围越来越广,凭借互联网的发展与传播,捐献式公益众筹模式的发展和扩散影响得不仅是公益事业的进步,更是大众利他心理的促进与提高。通过探究文本对项目筹款效率的影响,进而讨论其背后的社会现实,预测未来互联网公益众筹的发展趋势,为众筹网站和普通参与者提出合理建议。