计算百度关键词出现密度

        /// <summary>
        /// 获取百度关键词出现的密度
        /// </summary>
        /// <param name="keyWord">标题、关键词</param>
        /// <returns>如:10 (满为100)</returns>
        public static int GetBaiDuKeywordDensity(string keyWord)
        {
            //获取百度源码
            string HtmlCode = GetHttpData("http://www.baidu.com/s?wd=" + keyWord);
            //百度搜索出来的标题列表
            List<string> listTitle = new List<string>();
            //列表正则匹配规则
            string strrex = @"<h3[\s\S]*?>(?<url>.*?)</h3>";

            //进行正则匹配
            MatchCollection mc = Regex.Matches(HtmlCode, strrex);
            foreach (Match m in mc)
            {
                string content =HtmlDecodes(Environment.NewLine + m.Groups["url"].Value);
             content=   ReplaceHtml(content);
                listTitle.Add(RemoveHTML(content));
            }

            //只匹配第一条
            for (int i = 0; i < listTitle.Count; i++)
            {
                return Convert.ToInt32(Similarity(listTitle[0], keyWord) * 100);
            }

            //相似度列表
           // List<double> listSimilarity = new List<double>();
            //进行相似度计算
            //foreach (string strTitle in listTitle)
            //{
            //    listSimilarity.Add(Similarity(strTitle, keyWord));
            //}

            //进行密度计算
            //int dev = Convert.ToInt32(stdev(listSimilarity) * 100);
            //if (dev<=0 || dev > 100)
            //{
            //    dev = Convert.ToInt32(average(listSimilarity) * 100);
            //}
            //return dev ;
            return 0;
        }

  

转载于:https://www.cnblogs.com/Aamir-Ye/p/4561201.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值