第五次作业:开源项目“网页正文提取”的理解

转载 2015年07月07日 20:53:03
物联1121    201211672132   姚硕云
一、功能简介
 目标1的要求如下:
    (1)能够在自己电脑运行此程序。
    (2)测试如下三个不同的网页的提取效果,并把结果截图发布到作业博文中: 
             
http://blog.csdn.net/quailquailquail/article/details/45821703
             
http://user.qzone.qq.com/303727350/blog/1430870007
             
http://www.cnblogs.com/jasondan/p/4145305.html
    (3)自己在完成作业过程中的感受、体会、克服困难的过程。

二、界面展示
(1)网址一




(2)网址二




(3)网址三



三、心得与体会
      这次作业的不足之处就是第二个网址的QQ空间的正文文本和带标签的正文无法提取出来,自己花了一些时间之后还是没法解决,不清楚问题出在哪里,所以有点小瑕疵。但从总体上来讲,还是满足了作业的基本要求。前面做过的几次作业加上这一次,已经算是五次练习了,可以感觉到自己完成每次作业的时间缩短了,也算是一种进步吧,当然也不排斥作业本身的难度问题。不过,想要很好地掌握C#这门语言,单单通过这么几次练习是远远不够的,希望自己以后能够抽出时间继续巩固好这门语言,理解得更透彻一些。

《C#程序设计》 第五次作业:开源项目“网页正文提取”的理解

一、打开运行(ctrl+r)->输入cmd->确定->输入netstat -ano 结果检测到 :80端口被system 占用,如图所示 打开进程发现确实被 PID为 4 的引用程序占用了(sys...
  • Ajixk
  • Ajixk
  • 2015年06月03日 14:08
  • 682

《C#程序设计》第五次作业:开源项目“网页正文提取”的理解

作业链接:http://user.qzone.qq.com/303727350/blog/1432180216 信管1123 林少鑫 201211671312 完成目标:目标一+目标二 ...
  • u011524722
  • u011524722
  • 2015年05月26日 10:55
  • 359

C#第五次作业:开源项目“网页正文提取”的理解

目标1:下载测试Html2Article软件(80分)           要求:       (1)能够在自己电脑运行此程序。       (2)测试如下三个不同的网页的提取效果,并把结果截图发布到...
  • u010580422
  • u010580422
  • 2015年05月24日 23:14
  • 292

第五次作业:开源项目“网页正文提取”的理解

目标与要求:用Html2Article提取一下三个测试网页的正文部分并截图 网站1: http://blog.csdn.net/quailquailquail/article/details/458...
  • py1994829
  • py1994829
  • 2015年07月06日 12:03
  • 217

C#第五次作业 提取网页正文

利用网上下载的程序提取指定网址的正文 网址1: http://blog.csdn.net/quailquailquail/article/details/45821703 ...
  • d0105055134
  • d0105055134
  • 2015年07月07日 19:24
  • 338

C#第五次作业——正文提取

正文提取软件-Html2Artical 下载了提取正文软件Html2Artical后,运行VS里面的例程,打开软件界面: 输入老师要求的第一个网址:http://blog.csdn.n...
  • salvatore14
  • salvatore14
  • 2015年06月19日 16:05
  • 303

c#第五次作业---正文提取

一:要求如下:     (1)能够在自己电脑运行此程序。     (2)测试如下三个不同的网页的提取效果,并把结果截图发布到作业博文中:               http:/...
  • guojingmei
  • guojingmei
  • 2015年07月04日 19:25
  • 438

作业五:开源项目“网页正文提取”的理解——Winform程序

1.需求 提取网页正文,即提取每位同学的C#课程博客/空间日志内容,自动分析内容。 2.目标 目标1:下载测试Html2Article软件(80分)。 要求如下: (1)能够在自己电脑运行...
  • QuailQuailQuail
  • QuailQuailQuail
  • 2015年07月06日 23:14
  • 627

网页正文及内容提取算法

基于行块分布函数的通用网页正文抽取 http://wenku.baidu.com/link?url=TOBoIHWT_k68h5z8k_Pmqr-wJMPfCy2q64yzS8hxsgTg4lMNH8...
  • levy_cui
  • levy_cui
  • 2016年05月23日 14:18
  • 3126

php实现的网页正文提取算法

Html2Article-php实现的提取网页正文部分,最近研究百度结果页的资讯采集,其中关键环节就是从采集回的页面中提取出文章。 因为难点在于如何去识别并保留网页中的文章部分,而且删除其它无用的信息...
  • qikexun
  • qikexun
  • 2016年10月11日 20:05
  • 1568
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:第五次作业:开源项目“网页正文提取”的理解
举报原因:
原因补充:

(最多只允许输入30个字)