C#第五次作业 提取网页正文

原创 2015年07月07日 19:24:45

利用网上下载的程序提取指定网址的正文

网址1:

http://blog.csdn.net/quailquailquail/article/details/45821703





网址2:

 http://user.qzone.qq.com/303727350/blog/1430870007

该程序对QQ空间无法提取正文文本和带标签文本,如下所示:



原始网页:



网址3:

http://www.cnblogs.com/jasondan/p/4145305.html




心得体会:

        要想提高编程水平,要做到多看,多写,还有一点就是多改。改包含两个方面的意思:一是多改自己的代码,不断改正自己所写程序中的漏洞,完善已有功能并增加新的功能;二是要改别人的程序,把别人的程序拿过来,从用户的角度发现程序的不足并对其进行修改和完善,完全理解、吃透别人的代码,学习别人的逻辑方式和编程技巧。当然在使用别人代码的同时,还要注意版权的保护,避免侵犯他人的版权。

      学习就是一个不断实践、不断思考的过程,在实践中思考、思考实践所得,这二者缺一不可,正所谓学而不思则罔,思而不学则殆。通过解决在学习实践过程中遇到的一个又一个问题的方式,使自己一点一点地进步。

《C#程序设计》第五次作业:开源项目“网页正文提取”的案例分析

这周内容,是为了回应我们第五次作业(《C#程序设计》第五次作业:开源项目“网页正文提取”的理解 )。     大家可以直接从网盘下载讲义全文(word版本下载链接)。 【目的】 1. 掌握较...
  • xydy_
  • xydy_
  • 2015年06月12日 14:29
  • 363

C#第五次作业:开源项目“网页正文提取”的理解

信管1121,201211671117,聂双燕 第一部分:作业要求(完整要求见作业要求) 目标2:在目标1的基础上,增加保存正文文本到文本文件的功能(90分)。 第二部分:程序说明及代码 1...

C#第五次作业:开源项目“网页正文提取”的理解

运行结果截图: 提取http://blog.csdn.net/quailquailquail/article/details/45821703结果截图:  提取http:/...
  • WMCTG
  • WMCTG
  • 2015年07月08日 08:08
  • 293

《C#程序设计》 第五次作业:开源项目“网页正文提取”的理解

一、打开运行(ctrl+r)->输入cmd->确定->输入netstat -ano 结果检测到 :80端口被system 占用,如图所示 打开进程发现确实被 PID为 4 的引用程序占用了(sys...
  • Ajixk
  • Ajixk
  • 2015年06月03日 14:08
  • 647

C#第五次作业——正文提取

正文提取软件-Html2Artical 下载了提取正文软件Html2Artical后,运行VS里面的例程,打开软件界面: 输入老师要求的第一个网址:http://blog.csdn.n...

c#第五次作业---正文提取

一:要求如下:     (1)能够在自己电脑运行此程序。     (2)测试如下三个不同的网页的提取效果,并把结果截图发布到作业博文中:               http:/...

作业五:开源项目“网页正文提取”的理解——Winform程序

1.需求 提取网页正文,即提取每位同学的C#课程博客/空间日志内容,自动分析内容。 2.目标 目标1:下载测试Html2Article软件(80分)。 要求如下: (1)能够在自己电脑运行...

【c#第五次作业】测试 Html2Article 并添加保存功能

这是源码下载地址: http://www.51aspx.com/code/Html2Article 用vs打开后需要  右击Demo →设为启动项目 添加了 一个按钮和s...

C#实现网页内容正文抓取

C#实现网页内容正文抓取.net

C#实现网页内容正文抓取

思路: 1、抓取远程网页源码,这里要实现自动判断网页编码,否则有可能抓到乱码。我是先看应答的 http头的chareset,一般这个很准,但像csdn的新闻比较变态http应答的头里的charese...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:C#第五次作业 提取网页正文
举报原因:
原因补充:

(最多只允许输入30个字)