关闭

作业五:开源项目“网页正文提取”的理解——Winform程序

标签: c#网页提取winform分析
460人阅读 评论(0) 收藏 举报
分类:

1.需求
提取网页正文,即提取每位同学的C#课程博客/空间日志内容,自动分析内容。
2.目标
目标1:下载测试Html2Article软件(80分)。
要求如下:
(1)能够在自己电脑运行此程序。
(2)测试如下三个不同的网页的提取效果,并把结果截图发布到作业博文中:
【1】http://blog.csdn.net/quailquailquail/article/details/45821703
【2】http://user.qzone.qq.com/303727350/blog/1430870007
【3】http://www.cnblogs.com/jasondan/p/4145305.html
(3)自己在完成作业过程中的感受、体会、克服困难的过程。
附:
一篇很不错的分享文章《我为开源做贡献,网页正文提取——Html2Article”》(链接:https://github.com/stanzhai/Html2Article),用C#语言实现了 网页正文提取 的功能。
3.实现
http://blog.csdn.net/quailquailquail/article/details/45821703
提取链接一效果图
http://user.qzone.qq.com/303727350/blog/1430870007
提取链接二效果图
http://www.cnblogs.com/jasondan/p/4145305.html
提取链接三效果图
4.总结
在本次的作业中,最大的作业莫过于“为什么我下载的软件包是和别人不一样的?”
下载页面:
下载页面
解压效果:
解压效果
多次下载未果后,尝试自己建立工程,自行借助代码完成,效果如下:
自建效果
其中发现,即使是借助代码,也是件困难的事情,因为在代码规范方面,没有规范说明书的指导,很难辨识出相应的模块。即:开发应当注重规范,这也是软件危机着重强调的一大内容。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:2841次
    • 积分:99
    • 等级:
    • 排名:千里之外
    • 原创:7篇
    • 转载:0篇
    • 译文:0篇
    • 评论:3条
    文章分类
    文章存档
    最新评论