怎样在不写正则的前提下提取网页的标题和内容???
字符串截取 先用Indexof(tittle)取得对应字符串在文中的位置 再结合使用substring 等字符串截取函数,不用正则很麻烦 而且不通用 而且效率低!
标题不用正则也可以切出来, 内容是指的那些东西? 纯文字么? 用递归过滤所有的html.
虽然可以过滤所有HTML,但是里面还有其他内容不要,只要文章内容。
按照规则直接用一般的切割字符串的办法切割就是了.
如果这个网页严格遵守XHTML规格
可以用DOM或XML方式来处理.
不用正则,用indexof()这个定位 和 substring() 这个截取字符串
举个例子吧,比如我要在</title>前面加一个版权信息的字符串"powerd by xxx.com"
搞定,提取body中的内容道理也一样了。
总之,任何字符都能够取出来,只要把道理理解了就可以了。
使用下面的代码能够解决dtd的问题, 但是有其他错误, 貌似主要是元素不认识的问题.
根本都不符合xml规范,你xmldocument是无法load的。
你需要采用HttpWebRequest先下载源代码,然后进行格式化成xml
为什么这段代码不能将数据插入到数据库中?求大家帮帮忙看一下!
初学C#,所以很多东西都不知道!刚开始的时候使用直接插入法将数据插入数据库成功了,可是现在用数据集来插入数据就不行了!
我在程序里面加上了,只是这里被我注释了!
别学DataSet了,实际都用datareader, 下个微软的sqlhelper,搞个三层架构,读数据就一劳永逸了。
DataSet是微软用来糊弄初学者的。
我试图用一个网友提供的键盘钩子程序获取HP多媒体键盘的按键名,但是只能获取一部分按键的名字,比如调音量的为“VolumeUp”和“VolumeDown”,播放的为“Play”,停止的为“Stop”。像一些别的按键,得到的结果是“LButton, OemClear”,但其实这并不是那个按键的名字,因为放到press event程序里边根本没有反应。
请问有朋友知道别的方法能获取这些没有被正确获取的按键名吗?
搞个ONKEYDOWN事件,调式并按下键,看看是什么值,然后SendKeys.Send()模拟下试试。
将MyTable内容绑定到GridView控件上我会,但是我想把GridView控件上地区这列内容做成超级链接,比如点到“北京”时跳转到另一页上,请问大家怎么实现?
我的绑定是这样实现的,绑定的代码没有问题。
话说gridview是有超链接列的,或者你就像上面说的用模板