处理网页中表格内容

原创 2007年10月15日 14:18:00
<li>*     通过&lt;table&gt;&lt;/table&gt;标记中的id得到表格对象,或通过innerHTML插入表格对象。

<li>*     通过表格对象的insertRow方法在表格中插入行。

<li>*     通过行对象的insertCell方法在行中插入表格元素。

<li>*     通过表格元素对象的innerHTML方法添加表格元素中的内容。

<li>*     通过行对象的deleteCell方法删除行中的表格元素。

<li>*     通过表格对象的deleteRow方法删除表格中的行。

<html>

<head>

      <meta http-equiv="Content-Type" content="text/html; charset=gb2312">

      <title>处理网页中表格内容</title>

      <script language="JavaScript">

      <!--

            function addRow()              //添加行

            {

                 var tableObj = document.getElementById("mainTb");  //获取表格相关属性

                 //设置行、名称、单位、按钮等相关变量

                 var newRowObj = tableObj.insertRow(tableObj.rows.length);

                 var newNameCell = newRowObj.insertCell(newRowObj.cells.length);

                 var newCompanyCell = newRowObj.insertCell(newRowObj.cells.length);

                 var newButtonCell = newRowObj.insertCell(newRowObj.cells.length);

                 //添加“姓名”表元

                 newNameCell.innerHTML = document.getElementById("newName").value;

                 //添加“单位”表元

                 newCompanyCell.innerHTML = document.getElementById("newCompany").value;

                 //添加“删除”表元

                 newButtonCell.innerHTML = '<input type="button" value="删除" onclick="deleteRow('+(tableObj.rows.length-1)+')">';

            }

            function deleteRow(index)      //删除行

            {

                  var tableObj = document.getElementById("mainTb");  //获取表格相关属性

                  tableObj.deleteRow(index);       //删除指定行

            }

      //-->

      </script>

</head>

<body  bgcolor="#FFC0C0" style="margin:40px">

      <h2>处理网页中的表格内容</h2><hr><br>

      <table id="mainTb" border="1">

            <tr><th width="80">姓名</th><th width="250">单位</th></tr>

            <tr id="row0"><td>张辰刚</td><td>北京华夏食品有限公司</td>

                     <td><input type="button" value="删除" onclick="deleteRow(0)"></td></tr>

            <tr id="row1"><td>郭兴旺</td><td>广州天河文化传播公司</td>

                     <td><input type="button" value="删除"onclick="deleteRow(1)"></td></tr>

      </table><br>

      <div><hr>

      <span id="new">

           姓名:<input type="text" name="newName" id="newName"><br>

           单位:<input type="text" id="newCompany">&nbsp;

           <input type="button" value="添加" onclick="addRow()">

      </span>

      </div>

</body>

</html>

java-jsoup自适应爬取网页表格的内容

在爬取数据的过程中,我们有时候需要爬取页面中的表格 但表格的样式千变万化  下面的类和方法可以解析大部分的表格  得到 属性名 和 对应值.   需要的包链接:   http://downl...
  • q383965374
  • q383965374
  • 2014年01月24日 15:32
  • 4651

将网页表格的内容提取出来

继昨天的网页抓取之后,后续的处理函数
  • qq_20278449
  • qq_20278449
  • 2015年04月18日 02:24
  • 183

Selenium学习三——利用Python爬取网页表格数据并存到excel

利用Python爬取网页表格数据并存到excel 1、具体要求: 读取教务系统上自己的成绩单,并保存到本地的excel中 2、技术要求: 利用Selenium+Python获取网页,自动登陆并...
  • yxStory
  • yxStory
  • 2017年09月25日 15:10
  • 1785

网页表格内容导入excel

将访问的页面加入到可信任站点 //导出到Excel,注意,表格标记内不得有注释,因为childNodes会把注释也算进去 //如果出错,需要关闭Excel,否则Excel进程会一直运行着 //t...
  • huhuailei810
  • huhuailei810
  • 2014年02月17日 16:35
  • 391

Pandas处理表格

读取excel表 要读取的excel表的如下所示 读取excel表的代码如下:dtrcolumns = ['year-month-day','start-time','end-time','use...
  • u012176591
  • u012176591
  • 2016年01月28日 15:02
  • 1338

table表格内容太多导致样式混乱的解决方案

在开发过程难免遇到这样那样的问题。
  • fendouzhe123
  • fendouzhe123
  • 2014年05月23日 18:01
  • 1156

python3 爬取网页表格例子

我是初学者,希望对跟我一样的 “小白”有帮助 #网址如下:http://www.maigoo.com/news/463071.html from bs4 import BeautifulSoup ...
  • weixin_41059146
  • weixin_41059146
  • 2017年11月22日 16:27
  • 268

利用Jsoup爬取网页内容

jsoup的强大之处在这里就不多说,最近在写项目,需要爬取网页上的内容,自然想到的是利用Jsoup来处理,项目中是利用Jsoup爬取学校信息门户的新闻消息,然后放进客户端 网页的html代码如下...
  • system_err
  • system_err
  • 2016年09月06日 17:38
  • 1125

HTML网页设计之PHP下载生成的excel表格

消除文件名为乱码的情况
  • Velly_zheng
  • Velly_zheng
  • 2017年06月14日 09:51
  • 533

爬虫网页编码及网页内容乱码处理

更多内容请查看原文  在处理爬虫获取的网页之前,我们需要知道爬取网页的编码格式,然后才能正确的对其进行解码,编码成目标格式保存或者进行后续的文本处理。特别在是多语种环境下,正确获取网页编码格式尤为重...
  • u011801161
  • u011801161
  • 2016年03月01日 21:35
  • 2720
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:处理网页中表格内容
举报原因:
原因补充:

(最多只允许输入30个字)