测试数据--Excel 获取百家姓

  1. 搜索复制百家姓。
  2. 新建表格并粘贴。

  3. 选中数据 - 数据 - 分列 - 智能分列。

  4. 点击“手动设置分列”。

  5. 选文本类型 - 中文 - 下一步 - 完成。

  6. 分列完成后,在第一列最后一行输入“=b1”。

  7. 选中A41,向右拖动鼠标到J列,此时我们发现,对应的位置已经开始复制第一行后面的数据,由于最后一个数据为空,在此显示为0。

  8. 顺着J列继续向下拖动鼠标填充数据,我们会发现,在A列中已经按照预想的结果,复制其他列数据。由于有些内容为空,所以拖动的结果有些显示为0。

  9. 通过上述操作一直到A列中的数据也显示为0为止。所有的内容已经全部复制到了A列。

  10. 我们复制想要的数据到需要的位置,选择性粘贴为数值
    其他列数据和0都为辅助数据,可以全部删除。
  11. 再次分列。

     
  12. 在P列输入“=N1&O1”,合并单元格内容,向下填充,得到想要的数据。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 下面是一个爬取百家姓的简单示例代码: ```python import requests from bs4 import BeautifulSoup url = 'https://baike.baidu.com/item/%E7%99%BE%E5%AE%B6%E5%A7%93' response = requests.get(url) soup = BeautifulSoup(response.text, 'lxml') surnames = soup.find_all('a', {'target': '_blank'}) for surname in surnames: print(surname.get_text()) ``` 这段代码使用了requests和BeautifulSoup库,首先通过requests库向百度百科百家姓页面发送请求,然后使用BeautifulSoup解析HTML页面,最后遍历页面上的所有链接并打印出姓氏。 ### 回答2: Python爬虫能够帮助我们自动从网页上获取数据。要获取百家姓的数据,我们可以使用Python爬虫来访问一个包含百家姓列表的网页,并将数据提取出来。 首先,我们需要使用Python的requests库来发送HTTP请求,并获取网页的内容。然后,我们可以使用BeautifulSoup库来解析网页内容,并提取我们需要的数据。在这个情况下,我们需要提取百家姓的数据。 大致的步骤如下: 1. 导入所需的库,包括requests和BeautifulSoup。 ``` import requests from bs4 import BeautifulSoup ``` 2. 使用requests库发送HTTP请求并获取网页内容。 ``` url = 'http://xxx.com/baijiaxing.html' # 网页的URL response = requests.get(url) content = response.text ``` 3. 使用BeautifulSoup库解析网页内容,找到包含百家姓数据的标签。 ``` soup = BeautifulSoup(content, 'html.parser') table = soup.find('table', {'class': 'bjx_table'}) ``` 4. 从找到的标签中提取百家姓的数据,可以使用循环遍历每一行,并将数据保存到一个列表中。 ``` baijiaxing = [] rows = table.find_all('tr') for row in rows: cols = row.find_all('td') baijiaxing.append(cols[0].text.strip()) ``` 5. 打印百家姓数据。 ``` for xing in baijiaxing: print(xing) ``` 通过以上步骤,我们可以使用Python爬虫获取百家姓的数据,并进行进一步的处理和分析。当然,在实际使用中,我们要注意合法使用爬虫并尊重网站的规则和约束。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值