修改发布时间不超过发文时间6天

UPDATE  dbo.T_ARTICLE
        SET     PUBLISH_TIME = DATEADD(DAY,
                                       6 - DATEDIFF(day, FILE_TIME,
                                                    PUBLISH_TIME),
                                       PUBLISH_TIME)
        WHERE   PUBLISH_TIME >= '2014/01/06'
                AND FILE_TIME IS NOT NULL
                AND DATEDIFF(DAY, FILE_TIME, PUBLISH_TIME) > 7

  

转载于:https://www.cnblogs.com/wenghaowen/p/3512314.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,这个问题涉及到爬虫技术和数据处理技术,需要一些代码实现。以下是大致的步骤: 1. 安装Python的requests、BeautifulSoup、pandas等库。 2. 使用requests库发送HTTP请求获取微博页面的HTML代码。 3. 使用BeautifulSoup库解析HTML代码,获取微博列表中每个微博的URL。 4. 循环遍历每个微博的URL,再次使用requests库发送HTTP请求获取微博详情页的HTML代码。 5. 使用BeautifulSoup库解析微博详情页HTML代码,获取微博的评论数、点赞数、发文时间、转发数以及发文内容。 6. 将获取到的数据存储到一个Pandas的DataFrame中,方便进行数据处理和分析。 下面是示例代码,仅供参考: ```python import requests from bs4 import BeautifulSoup import pandas as pd # 构造HTTP请求头部 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 发送HTTP请求获取微博页面HTML代码 url = 'https://weibo.com/' response = requests.get(url, headers=headers) html = response.text # 使用BeautifulSoup解析HTML代码获取微博列表中的每个微博URL soup = BeautifulSoup(html, 'html.parser') weibo_list = soup.find_all('div', class_='card-wrap') weibo_urls = [] for weibo in weibo_list: weibo_url = weibo.find('a', class_='name')['href'] weibo_urls.append(weibo_url) # 循环遍历每个微博URL,获取微博详情页HTML代码 weibo_data = [] for weibo_url in weibo_urls: response = requests.get(weibo_url, headers=headers) html = response.text # 使用BeautifulSoup解析微博详情页HTML代码,获取微博的评论数、点赞数、发文时间、转发数以及发文内容 soup = BeautifulSoup(html, 'html.parser') # 评论数 comment_count = soup.find('span', class_='comment-txt').text # 点赞数 like_count = soup.find('span', class_='like-txt').text # 发文时间 time = soup.find('span', class_='time').text # 转发数 repost_count = soup.find('span', class_='forward-txt').text # 发文内容 content = soup.find('div', class_='weibo-text').text # 将获取到的数据存储到一个Pandas的DataFrame中 data = {'评论数': comment_count, '点赞数': like_count, '时间': time, '转发数': repost_count, '内容': content} weibo_data.append(data) df = pd.DataFrame(weibo_data) print(df) ``` 需要注意的是,该代码仅能获取当前用户的公开微博,如果想要获取其他用户的微博数据,还需要进行登录操作或者其他身份验证方式。同时,由于微博网页结构经常发生变化,所以代码的可用性和稳定性可能会受到影响。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值