如何获取公众号文章并保存有道笔记

写作目的

做这个程序是出于自己的学习目的。因为我有学习英语的习惯,每天看公众号TeachGwen的推送文章,并把相关文章短语词汇记录到有道笔记,方便以后复习。但又不是每次都可以在电脑面前学习,很多时候是对着手机看,手机上粘贴复制到有道笔记很麻烦,还容易出错。于是萌生了写个python爬虫自动抓取文章并保存有道笔记的想法。从有这个想法到最后写成,时间也不长,网上资料很多,实现也不复杂,主要使用了爬虫常用的request,xml解析等模块。

该程序分三部分:

1. 获取公众号文章链接

这部分参考了爬虫如何爬取微信公众号文章,利用微信订阅号里面的查询公众号文章的功能来爬取公众号文章的url,更新时间等信息。

  • https://mp.weixin.qq.com/ 在这里申请订阅号,注册登录后,在公众号系统里面->内容与互动->草稿箱->新的创作->写新图文->超链接->公众号搜索
    如下: 查找公众号

  • 点击搜索,便出现了该公众号下所有文章的列表。
    Develop Tool

  • 利用chrome中的develop tool获取 Request URL, Headers等信息来构造request请求包。
    url里面包括了begin和count参数,表示翻页获取任何也一页内所有文章列表。同样可以构造不同的url来获取你想要页数的所有文章。

  • 注意事项

    • 因为公众号登录的cookie是有时效的,大概一周,不能一直使用一个cookie。
    • python爬虫如何实现每天爬取微信公众号的推送文章方法也不再好用,因为微信网页版已经不能通过wxpy登陆,这个方法也无效。
    • 而且登录需要扫描微信二维码,旦旦账号密码也不能完成登录。
    • 目前只能自己手动登录获取cookie再执行程序,没有其他好的办法。如果有大神指点感激不尽。
self.headers = {
   
            "Cookie": "appmsglist_action_3889698448=card; ***", #此处使用自己的cookie
            "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36",
        }

for i in range(30):
    self.BEGIN = str(i * 5)
	url = "https://mp.weixin.qq.com/cgi-bin/appmsg?action=list_ex&begin={BEGIN}&count=5&fakeid={FAKEID}&type=9&query=&token={TOKEN}&lang=zh_CN&f=json&ajax=1".format(
	                BEGIN=self.BEGIN, FAKEID=self.FAKEID, TOKEN=self.TOKEN)
	                
	r = requests.request("GET", url, headers=self.headers)
	
	content_json = r.json()

200即成功返回,把其中的app_msg_list中的时间日期,标题&

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
获取单词发音MP3需要通过有道词典API来实现,下面是一个简单的实现步骤: 1.获取有道词典API的appKey和appSecret,可以在有道词典官网申请。 2.使用HTTP请求调用有道词典API查询单词发音MP3的URL地址。 3.使用URL地址获取单词发音MP3,并播放该音频。 以下是一个简单的示例: ```java public class MainActivity extends AppCompatActivity { private static final String APP_KEY = "your_app_key"; private static final String APP_SECRET = "your_app_secret"; private static final String API_URL = "http://openapi.youdao.com/api?q=%s&from=EN&to=EN&appKey=%s&salt=%d&sign=%s"; private MediaPlayer mediaPlayer; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_main); Button button = findViewById(R.id.btn_query); button.setOnClickListener(new View.OnClickListener() { @Override public void onClick(View v) { EditText editText = findViewById(R.id.et_word); String word = editText.getText().toString(); queryWord(word); } }); } private void queryWord(final String word) { new Thread(new Runnable() { @Override public void run() { try { long salt = System.currentTimeMillis(); String sign = generateSign(word, salt); String url = String.format(API_URL, URLEncoder.encode(word, "UTF-8"), APP_KEY, salt, sign); String result = HttpUtils.get(url); JSONObject jsonObject = new JSONObject(result); if (jsonObject.has("speakUrl")) { String speakUrl = jsonObject.getString("speakUrl"); playAudio(speakUrl); } } catch (Exception e) { e.printStackTrace(); } } }).start(); } private String generateSign(String word, long salt) throws NoSuchAlgorithmException { String input = APP_KEY + word + salt + APP_SECRET; MessageDigest md5 = MessageDigest.getInstance("MD5"); byte[] bytes = md5.digest(input.getBytes()); StringBuilder builder = new StringBuilder(); for (byte b : bytes) { builder.append(String.format("%02x", b)); } return builder.toString(); } private void playAudio(final String url) { runOnUiThread(new Runnable() { @Override public void run() { if (mediaPlayer != null) { mediaPlayer.stop(); mediaPlayer.release(); mediaPlayer = null; } mediaPlayer = new MediaPlayer(); try { mediaPlayer.setDataSource(url); mediaPlayer.prepareAsync(); mediaPlayer.setOnPreparedListener(new MediaPlayer.OnPreparedListener() { @Override public void onPrepared(MediaPlayer mp) { mp.start(); } }); } catch (IOException e) { e.printStackTrace(); } } }); } } ``` 在这个示例中,我们使用了一个第三方的HttpUtils工具类来发送HTTP请求,你也可以使用原生的HttpURLConnection来实现。同时需要注意的是,在访问有道词典API时需要使用HTTPS协议,否则会返回401错误。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值