一、前言
随着不断的壮大和成熟,互联网刚兴起时那充满了激情、自由和分享的精神也逐渐趋于商业化、垄断化。跟随者互联网这一不可逆转的趋势,很多优秀的内容已经难以在搜索引擎中随意找到。你不得不下载或者关注各种各样的平台来获取想要的信息。
微信公众号便是这些内容平台中的佼佼者,每天有不计其数的文章发布在上面。但是,如果你想要保存这些文章,你可能会遇到一些困难,它不像普通的网页那样方便采集和转存。并且,微信文章的格式也不是很标准,有时候会出现乱码、错位等问题。
那么,有没有什么办法可以轻松地批量获取微信文章,甚至将格式保存为HTML、Markdown或PDF呢?答案是有的,今天我就要给大家介绍一个非常好用的开源微信公众号文章下载工具,它就是wechatDownload。
二、介绍
wechatDownload 是一个微信公众号文章下载工具,使用Electron和Typescript开发,通过http代理获取微信公号文章列表和内容,支持将文章转换成HTML、Markdown、PDF等格式,也可以保存至Mysql数据库,下载图片、音频、评论等数据。它的特点有:
- 支持选择下载范围
- 将网页抓换成HTML、Markdown、PDF
- 将网页源码保存至Mysql(下载来源是网络才有效)
- 下载图片、音频到本地
- 添加原文链接、元数据(作者、时间、公号名)
- 跳过现有文章
- 下载评论
- 下载来源(此选项只影响批量下载):
- 网络:就是从微信接口获取文章
- 数据库:如果选择了保存至Mysql选项,数据库中会保存文章的网页源码,此时如果需要将源码转换成HTML、Markdown ,选择下载来源是数据库即可。(微信接口用得多会被限制)
三、开源地址及下载地址
开源地址
下载地址:点击进入下载页面
四、使用方法
使用该工具的方法非常简单,只需要几步就可以完成:
- 单篇文章下载直接输入链接,点击下载按钮即可此方式无需登录微信,也因此无法获取评论和文章中QQ音乐音频,如需要这两样数据,请使用批量下载或监控下载
- 批量下载
- 监控下载
- 保存至 MySql需要执行 /doc/mysql.sql 文件中的 SQL 语句创建表
- 线程配置时间间隔:单位是毫秒,假设时间间隔500,单线程是下载完一篇文章,等待500毫秒再继续下载。多线程就是每500毫秒异步下载文章,无需等待上一篇文章下载完成。单批数量:假设单批数量10,每次会同时异步下载10篇文章,等待这10篇下载完成,再继续下载10篇。
就这样,你就可以轻松地下载微信公众号的文章了。你可以在本地或数据库中查看或处理你下载的文章,也可以将它们转换成 HTML 或 Markdown 格式,方便进行保存或转载。