WordPress转Markdown格式

一、背景

WordPress 是一个功能强大的内容管理系统,对于不会技术的人来说特别友好。对于只想写点文章的人来说,可能会显得过于笨重。页面加载慢、主题/插件管理复杂。如果你想要更简洁的工具,使用静态网页生成器可能是个好选择。
将 WordPress 文章导出为 Markdown 格式后,你就可以使用Hugo、Jekyll 或 Gatsby 轻量级生成器来发布博客。

二、准备

在 WordPress导出XML文件:登录 WordPress 后台,进入“工具” -> “导出”。导出所有内容,会得到一个 XML 文件。

三、转换

使用 wordpress-export-to-markdown 工具来将导出的 XML 文件转换为 Markdown 文件。具体的操作可以看看项目的说明。

(一)基本流程

  1. Wordpress导出xml
  2. 安装 nodejs
  3. npx 安装插件nodejs 插件 wordpress-export-to-markdown
  4. xml用插件转成markdown

(二)详细操作

  1. 首先需要安装 Node.js。这一步不多说了,下载安装就行了。要看你是否安装成功,打开命令行工具,输入 node -v 和 npm -v,能返回版本号即可。

  2. 将该项目下载到本地并解压(插件所在地址 github https://github.com/lonekorean/wordpress-export-to-markdown)。

  3. 为了方便起见,将 WordPress 导出的文件重命名为export.xml并将其放入运行该脚本的同一目录中(该工具查找的默认文件名)。

  4. 打开命令行工具,在工具所在的目录中,运行下面的命令

npx wordpress-export-to-markdown

脚本开始运行,会询问一些如何存储数据的问题。你自己根据情况回答。

? Path to WordPress export file? (export.xml) *要解析的文件名
? Path to output folder? (output) *保存的文件夹名
? Create year folders? (y/N) y *创建年份文件夹
? Create month folders? (y/N) N *创建月份文件夹
? Create a folder for each post? (Y/n) Y *每篇文章都创建文件夹
? Prefix post folders/files with date? (y/N) y *在文件/文件夹前加上日期
? Save images attached to posts? (Y/n) Y *保存文章的图片
? Save images scraped from post body content? (Y/n) Y *保存从帖子正文抓取的图像

回答完之后,脚本就开始解析 xml 文件并开始转换文章,同时下载图片。

对,默认就是在保存文件夹(out)下面按照年月日每篇文章创建文件夹。


四、其他方案

来自:【插件发布】WordPress 批量导出 Markdown | 虹线

在此前,网上比较成熟的方案是 Will Boyd 开发的[wordpress-export-to-markdown](https://github.com/lonekorean/wordpress-export-to-markdown),它能够较好的将 WordPress 博文转换成 Markdown 格式。但比较遗憾的一点是,它是一个 Python 程序,需要你在自己的电脑上配置 Python 环境,这对小白用户来说可能有一些难度。

我很惊讶于为什么在需求如此强烈的情况下,没有一个 WordPress 的插件可以在博客中直接完成这件事。刚好赶上字节跳动的类 Cursor IDE 工具处于免费推广期,可以无限次免费使用 Claude 3.7 Sonnet。于是,我就直接让 AI 帮我写了一个。从最初版本的生成,到 Debug 完成第一次发布,大概一共用了 6 个小时。

WP Markdown Exporter – 将你的 WordPress 全站批量导出为 MD 格式

当前版本:1.0.1 (2025 年 3 月 7 日)

本插件暂时没有上 WordPress.org 官方插件目录,所以更新可能有延迟

下载地址:

Github Release

停更一年的回归

各种各样的原因,停更了有一年了。

以前总觉得云服务器ECS高攀不起(事实上也高攀不起),受知乎蛊惑,还是申请了一个99元/年的云服务器(该价格三年有效)。

话说,云服务器的确要麻烦一些,如果不是二十年前就学了一些Linux的皮毛,还真的有些搞不定。其实,说简单也简单,就是在互联网上有了一个虚拟机,这个虚拟机可以由得自己折腾,今天装Linux,明天装Windows,都可以。官方说法是:

一台云服务器ECS实例等同于一台虚拟机,包含vCPU、内存、操作系统、网络、磁盘等最基础的计算组件。

最开始是纯Linux环境下手动安装apache、mysql、php,以及还算比较熟悉的wordpress,还算顺利,跑起来了。只是,由于备案问题,只能IP访问。备案还是挺麻烦的,总体而言,是可以通过“备案接入”的方式,在不改变原备案的情况下,新增服务器接入。

后来觉得,用纯的Linux实在费劲,年纪大了,就弄个wordpress而已,不想复习Linux指令了,于是更换磁盘镜像,选择了宝塔面板。


问题集锦: Q:通过IP无法访问。 A:需要在“添加安全组规则”中开放80端口。

Q: MySQL 8安装好后异常 A: 重装MySQL 5.7……好慢……

Q: 安装好wp后,更新插件,提示:“无法连接到文件系统,请确认您的凭据。要执行请求的操作,WordPress需要访问您网页服务器的权限。 请输入您的FTP登录凭据以继续。 如果您忘记了您的登录凭据(如用户名、密码),请联系您的网站托管商。” A: 不要用客户端上传文件(默认为root),要用FTP。当然,上传了也没关系,可以变更文件所有者: chown -R www /home/www/网站文件夹

注意:MySQL的“utf8mb4”是真正的“UTF-8”,MySQL的“utf8”是一种“专属的编码”,它能够编码的Unicode字符并不多,所以安装MySQL时,一定选择“utf8mb4”。


后记:

百度真厉害~刚刚把独立域名、独立IP的木鱼琐语恢复,第二天就搜索到了1200+的记录数。

新主机,您好!

之前的虚拟主机,由于PHP和MySQL版本的问题,WordPress使用的版本是4.9.18,每次登录WordPress管理后台(时间坐标:2022年10月),都提示:“WordPress 6.0.2现已可用!请现在更新”。

国庆假期有些闲暇,申请了一个新的主机。最先下载的是WordPress 6.1。安装后发现,即便是新主机的PHP最高版本也满足不了最新版本的WordPress。在中国站长站(https://down.chinaz.com/heji/WordPress.htm)下载了5.9.3中文正式版,安装好后,嗯,仍然提示:推荐的最低PHP版本是7.4(新主机PHP的最高版本为PHP7.2.5)。算了……没过段时间,都要把数据放新版的WordPress、PHP过一下,再备份一版,不然谁知道哪天,数据就无法读取了。

就像《三体》里记载的,只有岩石才最为长久。

关于MX记录设置

比对了几家企业邮箱,总体而言,阿里邮箱和腾讯企业邮都不错,不愧是互联网大厂。网易免费企业邮箱,后台管理界面多年来还是一个样子,不过还能持续服务,还是需要点赞的。而且前端界面,也还是挺好的。

近日将域名的邮件服务器,由网易免费企业邮箱修改为腾讯企业邮,不过发现一个问题,几天如故:发信正常,但是无法收信。之前还以为是解析生效时间的问题,不过几天了都是这样。今天重新查看了域名解析记录,发现有个“解析线路”这个并非域名解析标准内容的东东,其他记录都是默认,我选了电信线路……en……改默认试试……

瞬间就成功了……我……

另外发现一个事情:

华为花瓣邮箱,失败后重试时间较短,会通知发件失败。

网易邮箱,失败后重试时间较长,这不,MX记录刚刚正常,之前石牛入海的邮件,就陆续收到了。

网站备案问题

备案的确是一个繁琐的事情。

今天多个终端(短信、备案E-mail的手机客户端、虚拟主机预留微信)收到了一则通知:《关于网站被工信部系统检出未正确放置备案编号的整改通知》

很奇怪这个事情,因为自上次备案信息修改以来,网站就没有修改过什么,特别是首页。

一、访问了首页,是严格按照《非经营性互联网信息服务备案管理办法》第十三条规定:非经营性互联网信息服务提供者应当在其网站开通时在主页底部的中央位置标明其备案编号,并在备案编号下方按要求链接信息产业部备案管理系统网址,供公众查询核对。

二、登录到虚拟主机管理页面,相关的页面也按照格式插入了相关代码。

三、用虚拟主机商的工具检查,就是不过。

后来想到,既然是程序检查,肯定不是检查肉眼观看的效果。从程序员的思维来将,一定是检查“域名+缺省首页”这个URL。由于我的首页是一个index.php的转向页面,再核实了一下,确实,body里是没有任何内容。按照规定加好后重新检测,通过。

缺点就是:如果网速较慢,在首页转向完成前,会出现孤单的备案号。

流浪的行者

虽说很少更新这里,但毕竟还在这里。

突然收到.org服务商的续费邮件,虽说是提醒,但还是赶紧登录后台,赶紧续费。结果晴天霹雳,后知后觉如我,这才知道,.org因为无法备案,服务商建议转到国外域名注册商……是的,网友说:

.org域名没有获得国家工信部备案审批,不能在国内备案。对这类不能在国内备案的域名,是不能在国内提供注册及相关服务的,会被劝离国内。

一介小民也不容易啊~各种配合实名认证,域名的、服务器的,几年来,包括到代理点现场实名认证,注册商邮寄背景布自拍认证……唯独这个.org根本就不能备案,现在又……这两个月,看来要好好学习一下了。当年学习Llinux,因为开源世界很多网站都是.org——包括Linux.org,所以选择了.org。这几年都懒了,除了续费啥都没学习了……

可是动作太快,转移请求发出后,才发现人家阿里云有阿里云海外版……

再后来又寻思,我的域名已经备案了的,有备案号的,折腾个啥……

无意间发现这篇帖子总结的挺到位。

1.阿里云将于 2021年7月20日00:00 开始对当前未取得域名注册管理机构许可的顶级域名进行清理,建议在该时间节点之前将域名从阿里云转出,并转移到海外域名注册商。 2.阿里云的后续解决方案:如您在2021年7月20日00:00前未完成域名转出,为避免影响您域名的正常使用,届时阿里云计算有限公司会将您未处理的域名转出至关联公司ALIBABA.COM SINGAPORE E-COMMERCE PRIVATE LIMITED(阿里云新加坡注册商)或其他海外注册商管理。转移后域名认领方案,请关注阿里云后续通知。 3.阿里云国际站的方案:有阿里云国际站账号,工单申请 id 间转移,这边直接将域名转移至您国际站账号内; 无阿里云国际站账号,可以工单申请,这边会提供转移密码给您,您可以转移域名至任意一个海外注册商平台。 4.海外域名服务商都哪些: Namecheap- 坚韧不拔有担当的商家 Namesilo- 没有套路的服务商 GoDaddy – 依旧行业的老大地位

更新日志

更新Blog,其实是一个误操作的结果。

本打算安装另外的Blog,主机故障导致zip文件传输不完整,在线解压功能总是出错,结果某一个时刻,居然正常了,但当时传输的zip文件是默认的wordpress.zip,导致将本Blog的wordpress程序覆盖,由于版本和配置信息不一致,导致无法访问(当然,数据库仍然是在的)。

所以备份是很重要的事情,翻出来备份硬盘,能够查找到当时的版本是wordpress-3.3.1-zh_CN,而且当时也备份了该版本的程序,以及数据库文件,当然,也有wordpress导出的xml文件。

最简单的方法,自然是将wordpress文件夹的文件替换为wordpress-3.3.1-zh_CN,修改数据库链接即可恢复。不过……既然需要折腾一次,还不如更换一个自定义的文件夹,防止下次误操作给抹除了……顺便,可以升级一个相对比较新的wordpress-4.9.4——不是不想升级到最新版本,但是php版本要升级,虽然主机也支持,但涉及很多程序的适配,想想工作量……不适合懒人我,也就算了,找一个当前php能支持的wordpress版本即可。

本次升级很简单,将wordpress-4.9.4解压至mysay目录,访问URL,配置数据库信息,然后导入之前3.3.1版本备份的wordpress导出的xml文件,等待,然后稍微调整修改即可。

之前的Blog发布目录,很多URL被搜索引擎的收录……仍然恢复了旧版本。但新版本仍然是必要的,仍以新版访问为主。

weibo.com

  面包牌面包,确实能让其他面包商石化。   weibo自己肯定不是米虫,但是无心插柳,居然被新浪看上了这个域名,瞬间爆发——前面都白奋斗了,不如当时注册域名这个行为值钱。   其实我过手的域名也不少了,不过第一个注册的域名和最后坚守的域名,还是这个。那些被我放弃的却由米虫们接手养着的域名,仍然存在,却只剩下了广告。

域名太少的烦恼……

  如果让LP看见这句话,一定要像“二大妈”(Google:“如果袭警算犯罪的话”)一样K我。   不过我还是得说,互联网的创新其实真的是越来越多了,而且很多都直接和域名相关。   Google自不必说了,其企业应用套件(https://www.google.com/a/yourdomain/)是非常成功的,目前还没有和它比肩的。国内来讲,网易和腾讯真的是你一枪我一炮的针对域名邮箱、企业邮箱开始大干起来。前段时间,腾讯推出域名邮箱,没多久,网易就推出企业邮箱,今天打开邮箱才发现,8月底,腾讯开始企业邮箱的内测……只可惜域名太少,有绑Google企业套件的,有绑网易企业邮箱的,以前还绑过(现在还没有解绑)搜狗企业邮箱(不过搜狗应该退出竞争了,没有多少竞争力了注:搜狗貌似仍然没有放弃,在以前那个破烂不堪的企业邮箱之外,另外开放一个全新的企业邮箱)和腾讯的域名邮箱,现在恨不得多个域名绑腾讯的企业邮箱去测试一下,看看究竟谁的服务更好。   不得不承认,后来者(或者说“抄袭者”?)的服务确实要好一些。经过初步体验,腾讯的企业邮箱比网易的企业邮箱增加了企业组织架构和域名绑定——而后者是比较重要的,可以保证对用户透明,切换了企业邮箱提供商不必通知用户变更访问地址。    (呃……刚刚发现原来网易企业邮也是有这个功能的。区别:网易的CNAME后访问的首页仍然是自己的域名,但输入邮箱的时候,仍需要自己输入完整域名;而腾讯的用自己的域名访问后,立即就转向到腾讯的域名了,但输入邮箱的时候,@后面已经不用用户输入了。)em>(呃……刚刚发现原来网易企业邮也是有这个功能的。区别:网易的CNAME后访问的首页仍然是自己的域名,但输入邮箱的时候,仍需要自己输入完整域名;而腾讯的用自己的域名访问后,立即就转向到腾讯的域名了,但输入邮箱的时候,@后面已经不用用户输入了。)</em   其他的功能,诸如QQ号码绑定,邮件短信通知(仅移动手机)等,都还是值得尝试的。