JSON+XML(doc和docx的区别?)
JSON
JavaScript Object Notation是一种轻量级的数据交换格式,它不是一种编程语言,而是用来被编程语言(如Python、Java、JavaScript、C++)解析和生成
JSON使用键值对的结构来组织数据
XML
Extensible Markup Language是一种用于存储和数据传输的文本文件格式,最初设计用于交换数据,并在web服务、配置文件、数据交换等领域中广泛使用
两者区别
XML:
1 | <person> |
JSON:
1 | { |
JSON的解析通常更高效,因为JSON的结构简单
doc和docx
灵感视频来自b站
docx中的X是指XML格式,文件实际上是一个压缩包(ZIP),包含多个XML文件和其他资源(如图像),这种结构使得文件更容易被其他程序读取和解析。因为采用了压缩技术,所以docx文件较小;而且,文件损坏后,仍然可以通过解压缩和编辑XML文件进行一定程度的恢复
doc:采用二进制文件格式,内容和格式信息嵌入在文件中,难以解析和处理。
docx:采用Open XML格式
.xls和.xlsx,.ppt和.pptx的区别同理
所以,当强行把后缀改为.zip时,就可以提取出其中的信息(图像&视频)