JSON+XML(doc和docx的区别?)

JSON

JavaScript Object Notation是一种轻量级的数据交换格式它不是一种编程语言,而是用来被编程语言(如Python、Java、JavaScript、C++)解析和生成

JSON使用键值对的结构来组织数据

XML

Extensible Markup Language是一种用于存储和数据传输的文本文件格式,最初设计用于交换数据,并在web服务、配置文件、数据交换等领域中广泛使用

两者区别

XML:

1
2
3
4
<person>
<name>John</name>
<age>30</age>
</person>

JSON:

1
2
3
4
5
6
{
"person": {
"name": "John",
"age": 30
}
}

JSON的解析通常更高效,因为JSON的结构简单

doc和docx

灵感视频来自b站

docx中的X是指XML格式,文件实际上是一个压缩包(ZIP),包含多个XML文件和其他资源(如图像),这种结构使得文件更容易被其他程序读取和解析。因为采用了压缩技术,所以docx文件较小;而且,文件损坏后,仍然可以通过解压缩和编辑XML文件进行一定程度的恢复

doc:采用二进制文件格式,内容和格式信息嵌入在文件中,难以解析和处理。

docx:采用Open XML格式

.xls和.xlsx,.ppt和.pptx的区别同理

所以,当强行把后缀改为.zip时,就可以提取出其中的信息(图像&视频)