处理 CSV 文件和 JSON 数据:
- CSV(Comma-Separated Values)是一种简单的表格数据存储格式,以纯文本形式存储表格数据(数字和文本)。
- JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,采用完全独立于语言的文本格式。
PDF和Word文档采用二进制格式存储,需要通过专门的Python模块(如PyPDF2、python-docx)进行数据读取。 相比之下,CSV和JSON文件是纯文本格式,可直接用文本编辑器(如IDLE)查看内容。 为方便处理这些格式,Python提供了内置的csv和json模块,它们封装了各类实用函数来简化文件操作。
CSV(Comma-Separated Values,逗号分隔值)本质上是简化的电子表格,以纯文本形式存储表格数据。 Python的csv模块能自动处理逗号分隔、引号转义等细节,使CSV文件解析变得轻松高效。
JSON(JavaScript Object Notation的缩写,发音/"dʒeɪsən/或/"dʒeɪsɒn/"均可——有趣的是, 这个发音在技术圈永远存在争议)虽然源自JavaScript,但其纯文本特性使其成为跨语言的数据交换标准。 即使不熟悉JavaScript,通过Python的json模块也能轻松读写JSON文件。 这种格式在Web API和应用程序配置中尤为常见,掌握其结构对现代开发至关重要。