Python解析JSON对象

# Python解析JSON对象

本章节我们将为大家介绍如何使用 Python 语言来编码和解码 JSON 对象。

json处理模块的主要任务,是将一个JSON对象,转换成Python数据类型数据进行处理,或者反之,将Python数据类型数据,转换成JSON对象(字符串流),在不同的模块或者系统间传输。

@[toc]

1. JSON数据格式特点

  1. 对象表示为键值对
  2. 数据由逗号分隔
  3. 花括号保存对象
  4. 方括号保存数组
{
    "students": [
        { "name":"北山啦" , "age":20 },
        { "name":"张三" , "age":30 },
        { "name":"里斯" , "age":17 }
    ]
}
{'students': [{'name': '北山啦', 'age': 20},
  {'name': '张三', 'age': 30},
  {'name': '里斯', 'age': 17}]}

上面就是一个JSON格式数据。它开起来就像是在Python中的字典数据类型。我们可以通过json模块将它转换成字符串或者反过来将字符串转换成字典数据类型。

JSON也支持各种数据类型,它的数据类型和Python各种数据类型之间的对比如下:

  • object —— dict
  • array —— list
  • string —— str
  • number —— int/float
  • true/false —— True/False
  • null —— None

2. 常用方法总结

在json模块中,用于处理json的主要是四个函数,分别是:

  • loads():从JSON字符串中读取数据并转换成Python数据类型
  • load():从JSON文件中读取数据并转换成Python数据类型
  • dumps():将Python数据类型数据转换成JSON字符串
  • dump():将Python数据类型数据转换成JSON字符串写入到文件

3. 序列化和反序列化

  • 从JSON数据转换到Python数据,叫反系列化(deserialization)
  • 从Python数据转换到JSON数据,叫系列化(serialization)

3.1 序列化

系列化:将Python数据转换成JSON字符串的方法。

下面我们先来看一个简单的例子。

import json

data = {
    "students": [
        { "name":"北山啦" , "age":20 },
        { "name":"张三" , "age":30 },
        { "name":"里斯" , "age":17 }
    ]
}
print(type(data))
print(data)
json_str = json.dumps(data)
print(type(json_str))
<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
<class 'str'>

上面的例子中,虽然看起来数据没有发生变化,但其实它们的数据类型已经发生了本质的改变:将字典数据类型的data,转换成了str类型,然后我们就可以将这个str类型的数据转换成流,在网络上进行传输或者写入到文件等。

import json

data = {
    "students": [
        { "name":"北山啦" , "age":20 },
        { "name":"张三" , "age":30 },
        { "name":"里斯" , "age":17 }
    ]
}

print(type(data))
print(data)
json_str = json.dumps(data, separators=('>>','::'), indent=2)
print(json_str)
<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
{
  "students"::[
    {
      "name"::"\u5317\u5c71\u5566">>
      "age"::20
    }>>
    {
      "name"::"\u5f20\u4e09">>
      "age"::30
    }>>
    {
      "name"::"\u91cc\u65af">>
      "age"::17
    }
  ]
}

将data写入txt文件中

import json

data = {
    "students": [
        { "name":"北山啦" , "age":20 },
        { "name":"张三" , "age":30 },
        { "name":"里斯" , "age":17 }
    ]
}
with open("students.txt","w") as fp:
    json.dump(data, fp, ensure_ascii=False)
    print("finish")
finish

这样就将data写入了students.txt,看看是不是已经将数据写进去了。

3.2 反序列化

从JSON数据转换到Python类型数据,叫反系列化。可以通过loads()/load()这两个方法来完成。

import json
with open("students.txt") as fp:
    data = json.load(fp)
    """取出字典key为students的数据,
    得到一个list,再从这个list中取第一个数据"""
    print(data['students'][0])  

{'name': '北山啦', 'age': 20}
  1. ==parse_int参数==

默认值为None,如果指定了parse_int,用来对JSON int字符串进行解码,这可以用于为JSON整数使用另一种数据类型或解析器。

parse_int参数,这里我们简单将其指定为float类型。

import json
with open("students.txt") as fp:
    data = json.load(fp, parse_int = float)
    print(data)

{'students': [{'name': '北山啦', 'age': 20.0}, {'name': '张三', 'age': 30.0}, {'name': '里斯', 'age': 17.0}]}

可以看到,age原来是整数类型,通过parse_int已经被转换成了float类型。

  1. ==object_hook==

默认值为None,object_hook是一个可选函数,此功能可用于实现自定义解码器。指定一个函数,该函数负责把反序列化后的基本类型对象转换成自定义类型的对象。

def fromJSON(dct):  # 这里会对所有的字典数据类型都进行遍历
    if isinstance(dct, dict) and 'students' in dct:
        return dct['students']
    else:
        return Student(dct['name'], dct['age'])

import json

with open("students.txt") as fp:
    data = json.load(fp, object_hook=fromJSON)
    print(data)



[姓名: 北山啦, 年龄: 20, 姓名: 张三, 年龄: 30, 姓名: 里斯, 年龄: 17]

到这里就结束了,如果对你有帮助,欢迎点赞关注评论,你的点赞对我很重要

合智互联客户成功服务热线:400-1565-661

admin
admin管理员

上一篇:【华为云社区内容共创者火热招募中】第三弹:最美人间四月天,共创学习好时节!
下一篇:地标识别算法

留言评论

暂无留言
取消
扫码支持