一、Mongodb简介
MongoDB 是一个开源的 NoSQL数据库系统,它是一个面向文档的数据库,使用 JSON 格式来存储和查询数据。MongoDB 是一个非关系型数据库,它的设计目标是以高性能、高可用性和可扩展性为特点,适用于处理大量的非结构化数据。
特点:
- MongoDB 是一个面向文档存储的数据库,操作起来比较简单和容易。
- 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName="Sameer",Address="8 Gandhi Road")来实现更快的排序。
- 你可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性。
- 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。
- Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
- MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
- Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
- Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
- Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
- GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
- MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
- MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
- MongoDB安装简单。
附:数据存储形式(json)
JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,常用于前后端数据传输和存储。它使用键值对的方式来表示数据,数据类型包括字符串、数字、布尔值、数组、对象等。
{
"_id": ObjectId("5f8d5d7634f4a71e4c2e6a1a"),
"name": "John Doe",
"age": 30,
"email": "johndoe@example.com",
"address": {
"street": "123 Main St",
"city": "New York",
"state": "NY",
"zip": "10001"
},
"interests": ["sports", "music", "reading"],
"created_at": ISODate("2021-01-01T10:30:00Z")
}
在这个例子中,我们有一个名为"users"的集合,其中包含一个文档。文档有多个字段,包括_id、name、age、email、address、interests和created_at。
_id字段是一个唯一的主键,用于标识文档。它是一个ObjectId类型的值。
其他字段包含不同类型的数据。例如,name字段是一个字符串,age字段是一个整数,email字段是一个字符串,address字段是一个嵌入文档,interests字段是一个数组,created_at字段是一个日期。
附:json与python中的数据字典
在上述例子中,我们不难发现json的格式与数据字典高度相似,因为它们都采用了键值对的形式来表示数据。
以下是一些导致JSON格式和数据字典相似的原因:
-
键值对表示:JSON和数据字典都使用键值对的形式来表示数据。键用于标识字段或属性的名称,值则表示对应的数据。
-
嵌套结构:JSON和数据字典都支持嵌套结构,可以在一个字段的值中包含另一个键值对集合,形成层级结构。
-
多种数据类型:JSON和数据字典都支持多种数据类型,包括字符串、数字、布尔值、数组和嵌套对象等。
-
可读性:JSON和数据字典都以人类可读的格式表示数据,易于理解和解析。
主要存在的区别:
-
数据表示方式:JSON是一种数据交换格式,用于在不同系统之间传输和存储数据。它使用键值对的形式表示数据,并支持多种数据类型。数据字典是一种文档或定义,用于描述数据的结构和含义,通常用于数据建模、数据管理和文档化数据。
-
用途和背景:JSON主要用于数据交换和存储,特别是在Web应用程序之间传输数据。它是一种轻量级的格式,易于解析和处理。数据字典主要用于描述数据的结构、含义和元数据。它可以用于数据管理、数据文档化、数据查询等方面。
-
基于标准:JSON是一种开放标准,由ECMA国际组织(ECMA-404标准)和RFC 7159定义。它具有通用性和跨平台的优势。数据字典没有一个特定的标准,通常是由组织或个人定义的,可以根据需求进行定制和扩展。
-
应用范围:JSON广泛用于前后端数据传输、API交互、配置文件等领域。数据字典主要用于数据建模、数据管理、数据文档化等领域,通常与数据库和数据管理工具配合使用。
二、pymongo库
pymongo为python提供了丰富的操作mongodb数据库的方法,我们可以通过pymongo库中的函数方便地连接到mongodb数据库,并进行数据操作和查询。
安装 pymongo
pip install pymongo
三、连接到数据库
from pymongo import MongoClient
# 连接到本地MongoDB服务器
client = MongoClient()
# 连接到指定数据库
db = client.mydatabase
# 连接到指定集合(相当于关系型数据库中的表)
collection = db.mycollection
四、数据操作与查询
在pymongo库中,用于进行数据操作和查询的一些常用函数包括:
- insert_one(): 插入一条数据到集合中。
- insert_many(): 插入多条数据到集合中。
- find_one(): 查询并返回集合中的第一条数据。
- find(): 查询并返回满足条件的所有数据。
- update_one(): 更新满足条件的第一条数据。
- update_many(): 更新满足条件的所有数据。
- delete_one(): 删除满足条件的第一条数据。
- delete_many(): 删除满足条件的所有数据。
- count_documents(): 统计满足条件的数据数量。
- distinct(): 返回满足条件的字段的去重值。
- aggregate(): 使用聚合管道进行数据处理和分析。
- create_index(): 创建索引以提高查询性能。
- drop_index(): 删除索引。
- list_indexes(): 列出集合中的所有索引。
示例:文章来源:https://uudwc.com/A/4rnyx
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["mydatabase"]
# 插入一条数据
collection = db["customers"]
data = { "name": "John", "address": "Highway 37" }
inserted_data = collection.insert_one(data)
print(inserted_data.inserted_id)
# 插入多条数据
data_list = [
{ "name": "Amy", "address": "Apple st 652" },
{ "name": "Hannah", "address": "Mountain 21" },
{ "": "Michael", "address": "Valley 345" },
]
inserted_data = collection.insert_many(data_list)
print(inserted_data.inserted_ids)
# 查询所有数据
results = collection.find()
for result in results:
print(result)
# 根据条件查询数据
query = { "address": "Mountain 21" }
results = collection.find(query)
for result in results:
print(result)
# 更新一条数据
query = { "address": "Mountain 21" }
new_data = { "$set": { "address": "Canyon 123" } }
collection.update_one(query, new_data)
# 更新多条数据
query = { "address": { "$regex": "^S" } }
new_data = { "$set": { "name": "Minnie" } }
collection.update_many(query, new_data)
# 删除一条数据
query = "address": "Highway 37" }
collection.delete_one(query)
# 删除多条数据
query = { "address": { "$regex": "^S" } }
collection.delete_many(query```
文章来源地址https://uudwc.com/A/4rnyx