mongodb 学习笔记-白红宇

mongodb 学习笔记

阅读量：7289 次

发布时间：2019-06-30

本文共 15445 字，大约阅读时间需要 51 分钟。

1.mongodb简介：

　　它是一个基于文档的非关系数据库提供程序。

　　优点：

MongoDB 的架构较少。它是一个文档数据库，它的一个集合持有不同的文档。

从一个到另一个的文档的数量，内容和大小可能有差异。

MongoDB 中单个对象的结构很清淅。

MongoDB 中没有复杂的连接。

MongoDB 提供深度查询的功能，因为它支持对文档的强大的动态查询。

MongoDB 很容易扩展。

它使用内部存储器来存储工作集，这是其快速访问的原因。

应用场景

- 大而复杂的数据
- 移动和社会基础设施数据
- 内容管理和交付
- 用户数据管理
- 数据中心

在本章中，我们将学习如何从MongoDB集合中查询文档。

find()方法

要从MongoDB集合查询数据，需要使用MongoDB的find()方法。

语法

find()命令的基本语法如下：

>db.COLLECTION_NAME.find(document)

find()方法将以非结构化的方式显示所有文档。

pretty()方法

要以格式化的方式显示结果，可以使用pretty()方法。

语法

> db.mycol.find().pretty()

示例

>db.mycol.find().pretty(){   "_id": 100,   "title": "MongoDB Overview",    "description": "MongoDB is no sql database",   "by": "yiibai tutorials",   "url": "http://www.yiibai.com",   "tags": ["mongodb", "database", "NoSQL"],   "likes": "100"}>

除了find()方法外，还有一个findOne()方法，它只返回一个文档。

MongoDB 与 RDBMS的等效 Where 子句

要在一些条件的基础上查询文档，可以使用以下操作。

操作	语法	示例	RDBMS等效语句
相等	`{<key>:<value>}`	`db.mycol.find({"by":"yiibai"}).pretty()`	`where by = 'yiibai'`
小于	`{<key>:{$lt:<value>}}`	`db.mycol.find({"likes":{$lt:50}}).pretty()`	`where likes < 50`
小于等于	`{<key>:{$lte:<value>}}`	`db.mycol.find({"likes":{$lte:50}}).pretty()`	`where likes <= 50`
大于	`{<key>:{$gt:<value>}}`	`db.mycol.find({"likes":{$gt:50}}).pretty()`	`where likes > 50`
大于等于	`{<key>:{$gte:<value>}}`	`db.mycol.find({"likes":{$gte:50}}).pretty()`	`where likes >= 50`
不等于	`{<key>:{$ne:<value>}}`	`db.mycol.find({"likes":{$ne:50}}).pretty()`	`where likes != 50`

下面我们将对上表中的所有操作演示 -

MongoDB中的AND操作符

语法

在find()方法中，如果通过使用’，‘将它们分开传递多个键，则 MongoDB 将其视为AND条件。以下是AND的基本语法 -

>db.mycol.find(   {      $and: [         {key1: value1}, {key2:value2}      ]   }).pretty()

示例

以下示例将显示由“yiibai tutorials”编写并且标题为“MongoDB Overview”的所有教程。

> db.mycol.find({$and:[{"by":"yiibai tutorials"},{"title": "MongoDB Overview"}]}).pretty(){        "_id" : 100,        "title" : "MongoDB Overview",        "description" : "MongoDB is no sql database",        "by" : "yiibai tutorials",        "url" : "http://www.yiibai.com",        "tags" : [                "mongodb",                "database",                "NoSQL"        ],        "likes" : 100}>

对于上面给出的例子，等效的SQL where子句是 -

SELECT * FROM mycol where by ='yiibai tutorials' AND title ='MongoDB Overview'

可以在find子句中传递任意数量的键值。

MongoDB中的OR操作符

语法

在要根据OR条件查询文档，需要使用$or关键字。以下是OR条件的基本语法 -

>db.mycol.find(   {      $or: [         {key1: value1}, {key2:value2}      ]   }).pretty()

示例

以下示例将显示由“yiibai tutorials”编写或标题为“MongoDB Overview”的所有教程。

>db.mycol.find({$or:[{"by":"yiibai tutorials"},{"title": "MongoDB Overview"}]}).pretty(){   "_id": 100,   "title": "MongoDB Overview",    "description": "MongoDB is no sql database",   "by": "yiibai tutorials",   "url": "http://www.yiibai.com",   "tags": ["mongodb", "database", "NoSQL"],   "likes": "100"}>

使用 AND 和 OR 条件一起

示例

以下示例将显示likes大于10以及标题是“MongoDB Overview”或者“yiibai tutorials”的所有文档。等价SQL where子句为 -

SELECT * FROM mycol where likes> 10 AND(by ='yiibai tutorials' OR title ='MongoDB Overview')

>db.mycol.find({"likes": {$gt:10}, $or: [{"by": "yiibai tutorials"},   {"title": "MongoDB Overview"}]}).pretty(){   "_id": 100,   "title": "MongoDB Overview",    "description": "MongoDB is no sql database",   "by": "yiibai tutorials",   "url": "http://www.yiibai.com",   "tags": ["mongodb", "database", "NoSQL"],   "likes": "100"}>

查询嵌入/嵌套文档

这里演示如何使用：db.collection.find()方法对嵌入/嵌套文档的查询操作的示例。此页面上的示例使用inventory集合。要填充库存(inventory)集合以准备一些数据，请运行以下命令：

db.inventory.insertMany( [   { item: "journal", qty: 25, size: { h: 14, w: 21, uom: "cm" }, status: "A" },   { item: "notebook", qty: 50, size: { h: 8.5, w: 11, uom: "in" }, status: "A" },   { item: "paper", qty: 100, size: { h: 8.5, w: 11, uom: "in" }, status: "D" },   { item: "planner", qty: 75, size: { h: 22.85, w: 30, uom: "cm" }, status: "D" },   { item: "postcard", qty: 45, size: { h: 10, w: 15.25, uom: "cm" }, status: "A" }]);

匹配嵌入/嵌套文档

要在作为嵌入/嵌套文档的字段上指定相等条件，请使用查询过滤器文档{<field>：<value>}，其中<value>是要匹配的文档。

例如，以下查询选择字段size等于{ h: 14, w: 21, uom: "cm" }的所有文档：

db.inventory.find( { size: { h: 14, w: 21, uom: "cm" } } )

整个嵌入式文档中的相等匹配需要精确匹配指定的<value>文档，包括字段顺序。

例如，以下查询与库存(inventory)集合中的任何文档不匹配：

db.inventory.find(  { size: { w: 21, h: 14, uom: "cm" } }  )

查询嵌套字段

要在嵌入/嵌套文档中的字段上指定查询条件，请使用点符号(“field.nestedField”)。

在嵌套字段上指定等于匹配

以下示例选择在size字段中嵌套的字段uom等于“in”的所有文档：

db.inventory.find( { "size.uom": "in" } )

使用查询运算符指定匹配

查询过滤器文档可以使用查询运算符来指定，如以下形式的条件：

以下查询使用size字段中嵌入的字段h中的小于运算符($lt)：

db.inventory.find( { "size.h": { $lt: 15 } } )

指定AND条件

以下查询选择嵌套字段h小于15的所有文档，嵌套字段uom等于“in”，status字段等于“D”：

db.inventory.find( { "size.h": { $lt: 15 }, "size.uom": "in", status: "D" } )

MongoDB的update()和save()方法用于将集合中的文档更新。update()方法更新现有文档中的值，而save()方法使用save()方法中传递的文档数据替换现有文档。

MongoDB Update()方法

update()方法更新现有文档中的值。

语法

update()方法的基本语法如下 -

> db.COLLECTION_NAME.update(SELECTION_CRITERIA, UPDATED_DATA)

示例

考虑mycol集合具有以下数据 -

> db.mycol.find({}, {'_id':1, 'title':1}){ "_id" : 100, "title" : "MongoDB Overview" }{ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }>

以下示例将为标题为“MongoDB Overview”的文档设置为“New Update MongoDB Overview”。

> db.mycol.find({'title':'MongoDB Overview'},{'_id':1, 'title':1}){ "_id" : 100, "title" : "MongoDB Overview" }> # 更新操作> db.mycol.update({'title':'MongoDB Overview'},{$set:{'title':'New Update MongoDB Overview'}})WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })> # 查询更新后的结果 -> db.mycol.find({'_id':100},{'_id':1, 'title':1}){ "_id" : 100, "title" : "New Update MongoDB Overview" }>

默认情况下，MongoDB只会更新一个文档。要更新多个文档，需要将参数’multi‘设置为true。

>db.mycol.update({'title':'MongoDB Overview'},   {$set:{'title':'New Update MongoDB Overview'}},{multi:true})

MongoDB Save()方法

save()方法使用save()方法中传递的文档数据替换现有文档。

语法

MongoDB save()方法的基本语法如下所示：

>db.COLLECTION_NAME.save({_id:ObjectId(),NEW_DATA})

以下示例将_id为 100 的文档使用新的文档替换。

db.mycol.save(   {      "_id" : 100, "title":"Update By Save()Method.", "by":"yiibai.com"   })WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })db.mycol.find({'_id':100}, {'_id':1, 'title':1}){ "_id" : 100, "title" : "Update By Save()Method." }

MongoDB中，投影表示仅选择所需要字段的数据，而不是选择整个文档字段的数据。如果某个文档有5个字段，但只要显示3个字段，那么就只选择3个字段吧，这样做是非常有好处的。

find()方法

MongoDB的find()方法，在 MongoDB 中此方法接收的第二个可选参数是要检索的字段列表。在MongoDB中，当执行find()方法时，它默认将显示文档的所有字段。为了限制显示的字段，需要将字段列表对应的值设置为1或0。1用于显示字段，而0用于隐藏字段。

具有投影的find()方法的基本语法如下：

语法

>db.COLLECTION_NAME.find({},{KEY:1})

假设集合mycol有以下数据 -

> db.mycol.find({}, {'_id':1, 'title':1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>

以下示例将在查询文档时只显示文档的标题。

> db.mycol.find({}, {'title':1,'_id':0}){ "title" : "MongoDB Guide" }{ "title" : "NoSQL Database" }{ "title" : "Python Quick Guide" }{ "title" : "MongoDB Overview" }> db.mycol.find({}, {'title':1,'by':1, 'url':1}){ "_id" : 101, "title" : "MongoDB Guide", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }{ "_id" : 102, "title" : "NoSQL Database", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }{ "_id" : 104, "title" : "Python Quick Guide", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }{ "_id" : 100, "title" : "MongoDB Overview", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }>

请注意，在执行find()方法时，始终都会显示_id字段，如果不想要此字段，则需要将其设置为0。

MongoDB limit()方法

要限制 MongoDB 中返回的记录数，需要使用limit()方法。该方法接受一个数字类型参数，它是要显示的文档数。

语法

limit()方法的基本语法如下：

> db.COLLECTION_NAME.find().limit(NUMBER)

示例

假设集合myycol有以下数据。

> db.mycol.find({},{'_id':1, 'title':1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>

以下示例将在查询文档时仅显示两个文档。

> db.mycol.find({},{"title":1,_id:0}).limit(2){ "title" : "MongoDB Guide" }{ "title" : "NoSQL Database" }>

如果没有在limit()方法中指定number参数的值，那么它将显示集合中的所有文档。

MongoDB skip()方法

除了limit()方法之外，还有一个方法skip()也接受数字类型参数，用于跳过文档数量。

语法

skip()方法的基本语法如下 -

>db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)

示例

以下示例将仅显示第三个文档。

> db.mycol.find({},{"title":1,_id:0}).limit(1).skip(2){ "title" : "Python Quick Guide" }>

请注意，skip()方法中的默认值为0。

在本章中，我们将学习如何在 MongoDB 中排序记录。

MongoDB sort()方法

要在MongoDB中排序文档，需要使用sort()方法。该方法接受包含字段列表及其排序顺序的文档。使用指定排序顺序1和-1。 1用于升序，而-1用于降序。

语法

sort()方法的基本语法如下 -

>db.COLLECTION_NAME.find().sort({KEY:1})

示例

假设集合myycol有以下数据。

> db.mycol.find({},{'_id':1, 'title':1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>

以下示例将按标题降序排序显示文档。

> ## 按`title`降序排序> db.mycol.find({},{"title":1,_id:0}).sort({"title":-1}){ "title" : "Python Quick Guide" }{ "title" : "NoSQL Database" }{ "title" : "MongoDB Overview" }{ "title" : "MongoDB Guide" }> ## 按`title`升序排序> db.mycol.find({},{"title":1,_id:0}).sort({"title":1}){ "title" : "MongoDB Guide" }{ "title" : "MongoDB Overview" }{ "title" : "NoSQL Database" }{ "title" : "Python Quick Guide" }>

以下示例将按“_id”降序和升序排序显示文档。

> 按“_id”升序排序> db.mycol.find({},{"title":1,_id:1}).sort({"_id":1}){ "_id" : 100, "title" : "MongoDB Overview" }{ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }> # 按“_id”降序排序> db.mycol.find({},{"title":1,_id:1}).sort({"_id":-1}){ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>

聚合操作处理数据记录并返回计算结果。聚合操作将多个文档中的值组合在一起，并可对分组数据执行各种操作，以返回单个结果。在SQL中的 count(*)与group by组合相当于mongodb 中的聚合功能。

aggregate()方法

对于MongoDB中的聚合，应该使用aggregate()方法。

语法

aggregate()方法的基本语法如下 -

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

示例

假设在集合中，有以下数据 -

db.article.insert([{   _id: 100,   title: 'MongoDB Overview',   description: 'MongoDB is no sql database',   by_user: 'Maxsu',   url: 'http://www.yiibai.com',   tags: ['mongodb', 'database', 'NoSQL'],   likes: 100},{   _id: 101,   title: 'NoSQL Overview',    description: 'No sql database is very fast',   by_user: 'Maxsu',   url: 'http://www.yiibai.com',   tags: ['mongodb', 'database', 'NoSQL'],   likes: 10},{   _id: 102,   title: 'Neo4j Overview',    description: 'Neo4j is no sql database',   by_user: 'Kuber',   url: 'http://www.neo4j.com',   tags: ['neo4j', 'database', 'NoSQL'],   likes: 750},{   _id: 103,   title: 'MySQL Overview',    description: 'MySQL is sql database',   by_user: 'Curry',   url: 'http://www.yiibai.com/mysql/',   tags: ['MySQL', 'database', 'SQL'],   likes: 350}])

现在从上面的集合中，如果要显示一个列表，说明每个用户写入了多少个教程，那么可使用以下aggregate()方法 -

> db.article.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}]){ "_id" : "Curry", "num_tutorial" : 1 }{ "_id" : "Kuber", "num_tutorial" : 1 }{ "_id" : "Maxsu", "num_tutorial" : 2 }>

对于上述用例的Sql等效查询是：

select by_user, count(*) as num_tutorial from `article` group by by_user;

在上面的例子中，我们按字段by_user分组了文档，并且每次发生的by_user的前一个值的值都被递增。以下是可用聚合表达式的列表。

表达式	描述	示例
`$sum`	从集合中的所有文档中求出定义的值。	`db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])`
`$avg`	计算集合中所有文档的所有给定值的平均值。	`db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])`
`$min`	从集合中的所有文档获取相应值的最小值。	`db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])`
`$max`	从集合中的所有文档获取相应值的最大值。	`db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])`
`$push`	将值插入到生成的文档中的数组中。	`db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])`
`$addToSet`	将值插入生成的文档中的数组，但不会创建重复项。	`db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])`
`$first`	根据分组从源文档获取第一个文档。通常情况下，这只适用于以前应用的“`$sort`”阶段。	`db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])`
`$last`	根据分组从源文档获取最后一个文档。通常情况下，这只适用于以前应用的“`$sort`”阶段。	`db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])`

管道概念

在UNIX命令中，shell管道可以对某些输入执行操作，并将输出用作下一个命令的输入。 MongoDB也在聚合框架中支持类似的概念。每一组输出可作为另一组文档的输入，并生成一组生成的文档(或最终生成的JSON文档在管道的末尾)。这样就可以再次用于下一阶段等等。

以下是在聚合框架可能的阶段 -

$project - 用于从集合中选择一些特定字段。

$match - 这是一个过滤操作，因此可以减少作为下一阶段输入的文档数量。

$group - 这是上面讨论的实际聚合。

$sort - 排序文档。

$skip - 通过这种方式，可以在给定数量的文档的文档列表中向前跳过。

$limit - 限制从当前位置开始的给定数量的文档数量。

$unwind - 用于展开正在使用数组的文档。使用数组时，数据是预先加入的，此操作将被撤销，以便再次单独使用文档。因此，在这个阶段，将增加下一阶段的文件数量。

本章将介绍如何在MongoDB中创建备份，以及如何恢复数据。

导出转储MongoDB数据

要在MongoDB中创建数据库备份，应该使用 mongodump 命令。此命令将导出转储服务器的整个数据到转储目录。有许多选项可用于限制数据量或创建远程服务器的备份。

语法

mongodump命令的基本语法如下：

> mongodump

示例

启动 mongod 服务器假设您的 mongod 服务器正在本地主机和端口 27017 上运行，请打开命令提示符并转到 mongodb 实例的 bin 目录(如示例安装路径：D:\Program Files\MongoDB\Server\3.4\bin)，然后键入命令：mongodump

考虑 mycol 集合具有以下数据 -

> db.mycol.find({}, {"_id":1, "title":1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>

现在使用以下命令，创建备份 -

> mongodump

该命令将连接到运行在 127.0.0.1 和端口 27017 的服务器，并将服务器的所有数据恢复到目录/bin/dump/。以下是命令的输出 -

yiibai@ubuntu:~$ mongodump2017-07-02T17:31:51.115-0700    writing admin.system.version to2017-07-02T17:31:51.118-0700    done dumping admin.system.version (1 document)2017-07-02T17:31:51.119-0700    writing test.inventory to2017-07-02T17:31:51.119-0700    writing test.article to2017-07-02T17:31:51.120-0700    writing test.mycol to2017-07-02T17:31:51.121-0700    done dumping test.inventory (5 documents)2017-07-02T17:31:51.122-0700    done dumping test.article (4 documents)2017-07-02T17:31:51.122-0700    done dumping test.mycol (4 documents)yiibai@ubuntu:~$

此时你可能想知道，上面导出的备份文件放到什么地方了？默认情况下，MongoDB 会在当前目录下创建一个 dump 目录，并把所有的数据库按数据库名称创建目录。在这个实例中，有两数据库 admin 和 test，那么它将创建两个目录。

怎么样知道 MongoDB 文件的位置？

对于大部分软件，尤其是 Linux平台上的软件，都有一个相关的配置文件，因此任何的设置选项都可以从这个文件中找到。配置文件的一般在 /etc 目录下，所以，mongodb 的配置文件在 /etc/mongod.conf ， mongod.conf配置的内容如下 -

# mongod.conf# for documentation of all options, see:#   http://docs.mongodb.org/manual/reference/configuration-options/# Where and how to store data.storage:  dbPath: /var/lib/mongodb  journal:    enabled: true#  engine:#  mmapv1:#  wiredTiger:# where to write logging data.systemLog:  destination: file  logAppend: true  path: /var/log/mongodb/mongod.log# network interfacesnet:  port: 27017  bindIp: 127.0.0.1#processManagement:#security:#operationProfiling:#replication:#sharding:## Enterprise-Only Options:#auditLog:#snmp:

以下是可用于 mongodump 命令的可用选项的列表。

语法	描述	示例
mongodump —host HOST_NAME —port PORT_NUMBER	此命令将备份指定的 mongod 实例的所有数据库。	`mongodump --host 127.0.0.1 --port 27017`
mongodump —out BACKUP_DIRECTORY	此命令将仅在指定路径上备份数据库。	`mongodump --out /home/yiibai/mongobak`
mongodump —collection COLLECTION —db DB_NAME	此命令将仅备份指定数据库的指定集合。	`mongodump --collection mycol --db test`

恢复数据

要恢复备份数据，使用MongoDB的 mongorestore 命令。此命令从备份目录中恢复所有数据。

语法

mongorestore命令的基本语法是 -

> mongorestore

在恢复数据之前，先删除当前数据库的部分数据，以演示导入恢复数据后可以查询到备份时的数据。

> db.mycol.remove({})WriteResult({ "nRemoved" : 4 })>> db.mycol.find({})>>

执行恢复命令后，重新查询数据 -

> db.mycol.find({}, {"title":1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>