1.mongodb简介:
它是一个基于文档的非关系数据库提供程序。
优点:
- MongoDB 的架构较少。它是一个文档数据库,它的一个集合持有不同的文档。
- 从一个到另一个的文档的数量,内容和大小可能有差异。
- MongoDB 中单个对象的结构很清淅。
- MongoDB 中没有复杂的连接。
- MongoDB 提供深度查询的功能,因为它支持对文档的强大的动态查询。
- MongoDB 很容易扩展。
- 它使用内部存储器来存储工作集,这是其快速访问的原因。
- 应用场景
-
- 大而复杂的数据
- 移动和社会基础设施数据
- 内容管理和交付
- 用户数据管理
- 数据中心
在本章中,我们将学习如何从MongoDB集合中查询文档。
find()方法
要从MongoDB集合查询数据,需要使用MongoDB的find()
方法。
语法
find()
命令的基本语法如下:
>db.COLLECTION_NAME.find(document)
find()
方法将以非结构化的方式显示所有文档。
pretty()方法
要以格式化的方式显示结果,可以使用pretty()
方法。
语法
> db.mycol.find().pretty()
示例
>db.mycol.find().pretty(){ "_id": 100, "title": "MongoDB Overview", "description": "MongoDB is no sql database", "by": "yiibai tutorials", "url": "http://www.yiibai.com", "tags": ["mongodb", "database", "NoSQL"], "likes": "100"}>
除了find()
方法外,还有一个findOne()
方法,它只返回一个文档。
MongoDB 与 RDBMS的等效 Where 子句
要在一些条件的基础上查询文档,可以使用以下操作。
操作 | 语法 | 示例 | RDBMS等效语句 |
---|---|---|---|
相等 | {<key>:<value>} | db.mycol.find({"by":"yiibai"}).pretty() | where by = 'yiibai' |
小于 | {<key>:{$lt:<value>}} | db.mycol.find({"likes":{$lt:50}}).pretty() | where likes < 50 |
小于等于 | {<key>:{$lte:<value>}} | db.mycol.find({"likes":{$lte:50}}).pretty() | where likes <= 50 |
大于 | {<key>:{$gt:<value>}} | db.mycol.find({"likes":{$gt:50}}).pretty() | where likes > 50 |
大于等于 | {<key>:{$gte:<value>}} | db.mycol.find({"likes":{$gte:50}}).pretty() | where likes >= 50 |
不等于 | {<key>:{$ne:<value>}} | db.mycol.find({"likes":{$ne:50}}).pretty() | where likes != 50 |
下面我们将对上表中的所有操作演示 -
MongoDB中的AND操作符
语法
在find()
方法中,如果通过使用’,
‘将它们分开传递多个键,则 MongoDB 将其视为AND
条件。 以下是AND
的基本语法 -
>db.mycol.find( { $and: [ {key1: value1}, {key2:value2} ] }).pretty()
示例
以下示例将显示由“yiibai tutorials
”编写并且标题为“MongoDB Overview”的所有教程。
> db.mycol.find({$and:[{"by":"yiibai tutorials"},{"title": "MongoDB Overview"}]}).pretty(){ "_id" : 100, "title" : "MongoDB Overview", "description" : "MongoDB is no sql database", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com", "tags" : [ "mongodb", "database", "NoSQL" ], "likes" : 100}>
对于上面给出的例子,等效的SQL where
子句是 -
SELECT * FROM mycol where by ='yiibai tutorials' AND title ='MongoDB Overview'
可以在find
子句中传递任意数量的键值。
MongoDB中的OR操作符
语法
在要根据OR
条件查询文档,需要使用$or
关键字。 以下是OR
条件的基本语法 -
>db.mycol.find( { $or: [ {key1: value1}, {key2:value2} ] }).pretty()
示例
以下示例将显示由“yiibai tutorials
”编写或标题为“MongoDB Overview”的所有教程。
>db.mycol.find({$or:[{"by":"yiibai tutorials"},{"title": "MongoDB Overview"}]}).pretty(){ "_id": 100, "title": "MongoDB Overview", "description": "MongoDB is no sql database", "by": "yiibai tutorials", "url": "http://www.yiibai.com", "tags": ["mongodb", "database", "NoSQL"], "likes": "100"}>
使用 AND 和 OR 条件一起
示例
以下示例将显示likes
大于10
以及标题是“MongoDB Overview
”或者“yiibai tutorials
”的所有文档。 等价SQL where子句为 -
SELECT * FROM mycol where likes> 10 AND(by ='yiibai tutorials' OR title ='MongoDB Overview')
>db.mycol.find({"likes": {$gt:10}, $or: [{"by": "yiibai tutorials"}, {"title": "MongoDB Overview"}]}).pretty(){ "_id": 100, "title": "MongoDB Overview", "description": "MongoDB is no sql database", "by": "yiibai tutorials", "url": "http://www.yiibai.com", "tags": ["mongodb", "database", "NoSQL"], "likes": "100"}>
查询嵌入/嵌套文档
这里演示如何使用:db.collection.find()
方法对嵌入/嵌套文档的查询操作的示例。 此页面上的示例使用inventory
集合。要填充库存(inventory
)集合以准备一些数据,请运行以下命令:
db.inventory.insertMany( [ { item: "journal", qty: 25, size: { h: 14, w: 21, uom: "cm" }, status: "A" }, { item: "notebook", qty: 50, size: { h: 8.5, w: 11, uom: "in" }, status: "A" }, { item: "paper", qty: 100, size: { h: 8.5, w: 11, uom: "in" }, status: "D" }, { item: "planner", qty: 75, size: { h: 22.85, w: 30, uom: "cm" }, status: "D" }, { item: "postcard", qty: 45, size: { h: 10, w: 15.25, uom: "cm" }, status: "A" }]);
匹配嵌入/嵌套文档
要在作为嵌入/嵌套文档的字段上指定相等条件,请使用查询过滤器文档{<field>:<value>}
,其中<value>
是要匹配的文档。
例如,以下查询选择字段size
等于{ h: 14, w: 21, uom: "cm" }
的所有文档:
db.inventory.find( { size: { h: 14, w: 21, uom: "cm" } } )
整个嵌入式文档中的相等匹配需要精确匹配指定的<value>
文档,包括字段顺序。
inventory
)集合中的任何文档不匹配: db.inventory.find( { size: { w: 21, h: 14, uom: "cm" } } )
查询嵌套字段
要在嵌入/嵌套文档中的字段上指定查询条件,请使用点符号(“field.nestedField
”)。
在嵌套字段上指定等于匹配
以下示例选择在size
字段中嵌套的字段uom
等于“in
”的所有文档:
db.inventory.find( { "size.uom": "in" } )
使用查询运算符指定匹配
查询过滤器文档可以使用查询运算符来指定,如以下形式的条件:
{: { : }, ... }
以下查询使用size
字段中嵌入的字段h
中的小于运算符($lt
):
db.inventory.find( { "size.h": { $lt: 15 } } )
指定AND条件
以下查询选择嵌套字段h
小于15
的所有文档,嵌套字段uom
等于“in
”,status
字段等于“D
”:
db.inventory.find( { "size.h": { $lt: 15 }, "size.uom": "in", status: "D" } )
MongoDB的update()
和save()
方法用于将集合中的文档更新。update()
方法更新现有文档中的值,而save()
方法使用save()
方法中传递的文档数据替换现有文档。
MongoDB Update()方法
update()
方法更新现有文档中的值。
语法
update()
方法的基本语法如下 -
> db.COLLECTION_NAME.update(SELECTION_CRITERIA, UPDATED_DATA)
示例
考虑mycol
集合具有以下数据 -
> db.mycol.find({}, {'_id':1, 'title':1}){ "_id" : 100, "title" : "MongoDB Overview" }{ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }>
以下示例将为标题为“MongoDB Overview
”的文档设置为“New Update MongoDB Overview
”。
> db.mycol.find({'title':'MongoDB Overview'},{'_id':1, 'title':1}){ "_id" : 100, "title" : "MongoDB Overview" }> # 更新操作> db.mycol.update({'title':'MongoDB Overview'},{$set:{'title':'New Update MongoDB Overview'}})WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })> # 查询更新后的结果 -> db.mycol.find({'_id':100},{'_id':1, 'title':1}){ "_id" : 100, "title" : "New Update MongoDB Overview" }>
默认情况下,MongoDB只会更新一个文档。要更新多个文档,需要将参数’multi
‘设置为true
。
>db.mycol.update({'title':'MongoDB Overview'}, {$set:{'title':'New Update MongoDB Overview'}},{multi:true})
MongoDB Save()方法
save()
方法使用save()
方法中传递的文档数据替换现有文档。
语法
MongoDB save()
方法的基本语法如下所示:
>db.COLLECTION_NAME.save({_id:ObjectId(),NEW_DATA})
以下示例将_id
为 100
的文档使用新的文档替换。
db.mycol.save( { "_id" : 100, "title":"Update By Save()Method.", "by":"yiibai.com" })WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })db.mycol.find({'_id':100}, {'_id':1, 'title':1}){ "_id" : 100, "title" : "Update By Save()Method." }
MongoDB中,投影表示仅选择所需要字段的数据,而不是选择整个文档字段的数据。如果某个文档有5
个字段,但只要显示3
个字段,那么就只选择3
个字段吧,这样做是非常有好处的。
find()方法
MongoDB的find()
方法,在 MongoDB 中此方法接收的第二个可选参数是要检索的字段列表。 在MongoDB中,当执行find()
方法时,它默认将显示文档的所有字段。为了限制显示的字段,需要将字段列表对应的值设置为1
或0
。1
用于显示字段,而0
用于隐藏字段。
具有投影的find()
方法的基本语法如下:
语法
>db.COLLECTION_NAME.find({},{KEY:1})
假设集合mycol
有以下数据 -
> db.mycol.find({}, {'_id':1, 'title':1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>
以下示例将在查询文档时只显示文档的标题。
> db.mycol.find({}, {'title':1,'_id':0}){ "title" : "MongoDB Guide" }{ "title" : "NoSQL Database" }{ "title" : "Python Quick Guide" }{ "title" : "MongoDB Overview" }> db.mycol.find({}, {'title':1,'by':1, 'url':1}){ "_id" : 101, "title" : "MongoDB Guide", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }{ "_id" : 102, "title" : "NoSQL Database", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }{ "_id" : 104, "title" : "Python Quick Guide", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }{ "_id" : 100, "title" : "MongoDB Overview", "by" : "yiibai tutorials", "url" : "http://www.yiibai.com" }>
请注意,在执行find()
方法时,始终都会显示_id
字段,如果不想要此字段,则需要将其设置为0
。
MongoDB limit()方法
要限制 MongoDB 中返回的记录数,需要使用limit()
方法。 该方法接受一个数字类型参数,它是要显示的文档数。
语法
limit()
方法的基本语法如下:
> db.COLLECTION_NAME.find().limit(NUMBER)
示例
假设集合myycol
有以下数据。
> db.mycol.find({},{'_id':1, 'title':1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>
以下示例将在查询文档时仅显示两个文档。
> db.mycol.find({},{"title":1,_id:0}).limit(2){ "title" : "MongoDB Guide" }{ "title" : "NoSQL Database" }>
如果没有在limit()
方法中指定number
参数的值,那么它将显示集合中的所有文档。
MongoDB skip()方法
除了limit()
方法之外,还有一个方法skip()
也接受数字类型参数,用于跳过文档数量。
语法
skip()方法的基本语法如下 -
>db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)
示例
以下示例将仅显示第三个文档。
> db.mycol.find({},{"title":1,_id:0}).limit(1).skip(2){ "title" : "Python Quick Guide" }>
请注意,skip()
方法中的默认值为0
。
在本章中,我们将学习如何在 MongoDB 中排序记录。
MongoDB sort()方法
要在MongoDB中排序文档,需要使用sort()
方法。 该方法接受包含字段列表及其排序顺序的文档。使用指定排序顺序1
和-1
。 1
用于升序,而-1
用于降序。
语法
sort()
方法的基本语法如下 -
>db.COLLECTION_NAME.find().sort({KEY:1})
示例
假设集合myycol
有以下数据。
> db.mycol.find({},{'_id':1, 'title':1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>
以下示例将按标题降序排序显示文档。
> ## 按`title`降序排序> db.mycol.find({},{"title":1,_id:0}).sort({"title":-1}){ "title" : "Python Quick Guide" }{ "title" : "NoSQL Database" }{ "title" : "MongoDB Overview" }{ "title" : "MongoDB Guide" }> ## 按`title`升序排序> db.mycol.find({},{"title":1,_id:0}).sort({"title":1}){ "title" : "MongoDB Guide" }{ "title" : "MongoDB Overview" }{ "title" : "NoSQL Database" }{ "title" : "Python Quick Guide" }>
以下示例将按“_id”降序和升序排序显示文档。
> 按“_id”升序排序> db.mycol.find({},{"title":1,_id:1}).sort({"_id":1}){ "_id" : 100, "title" : "MongoDB Overview" }{ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }> # 按“_id”降序排序> db.mycol.find({},{"title":1,_id:1}).sort({"_id":-1}){ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>
聚合操作处理数据记录并返回计算结果。 聚合操作将多个文档中的值组合在一起,并可对分组数据执行各种操作,以返回单个结果。 在SQL中的 count(*)
与group by
组合相当于mongodb 中的聚合功能。
aggregate()方法
对于MongoDB中的聚合,应该使用aggregate()
方法。
语法
aggregate()
方法的基本语法如下 -
>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
示例
假设在集合中,有以下数据 -
db.article.insert([{ _id: 100, title: 'MongoDB Overview', description: 'MongoDB is no sql database', by_user: 'Maxsu', url: 'http://www.yiibai.com', tags: ['mongodb', 'database', 'NoSQL'], likes: 100},{ _id: 101, title: 'NoSQL Overview', description: 'No sql database is very fast', by_user: 'Maxsu', url: 'http://www.yiibai.com', tags: ['mongodb', 'database', 'NoSQL'], likes: 10},{ _id: 102, title: 'Neo4j Overview', description: 'Neo4j is no sql database', by_user: 'Kuber', url: 'http://www.neo4j.com', tags: ['neo4j', 'database', 'NoSQL'], likes: 750},{ _id: 103, title: 'MySQL Overview', description: 'MySQL is sql database', by_user: 'Curry', url: 'http://www.yiibai.com/mysql/', tags: ['MySQL', 'database', 'SQL'], likes: 350}])
现在从上面的集合中,如果要显示一个列表,说明每个用户写入了多少个教程,那么可使用以下aggregate()
方法 -
> db.article.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}]){ "_id" : "Curry", "num_tutorial" : 1 }{ "_id" : "Kuber", "num_tutorial" : 1 }{ "_id" : "Maxsu", "num_tutorial" : 2 }>
对于上述用例的Sql等效查询是:
select by_user, count(*) as num_tutorial from `article` group by by_user;
在上面的例子中,我们按字段by_user
分组了文档,并且每次发生的by_user
的前一个值的值都被递增。以下是可用聚合表达式的列表。
表达式 | 描述 | 示例 |
---|---|---|
$sum | 从集合中的所有文档中求出定义的值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
$avg | 计算集合中所有文档的所有给定值的平均值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
$min | 从集合中的所有文档获取相应值的最小值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
$max | 从集合中的所有文档获取相应值的最大值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
$push | 将值插入到生成的文档中的数组中。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
$addToSet | 将值插入生成的文档中的数组,但不会创建重复项。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
$first | 根据分组从源文档获取第一个文档。 通常情况下,这只适用于以前应用的“$sort ”阶段。 | db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
$last | 根据分组从源文档获取最后一个文档。通常情况下,这只适用于以前应用的“$sort ”阶段。 | db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}]) |
管道概念
在UNIX命令中,shell管道可以对某些输入执行操作,并将输出用作下一个命令的输入。 MongoDB也在聚合框架中支持类似的概念。每一组输出可作为另一组文档的输入,并生成一组生成的文档(或最终生成的JSON文档在管道的末尾)。这样就可以再次用于下一阶段等等。
以下是在聚合框架可能的阶段 -
$project
- 用于从集合中选择一些特定字段。$match
- 这是一个过滤操作,因此可以减少作为下一阶段输入的文档数量。$group
- 这是上面讨论的实际聚合。$sort
- 排序文档。$skip
- 通过这种方式,可以在给定数量的文档的文档列表中向前跳过。$limit
- 限制从当前位置开始的给定数量的文档数量。$unwind
- 用于展开正在使用数组的文档。使用数组时,数据是预先加入的,此操作将被撤销,以便再次单独使用文档。 因此,在这个阶段,将增加下一阶段的文件数量。
本章将介绍如何在MongoDB中创建备份,以及如何恢复数据。
导出转储MongoDB数据
要在MongoDB中创建数据库备份,应该使用 mongodump
命令。 此命令将导出转储服务器的整个数据到转储目录。有许多选项可用于限制数据量或创建远程服务器的备份。
语法
mongodump
命令的基本语法如下:
> mongodump
示例
启动 mongod 服务器 假设您的 mongod 服务器正在本地主机和端口 27017
上运行,请打开命令提示符并转到 mongodb 实例的 bin
目录(如示例安装路径:D:\Program Files\MongoDB\Server\3.4\bin
),然后键入命令:mongodump
考虑 mycol
集合具有以下数据 -
> db.mycol.find({}, {"_id":1, "title":1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>
现在使用以下命令,创建备份 -
> mongodump
该命令将连接到运行在 127.0.0.1
和端口 27017
的服务器,并将服务器的所有数据恢复到目录/bin/dump/
。 以下是命令的输出 -
yiibai@ubuntu:~$ mongodump2017-07-02T17:31:51.115-0700 writing admin.system.version to2017-07-02T17:31:51.118-0700 done dumping admin.system.version (1 document)2017-07-02T17:31:51.119-0700 writing test.inventory to2017-07-02T17:31:51.119-0700 writing test.article to2017-07-02T17:31:51.120-0700 writing test.mycol to2017-07-02T17:31:51.121-0700 done dumping test.inventory (5 documents)2017-07-02T17:31:51.122-0700 done dumping test.article (4 documents)2017-07-02T17:31:51.122-0700 done dumping test.mycol (4 documents)yiibai@ubuntu:~$
此时你可能想知道,上面导出的备份文件放到什么地方了? 默认情况下,MongoDB 会在当前目录下创建一个 dump
目录,并把所有的数据库按数据库名称创建目录。在这个实例中,有两数据库 admin
和 test
,那么它将创建两个目录。
怎么样知道 MongoDB 文件的位置?
对于大部分软件,尤其是 Linux平台上的软件,都有一个相关的配置文件,因此任何的设置选项都可以从这个文件中找到。配置文件的一般在 /etc
目录下,所以,mongodb 的配置文件在 /etc/mongod.conf
, mongod.conf
配置的内容如下 -
# mongod.conf# for documentation of all options, see:# http://docs.mongodb.org/manual/reference/configuration-options/# Where and how to store data.storage: dbPath: /var/lib/mongodb journal: enabled: true# engine:# mmapv1:# wiredTiger:# where to write logging data.systemLog: destination: file logAppend: true path: /var/log/mongodb/mongod.log# network interfacesnet: port: 27017 bindIp: 127.0.0.1#processManagement:#security:#operationProfiling:#replication:#sharding:## Enterprise-Only Options:#auditLog:#snmp:
以下是可用于 mongodump
命令的可用选项的列表。
语法 | 描述 | 示例 |
---|---|---|
mongodump —host HOST_NAME —port PORT_NUMBER | 此命令将备份指定的 mongod 实例的所有数据库。 | mongodump --host 127.0.0.1 --port 27017 |
mongodump —out BACKUP_DIRECTORY | 此命令将仅在指定路径上备份数据库。 | mongodump --out /home/yiibai/mongobak |
mongodump —collection COLLECTION —db DB_NAME | 此命令将仅备份指定数据库的指定集合。 | mongodump --collection mycol --db test |
恢复数据
要恢复备份数据,使用MongoDB的 mongorestore
命令。 此命令从备份目录中恢复所有数据。
语法
mongorestore
命令的基本语法是 -
> mongorestore
在恢复数据之前,先删除当前数据库的部分数据,以演示导入恢复数据后可以查询到备份时的数据。
> db.mycol.remove({})WriteResult({ "nRemoved" : 4 })>> db.mycol.find({})>>
执行恢复命令后,重新查询数据 -
> db.mycol.find({}, {"title":1}){ "_id" : 101, "title" : "MongoDB Guide" }{ "_id" : 102, "title" : "NoSQL Database" }{ "_id" : 104, "title" : "Python Quick Guide" }{ "_id" : 100, "title" : "MongoDB Overview" }>