我的学习日志-- MongoDB索引用法和效率分析-- 数据库 -- 迷你帮网

MongoDB索引用法和效率分析

MongoDB中的索引其实类似于关系型数据库，都是为了提高查询和排序的效率的，并且实现原理也基本一致。由于集合中的键(字段)可以是普通数据类型，也可以是子文档。MongoDB可以在各种类型的键上创建索引。下面分别讲解各种类型的索引的创建，查询，以及索引的维护等。

一、创建索引

1. 默认索引

MongoDB有个默认的“_id”的键，他相当于“主键”的角色。集合创建后系统会自动创建一个索引在“_id”键上，它是默认索引，索引名叫“_id_”，是无法被删除的。我们可以通过以下方式查看：

												
																	var
																	_idIndex =
																		mongoCollection.Metadata.Indexes.Single(x => x.Key
																		== 
																	"_id_"
																	);
																
																	Console.WriteLine(_idIndex);

2. 单列索引

在单个键上创建的索引就是单列索引，例如我们要在“UserInfo”集合上给“UserName”键创建一个单列索引，语法如下：（1表示正序，-1逆序）

												
																	mongoCollection.Metadata.CreateIndex(
																	new
																	Document { { 
																	"UserName"
																	, 1 } }, 
																	false
																	);

接着，我们用同样方法查找名为“_UserName_”的索引

												
																	var
																	_UserName_Index =
																		mongoCollection.Metadata.Indexes.Single(x => x.Key
																		== 
																	"_UserName_"
																	);
																
																	Console.WriteLine(_UserName_Index);

3.组合索引

另外，我们还可以同时对多个键创建组合索引。如下代码创建了按照“UserId”正序，“UserName”逆序的组合索引:

												
																	mongoCollection.Metadata.CreateIndex(
																	new
																	Document { { 
																	"UserId"
																	, 1 }, { 
																	"UserName"
																	, -1 } }, 
																	false
																	);

4.子文档索引

我们可以对文档类型的键创建各种索引，例如单列索引，如下创建用户详细信息“Detail”的单列索引：

												
																	mongoCollection.Metadata.CreateIndex(
																	new
																	Document { { 
																	"Detail"
																	, 1 } }, 
																	false
																	);

对子文档的键创建组合索引：例如在“Detail.Address”和“Detail.Age”上创建组合索引：

												
																	mongoCollection.Metadata.CreateIndex(
																	new
																	Document { { 
																	"Detail.Address"
																	, 1 }, { 
																	"Detail.Age"
																	, -1 } }, 
																	false
																	);

5.唯一索引

唯一索引限制了对当前键添加值时，不能添加重复的信息。值得注意的是，当文档不存在指定键时，会被认为键值是“null”，所以“null”也会被认为是重复的，所以一般被作为唯一索引的键，最好都要有键值对。

对“UserId”创建唯一索引(这时候最后一个参数为“true”)：

												
																	mongoCollection.Metadata.CreateIndex(
																	new
																	Document { { 
																	"UserId"
																	, 1 } }, 
																	true
																	);

二、维护索引

1. 查询索引

通过索引名查询的方式已有介绍。但有时候，我们可能忘记了索引名，怎么查询呢？

下面提供一个遍历全部索引的方法，打印全部索引信息：

												
																	foreach
																	(
																	var
																	index 
																	in
																	mongoCollection.Metadata.Indexes)
																
																	{
																
																	Console.WriteLine(index.Value);
																
																	}

输出结果示例：

												
											

												
														
														
																	{ 
																	"name"
																	: 
																	"_id_"
																	, 
																	"ns"
																	: 
																	"myDatabase.UserInfo"
																	, 
																	"key"
																	: { 
																	"_id"
																	: 1 } }
																

																	{ 
																	"name"
																	: 
																	"_UserId_unique_"
																	, 
																	"ns"
																	: 
																	"myDatabase.UserInfo"
																	, 
																	"key"
																	: { 
																	"UserId"
																	: 1 }, 
																	"unique"
																	: 
																	true
																	, 
																	"_id"
																	: 
																	"4d8f406ab8a4730b78000005"
																	}
																

																	{ 
																	"name"
																	: 
																	"_UserName_"
																	, 
																	"ns"
																	: 
																	"myDatabase.UserInfo"
																	, 
																	"key"
																	: { 
																	"UserName"
																	: 1 }, 
																	"unique"
																	: 
																	false
																	, 
																	"_id"
																	: 
																	"4d8f406ab8a4730b78000006"
																	}
																

																	{ 
																	"name"
																	: 
																	"_Detail.Address_Detail.Age_"
																	, 
																	"ns"
																	: 
																	"myDatabase.UserInfo"
																	, 
																	"key"
																	: { 
																	"Detail.Address"
																	: 1, 
																	"Detail.Age"
																	: -1 }, 
																	"unique"
																	: 
																	false
																	, 
																	"_id"
																	: 
																	"4d8f406ab8a4730b78000007"
																	}
																

																	{ 
																	"name"
																	: 
																	"_UserId_UserName_"
																	, 
																	"ns"
																	: 
																	"myDatabase.UserInfo"
																	, 
																	"key"
																	: { 
																	"UserId"
																	: 1, 
																	"UserName"
																	: -1 }, 
																	"unique"
																	: 
																	false
																	, 
																	"_id"
																	: 
																	"4d8f406ab8a4730b78000008"
																	}
																

																	{ 
																	"name"
																	: 
																	"_Detail_"
																	, 
																	"ns"
																	: 
																	"myDatabase.UserInfo"
																	, 
																	"key"
																	: { 
																	"Detail"
																	: 1 }, 
																	"unique"
																	: 
																	false
																	, 
																	"_id"
																	: 
																	"4d8f406ab8a4730b78000009"
																	}
																

													

											

可见，集合的索引也是通过一个集合来维护的。name表示索引名，ns表示索引属于哪个库哪个集合，key表示索引在哪个键上，正序还是逆序，unique表示是否为唯一索引，等等...

2. 删除索引

新手常陷入的误区是，认为集合被删除，索引就不存在了。关系型数据库中，表被删除了，索引也不会存在。在MongoDB中不存在删除集合的说法，就算集合数据清空，索引都是还在的，要移除索引还需要手工删除。

例如，删除名为“_UserName_”的索引：

												
																	mongoCollection.Metadata.DropIndex(
																	"_UserName_"
																	);

下面提供删除除默认索引外其他全部索引的方法:

													
																		public
																		void
																		DropAllIndex()
																	
																		{
																	
																		var
																		listIndexes =
																			mongoCollection.Metadata.Indexes.ToList();
																	
																		for
																		(
																		int
																		i = 0; i <
																			listIndexes.Count; i++)
																	
																		{
																	
																		if
																		(listIndexes[i].Key
																			!= 
																		"_id_"
																		)
																	
																		{
																	
																		mongoCollection.Metadata.DropIndex(listIndexes[i].Key);
																	
																		}
																	
																		}
																	
																		}

三、索引的效率

MongoDB的索引到底能不能提高查询效率呢？我们在这里通过一个例子来测试。比较同样的数据在无索引和有索引的情况下的查询速度。

首先，我们通过这样一个方法插入10W条数据:

												
																	public
																	void
																	InsertBigData()
																
																	{
																
																	var
																	random = 
																	new
																	Random();
																
																	for
																	(
																	int
																	i = 1; i < 100000;
																		i++)
																
																	{
																
																	Document doc = 
																	new
																	Document();
																
																	doc[
																	"ID"
																	] = i;
																
																	doc[
																	"Data"
																	] = 
																	"data"
																	+
																		random.Next(100000);
																
																	mongoCollection.Save(doc);
																
																	}
																
																	Console.WriteLine(
																	"当前有"
																	+
																		mongoCollection.FindAll().Documents.Count() + 
																	"条数据"
																	);
																
																	}

然后，实现一个方法用来创建索引:

												
																	public
																	void
																	CreateIndexForData()
																
																	{
																
																	mongoCollection.Metadata.CreateIndex(
																	new
																	Document { { 
																	"Data"
																	, 1 } }, 
																	false
																	);
																
																	}

还有排序的方法：

												
																	public
																	void
																	SortForData()
																
																	{
																
																	mongoCollection.FindAll().Sort(
																	new
																	Document { { 
																	"Data"
																	, 1 } });
																
																	}

运行测试代码如下:

												
																	static
																	void
																	Main(
																	string
																	[] args)
																
																	{
																
																	IndexBLL indexBll = 
																	new
																	IndexBLL();
																
																	indexBll.DropAllIndex();
																
																	indexBll.DeleteAll();
																
																	indexBll.InsertBigData();
																
																	Stopwatch watch1 = 
																	new
																	Stopwatch();
																
																	watch1.Start();
																
																	for
																	(
																	int
																	i = 0; i < 1; i++)
																		indexBll.SortForData();
																
																	Console.WriteLine(
																	"无索引排序执行时间："
																	+ watch1.Elapsed);
																
																	indexBll.CreateIndexForData();
																
																	Stopwatch watch2 = 
																	new
																	Stopwatch();
																
																	watch2.Start();
																
																	for
																	(
																	int
																	i = 0; i < 1; i++)
																		indexBll.SortForData();
																
																	Console.WriteLine(
																	"有索引排序执行时间："
																	+ watch2.Elapsed);
																
																	}

最后执行程序查看结果：

多次测试表明在有索引的情况下，查询效率要高于无索引的效率。