本 Wiki 开启了 HTTPS。但由于同 IP 的 Blog 也开启了 HTTPS,因此本站必须要支持 SNI 的浏览器才能浏览。为了兼容一部分浏览器,本站保留了 HTTP 作为兼容。如果您的浏览器支持 SNI,请尽量通过 HTTPS 访问本站,谢谢!
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版 | |||
cs:programming:cpp:cpp_primer:12_dy_memory [2024/01/14 13:46] – 移除 - 外部编辑 (未知日期) 127.0.0.1 | cs:programming:cpp:cpp_primer:12_dy_memory [2024/01/14 13:46] (当前版本) – ↷ 页面programming:cpp:cpp_primer:12_dy_memory被移动至cs:programming:cpp:cpp_primer:12_dy_memory codinghare | ||
---|---|---|---|
行 1: | 行 1: | ||
+ | | ||
+ | C++ Primer 笔记 第十二章\\ | ||
+ | ---- | ||
+ | 在 C++ 中,非常多的对象都是由编译器代理管理的;这些对象都具有完整定义的生命周期;比如**全局对象**(// | ||
+ | 除了这些编译器管理的对象以外,C++ 还允许用户定义对象的生命周期。这种对象的生命周期与其在哪里创建并没有关系;只有当其**被显式的释放**的时候,其生命周期才结束。我们称这种对象为**动态对象**(// | ||
+ | 遗憾的是,在 C++ 中,手动分配与释放内存是一项很容易造成 Bug 的操作。为了减少该类操作带来的影响,C++ 标准库提供了两种类型的**智能指针**(// | ||
+ | ==Static, Stack and Heap== | ||
+ | 在 C++ 中,内存的类型主要分为三种: | ||
+ | * 静态内存(// | ||
+ | * **栈**内存(// | ||
+ | * **堆**内存(// | ||
+ | 在这三种内存中,对象的生命周期都不一样: | ||
+ | * 全局 / 局部静态变量在其使用第一次使用前被分配,其生存期会一直持续到程序结束。 | ||
+ | * 自动对象生命周期从其定义开始,到其所在的 block 执行完毕。 | ||
+ | * 动态对象的生命周期由程序自身控制,需要显式的释放才能结束其周期。 | ||
+ | ====动态内存与智能指针==== | ||
+ | 传统的 C++ 中,动态内存通过关键字 '' | ||
+ | * '' | ||
+ | * '' | ||
+ | 这样做带来的问题是如何在恰当的时间释放内存。忘记释放内存可能导致内存泄露;而在指针仍然有效的时候释放内存会导致**野指针**(// | ||
+ | C++ 11 中提供了智能指针类型来对动态对象进行管理。智能指针与普通指针的功能相同;唯一的不同点在于智能制造能会自动删除对象并释放内存。标准库定义了如下三种智能指针类型: | ||
+ | * // | ||
+ | * // | ||
+ | * // | ||
+ | 以上三种智能指针类型定义于 ''< | ||
+ | ===shared_ptr 类=== | ||
+ | 智能指针类型属于模板类型,因此在创建指针的时候也需要指定额外的类型。该类型用于表示**智能指针指向对象的类型**: | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | shared_ptr< | ||
+ | </ | ||
+ | 智能指针的**默认初始化**得到的是一个**空指针**,使用智能指针作为判断条件时,实际上是在测试该智能指针是否是空指针: | ||
+ | <code cpp> | ||
+ | //if p1 is not null, check whether it's the empty string | ||
+ | if(p1 && p1-> | ||
+ | { | ||
+ | *p1 = " | ||
+ | } | ||
+ | </ | ||
+ | 智能指针的一些操作如下: | ||
+ | \\ \\ < | ||
+ | < | ||
+ | ==make_shared 函数== | ||
+ | 如果进行分配或使用动态内存,**最安全**的方法是使用 // | ||
+ | 当调用 // | ||
+ | <code cpp> | ||
+ | // | ||
+ | shared_ptr< | ||
+ | //p4 points to a string with value " | ||
+ | shared_ptr< | ||
+ | //p5 points to an int that is value initialized | ||
+ | shared_ptr< | ||
+ | </ | ||
+ | 可以看出来的是, // | ||
+ | \\ \\ | ||
+ | // | ||
+ | <code cpp> | ||
+ | // p6 points to a dynamically allocated, empty vector< | ||
+ | auto p6 = make_shared< | ||
+ | </ | ||
+ | ==shared_ptrs 的拷贝与赋值== | ||
+ | 在对 shared_ptr 进行拷贝和赋值的过程中,shared_ptr 会持续的跟踪当前**有多少其他的** shared_ptr 指向了同一个对象: | ||
+ | <code cpp> | ||
+ | auto p = make_shared< | ||
+ | auto q(p); //p and q point to the same object, the object has 2 users now | ||
+ | </ | ||
+ | 我们可以将该跟踪的过程理解为 shared_ptr 自身携带一个计数器(往往被称为**引用计数** //reference count// | ||
+ | * 当 shared_ptr 被**拷贝**时,计数增加,比如以下场景: | ||
+ | * shared_ptr 作为拷贝初始化的 initializer 的时候 | ||
+ | * shared_ptr 作为右值进行赋值的时候 | ||
+ | * shared_ptr 以**值传递**的方式传递给函数的时候 | ||
+ | * shared_ptr 以**值**的方式被返回的时候 | ||
+ | * 计数减少的情况: | ||
+ | * shared_ptr 作为左值**被赋值**的时候 | ||
+ | * shared_ptr **自我销毁**的时候(比如局部 shared_ptr 所在作用域销毁时) | ||
+ | 当 shared_ptr 的计数降低到 '' | ||
+ | <code cpp> | ||
+ | auto r = make_shared< | ||
+ | // assign to r, making it point to a different address | ||
+ | r = q; | ||
+ | // +1 use count for the object to which q points | ||
+ | // -1 use count of the object to which r had pointed | ||
+ | // the object r had pointed to has no users; that object is automatically freed | ||
+ | </ | ||
+ | 上例中,在经过一轮赋值后,依靠着 '' | ||
+ | <WRAP center round info 100%> | ||
+ | 如何跟踪记录某个对象的共享 shared_ptr | ||
+ | </ | ||
+ | ==shared_ptr 会自动摧毁其管理的对象== | ||
+ | 在摧毁所管理对象时,shared_ptr 实际上是通过调用本身的**析构函数**(// | ||
+ | ==shared_ptr 会自动释放相关的内存== | ||
+ | 由于 shared_ptr 自动释放动态对象内存的特性,使得我们可以更好的利用动态内存。比如我们可以利用该特性设计一个函数: | ||
+ | <code cpp> | ||
+ | // factory returns a shared_ptr pointing to a dynamically allocated object | ||
+ | shared_ptr< | ||
+ | { | ||
+ | /* process arg */ | ||
+ | // shared_ptr will take care of deleting this memory | ||
+ | return make_shared< | ||
+ | } | ||
+ | </ | ||
+ | 该 '' | ||
+ | <code cpp> | ||
+ | void use_factory(T arg) | ||
+ | { | ||
+ | shared_ptr< | ||
+ | } | ||
+ | </ | ||
+ | 我们的总体目标是,调用 '' | ||
+ | * 首先,'' | ||
+ | * 其次,使用接口函数 '' | ||
+ | * 当 '' | ||
+ | * '' | ||
+ | 可以看出来的是,如果希望正确的释放 shared_ptr 指向的对象,需要**保证其计数量的清零**。下例中,由于 '' | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | { | ||
+ | shared_ptr< | ||
+ | // use p | ||
+ | return p; // reference count is incremented when we return p ; +1 | ||
+ | } // p goes out of scope; -1; the memory to which p points is not freed | ||
+ | </ | ||
+ | 该版本中: | ||
+ | * 由于 // | ||
+ | * '' | ||
+ | * 因此,该对象并没有满足被释放的条件 | ||
+ | <WRAP center round info 100%> | ||
+ | 我们需要确保需要被释放的对象不会与任何 shard_ptr 绑定。当然,如果忘记销毁不需要的 shared_ptr,程序也会正常的运行;只是被 shared_ptr 分配的那一部分内存就会一直浪费下去。 | ||
+ | </ | ||
+ | |||
+ | <WRAP center round tip 100%> | ||
+ | 一个常见的忘记销毁 shared_ptr 的场景:将 shared_ptr 存入容器中,然后改变了容器元素的顺序。这种情况下一定记得使用 erase 删除不需要的 shared_ptr 元素。 | ||
+ | </ | ||
+ | ==案例:使用动态资源的类== | ||
+ | 通常在如下三种情况下,程序会倾向于使用动态内存: | ||
+ | - 程序不清楚自己需要**多少**对象 | ||
+ | - 程序不清楚自己需要什么**类型**的对象 | ||
+ | - 程序希望在不同的对象之间**共享数据** | ||
+ | 我们在容器中见到过头两种情况。来看看第三类的情况:\\ \\ | ||
+ | 正常情况下,对象之间并不会共享数据。比如拷贝一个 vector。当拷贝完成之后,源 vector 与 目标 vector 中的元素,实际上就是互相独立的了: | ||
+ | <code cpp> | ||
+ | vector< | ||
+ | { // new scope | ||
+ | vector< | ||
+ | v1 = v2; // copies the elements from v2 into v1 | ||
+ | } | ||
+ | </ | ||
+ | 这种情况下如果销毁 '' | ||
+ | 但在某些情况下,我们希望建立某种具有独立周期的对象,该对象与其关联的资源不共享生命周期。这种对象有两个重要的特征: | ||
+ | * 不同类对象共享一份底层资源 | ||
+ | * 单方面摧毁某个对象不会影响共享资源 | ||
+ | 比如下面的 //Blob// 类: | ||
+ | <code cpp> | ||
+ | Blob< | ||
+ | { // new scope | ||
+ | Blob< | ||
+ | b1 = b2; // b1 and b2 share the same elements | ||
+ | } // b2 is destroyed, but the elements in b2 must not be destroyed | ||
+ | // b1 points to the elements originally created in b2 | ||
+ | </ | ||
+ | 即便是 '' | ||
+ | ==定义 StrBlob 类== | ||
+ | 来看看上述的这种 //Blob// 类(此处改名为 // | ||
+ | 但根据上例,有两个问题需要处理: | ||
+ | * 默认情况下,vector 在栈上的拷贝会连关联的资源(vector 中的元素)一起复制 | ||
+ | * '' | ||
+ | 可以看出来的是,达成共享的第一步就是需要保证资源的存在。我们的解决方案是将 //vector// **存储到动态内存**中,并使用 shared_ptr 对其进行管理。shared_ptr 会跟踪 //StrBlob// 对象的数量,**确保在所有类对象都销毁的前提下**才会释放共享的 vector。\\ \\ | ||
+ | 除此之外,还有几个需要实现的部分: | ||
+ | * 定义一些对 vector 的访问:比如 //front// 、//back// 成员 | ||
+ | * 定义一些异常:比如访问不存在的 vector 元素会抛出的异常 | ||
+ | * 定义构造函数:至少有一个默认构造函数,和另外一个可以通过初始化列表 ('' | ||
+ | <code cpp> | ||
+ | class StrBlob { | ||
+ | public: | ||
+ | using size_type = std:: | ||
+ | |||
+ | // | ||
+ | StrBlob(); | ||
+ | StrBlob(std:: | ||
+ | |||
+ | //member functions | ||
+ | |||
+ | //info | ||
+ | size_type size() const { return data-> | ||
+ | bool empty() const { return data-> | ||
+ | |||
+ | //adding && remove | ||
+ | void push_back(const std::string &t) { data-> | ||
+ | void pop_back(); | ||
+ | |||
+ | //access | ||
+ | std:: | ||
+ | std:: | ||
+ | |||
+ | private: | ||
+ | std:: | ||
+ | // | ||
+ | //throw msg if data[i] isn't valid | ||
+ | void check(size_type i, const std::string &msg) const; | ||
+ | |||
+ | }; | ||
+ | </ | ||
+ | |||
+ | ==StrBlob 的构造函数== | ||
+ | 本类中的两个构造函数都将通过初始化列表来对管理 vector 的 shared_ptr '' | ||
+ | <code cpp> | ||
+ | StrBlob:: | ||
+ | StrBlob:: | ||
+ | data(make_shared< | ||
+ | </ | ||
+ | ==访问元素的成员函数== | ||
+ | 访问元素的函数需要实现 3 个: | ||
+ | * // | ||
+ | * // | ||
+ | * // | ||
+ | 由于这三个操作的前提都是**元素必须存在**,我们使用私有成员函数 //check()// 来对元素进行校验: | ||
+ | <code cpp> | ||
+ | void StrBlob:: | ||
+ | if (i >= data-> | ||
+ | throw out_of_range(msg); | ||
+ | } | ||
+ | |||
+ | std:: | ||
+ | check(0, "front on empty StrBlob" | ||
+ | return data-> | ||
+ | } | ||
+ | |||
+ | std:: | ||
+ | check(0, "back on empty StrBlob" | ||
+ | return data-> | ||
+ | } | ||
+ | |||
+ | void StrBlob:: | ||
+ | check(0, " | ||
+ | return data-> | ||
+ | } | ||
+ | </ | ||
+ | ==拷贝、赋值和销毁 strBlob 类对象== | ||
+ | 所有基于对 //strBlob// 的拷贝、赋值和销毁操作,都是基于对 shared_ptr '' | ||
+ | ===直接管理内存=== | ||
+ | C++ 提供了两个运算符供用户进行手动分配与释放内存: | ||
+ | * '' | ||
+ | * '' | ||
+ | 需要注意的是,使用这一对运算符需要: | ||
+ | * 对内存的释放时机进行人为的判断 | ||
+ | * 手动定义拷贝、赋值和类对象的析构等一系列操作 | ||
+ | 很显然,使用智能指针分配资源是更可靠的一种方式。 | ||
+ | ==使用 new 分配和初始化对象== | ||
+ | 使用 '' | ||
+ | <code cpp> | ||
+ | int *pi = new int; //pi points to a dynamically allocatedd, unnamed, unintialized int. | ||
+ | </ | ||
+ | 需要注意的是,默认情况下,**动态分配的对象会进行默认初始化**;也就是说: | ||
+ | * 访问通过 '' | ||
+ | * 通过 '' | ||
+ | <code cpp> | ||
+ | string *ps = new string; //empty string on the heap | ||
+ | int *pi = new int; //pi points to an uninitialized int | ||
+ | </ | ||
+ | 由此可见,对 '' | ||
+ | <code cpp> | ||
+ | int *pi = new int(1024); | ||
+ | string *ps = new string(5, ' | ||
+ | vector< | ||
+ | </ | ||
+ | 如果括号中没有内容,则进行的是**值初始化**: | ||
+ | <code cpp> | ||
+ | string *ps1 = new string; // default initialized to the empty string | ||
+ | string *ps = new string(); // value initialized to the empty string | ||
+ | int *pi1 = new int; // default initialized; | ||
+ | int *pi2 = new int(); // value initialized to 0; *pi2 is 0 | ||
+ | </ | ||
+ | 默认初始化和值初始化的区别主要体现在 Built-in type 上: | ||
+ | * 值初始化可以保证 built-in type 拥有完整定义,默认初始化不行 | ||
+ | * 假设某个类使用**合成构造函数**初始化,对于类中没有给定初始值的 Build-int type 的访问行为依然是**未定义**的。 | ||
+ | ==使用 auto 对 new 的对象进行推断== | ||
+ | 当括号中包含了 initilizer, '' | ||
+ | <code cpp> | ||
+ | auto p1 = new auto(obj); | ||
+ | // that object is initialized from obj | ||
+ | </ | ||
+ | '' | ||
+ | <code cpp> | ||
+ | auto p2 = new auto{a, | ||
+ | </ | ||
+ | ==动态分配 const 对象== | ||
+ | 我们也可以在堆上分配 const 的对象: | ||
+ | <code cpp> | ||
+ | //allocate and initalize a const int | ||
+ | const int *pci = new cosnt int(1024); | ||
+ | // allocate a default-initialized const empty strin | ||
+ | const string *pcs = new const string; | ||
+ | </ | ||
+ | 与其他 const 对象相同,堆上的 const 对象也**必须进行显式的初始化**(由默认构造函数负责初始化的类对象除外)。同时,由于 '' | ||
+ | ==内存被耗尽的情况== | ||
+ | 堆内存存在着被耗尽的可能性。当堆内存耗尽时,'' | ||
+ | <code cpp> | ||
+ | // if allocation fails, new returns a null pointer | ||
+ | int *p1 = new int; // if allocation fails, new throws std:: | ||
+ | int *p2 = new (nothrow) int; // if allocation fails, new returns a null pointer | ||
+ | </ | ||
+ | 这种形式的 '' | ||
+ | ==释放动态内存== | ||
+ | 为了避免内存耗尽,内存需要在使用完之后释放。C++ 中通过 '' | ||
+ | <code cpp> | ||
+ | delete p; //destroyed the object to which p points and freed the memory it took | ||
+ | </ | ||
+ | |||
+ | ==指针的值与 delete== | ||
+ | '' | ||
+ | * 删除任何指向非 '' | ||
+ | * 释放同一个动态内存空间两次(即 delete 两次指向该空间的指针) | ||
+ | <code cpp> | ||
+ | int i, *pi1 = &i, *pi2 =nullptr; | ||
+ | double *pd = new double(33), *pd2 = pd; | ||
+ | delete i; // error, i is not a pointer | ||
+ | delete pi1; // | ||
+ | delete pd; //ok | ||
+ | delete pd2; // error, the memory pointed by pd2 has been freed | ||
+ | delete pi2; // ok, delete a nullptr | ||
+ | </ | ||
+ | <WRAP center round important 100%> | ||
+ | 编译器往往只能检测出// | ||
+ | </ | ||
+ | 此外,const 对象占用的空间也可以使用 delete 释放: | ||
+ | <code cpp> | ||
+ | const int *pci = new const int(1024); | ||
+ | delete pci; | ||
+ | </ | ||
+ | const 只保证了对象的内容不会被修改,但该对象依然可以被销毁。 | ||
+ | ==动态分配对象在释放之前会一直存在== | ||
+ | 与智能指针不同,除非显式的释放手动分配的对象,否则该对象会一直存在。比如下面的例子: | ||
+ | <code cpp> | ||
+ | //factory returns a pointer to a dynamically allocated object | ||
+ | Foo* factory(T arg) | ||
+ | { | ||
+ | //process | ||
+ | return new (arg); | ||
+ | } | ||
+ | </ | ||
+ | 该函数返回一个指向堆上的指针,因此在调用完毕之后**必须显式的释放该函数所占的内存**。如果不这么做: | ||
+ | <code cpp> | ||
+ | void use_factory(T arg) | ||
+ | { | ||
+ | Foo *p = factory(arg); | ||
+ | } //p goes out of scope, but the memory to which p points is not freed. | ||
+ | </ | ||
+ | 局部变量指针 '' | ||
+ | <code cpp> | ||
+ | void use_factory(T arg) | ||
+ | { | ||
+ | Foo *p = factory(arg); | ||
+ | delete p; | ||
+ | } | ||
+ | </ | ||
+ | 如果这些资源需要在在其他地方继续使用,我们可以返回 '' | ||
+ | <code cpp> | ||
+ | Foo* use_factory(T arg) | ||
+ | { | ||
+ | Foo *p = factory(arg); | ||
+ | return p; | ||
+ | } | ||
+ | </ | ||
+ | 但也需要记住在使用完之后需要 delete '' | ||
+ | ==常见的动态内存管理问题== | ||
+ | * 忘记释放内存。该行为会导致**内存泄漏**(// | ||
+ | * 使用被 delete 掉的对象。该问题可以通过给释放掉的对象赋予**空指针**检测到。 | ||
+ | * 释放两次相同的堆内存。该问题通常出现在两个指针指向同一块堆内存。删除其中一个就会释放对应的堆内存;而接着删除第二个会破坏对应堆内存里的新内容。 | ||
+ | <WRAP center round tip 100%> | ||
+ | 使用**智能指针**可以避免这些问题。 | ||
+ | </ | ||
+ | ==在 delete 之后重置指针的值== | ||
+ | 指针会在被 delete 之后失效,其指向的动态内存也会被释放。但在很多机器中,失效的指针中会继续保存被释放内存的地址。这种指向失效动态内存的指针被称为**悬挂指针**(// | ||
+ | 重置此类型的指针的值可以解决一部分问题。需要注意的是,任何针对指针的操作只能在指针离开作用域之前进行。我们可以通过如下两步重置此类不再使用的指针: | ||
+ | * delete 该指针 | ||
+ | * 在指针离开作用域之前将 '' | ||
+ | 不过遗憾的是,重置了该指针只能保证该指针不会再出现问题。由于堆上分配的内存可以同时被好几个指针指向着;只重置 被 delete 的指针并不能保证其他的指针不出问题,比如: | ||
+ | <code cpp> | ||
+ | int *p(new int(42)); | ||
+ | auto q = p; | ||
+ | delete p; | ||
+ | p = nullptr; | ||
+ | </ | ||
+ | 此处删除并重置 '' | ||
+ | ===shared_ptr 与 new 的配合使用=== | ||
+ | |||
+ | shared_ptr 可以通过 '' | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | </ | ||
+ | 需要注意的是,shared_ptr 的构造函数是 '' | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | shared_ptr< | ||
+ | </ | ||
+ | 基于同样的原因,返回值类型为 shared_ptr 的函数也不接受隐式转换: | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | return new int(p); // error: implicit conversion to shared_ptr< | ||
+ | return shared_ptr< | ||
+ | } | ||
+ | </ | ||
+ | 另外一点需要强调的是,智能指针通过 '' | ||
+ | ==不要混用智能指针与普通指针== | ||
+ | <WRAP center round info 100%> | ||
+ | shard_ptr 只能对为自身拷贝的对象(其他的 shared_ptr)进行析构。根据这个特性,如果在 shard_ptr 创建的时候就为其绑定动态内存,那么这片内存将无法以任何形式再次分配给其他独立的 shared_ptr。从这个观点上来看,使用 // | ||
+ | </ | ||
+ | 来看看下面的例子: | ||
+ | <code cpp> | ||
+ | // ptr is created and initialized when process is called | ||
+ | void process(shared_ptr< | ||
+ | { | ||
+ | // use ptr | ||
+ | } // ptr goes out of scope and is destroyed, ref_count -1, now 1 | ||
+ | </ | ||
+ | 由于值传递复制了 '' | ||
+ | 如果希望正确的使用函数 '' | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | process(p); //count 1-> | ||
+ | int i = *p; //count = 1 | ||
+ | </ | ||
+ | 但这样做导致了普通指针与 shared_ptr 的混用,而往往会带来问题。比如下面的例子中,将 shared_ptr 作为临时对象进行传递,会导致严重的问题: | ||
+ | <code cpp> | ||
+ | int *x(new int(1024)); // dangerous: x is a plain pointer, not a smart pointer | ||
+ | process(x); | ||
+ | process(shared_ptr< | ||
+ | int j = *x; // undefined: x is a dangling pointer! | ||
+ | </ | ||
+ | 上例中: | ||
+ | - shared_ptr 使用 '' | ||
+ | - 由于 shared_ptr 作为**临时对象**传递进了 // | ||
+ | - 此时 shared_ptr 将管理的对象直接释放掉,而 '' | ||
+ | |||
+ | <WRAP center round alert 100%> | ||
+ | 将普通指针绑定(作为右值赋值 / 初始化)到智能指针将导致智能指针**接管**对应资源的管理。当接管发生时,**任何对普通指针的访问都应该避免**。这种情况下,普通指针无法得知智能指针对资源的管理情况。 | ||
+ | </ | ||
+ | |||
+ | ==不要使用 get 成员初始化另外的智能指针== | ||
+ | 上面的例子引申出了一个另外的问题。智能指针拥有一个名为 //get()// 的成员函数。该函数返回一个// | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | int *q = p.get(); | ||
+ | { // new block | ||
+ | // undefined: two independent shared_ptrs point to the same memory | ||
+ | auto local = shared_ptr< | ||
+ | } // block ends, local is destroyed, and the memory to which p and q points is freed | ||
+ | int foo = *p; // undefined; the memory to which p points was freed | ||
+ | </ | ||
+ | 上面例子中,我们通过传递的普通指针,将两个完全不同的 shared_ptr 绑定到了同一个动态对象上。由于第二个 shared_ptr 是局部变量,其自身的消亡释放了共享的动态对象。因此之后再去访问原来的 shared_ptr '' | ||
+ | |||
+ | |||
+ | <WRAP center round important 100%> | ||
+ | 必须确保 //get()// 成员返回的指针所在的代码不会有任何通过该指针(直接 / 间接)进行的 delete 操作。 | ||
+ | </ | ||
+ | <WRAP center round tip 100%> | ||
+ | //get()// 成员的意义是传递信息,应该被视为只读。将 //get()// 传达的信息通过 其他的 shared_ptr 进行释放,是一种逻辑上的错误。 | ||
+ | </ | ||
+ | 【RECAP】本节讨论的两种混用指针的情况: | ||
+ | * 普通指针申请的资源被作为临时对象的 shared_ptr 代管;shared_ptr 的自我销毁导致资源被释放,从而导致普通指针悬挂 | ||
+ | * 对 //get()// 返回的 raw pointer 进行其他途径的 delete 操作,导致原有的 shared_ptr 管理的资源失效 | ||
+ | ==shared_ptr 的其他操作== | ||
+ | shared_ptr 的操作可以参考下表: | ||
+ | \\ < | ||
+ | 比较重要的是 //reset()// 成员,有如下三种功能: | ||
+ | * 释放智能指针管理的内存,要求智能指针是资源的唯一管理者 | ||
+ | * 转交普通指针的资源给智能指针,当普通指针无资源的时候空置智能指针 | ||
+ | * 转交普通指针的资源给智能指针,并使用指定的方式释放普通指针 | ||
+ | <code cpp> | ||
+ | p = new int(1024); //error, cannot assign pointer to shared_ptr | ||
+ | p.reset(new int(1024));// | ||
+ | </ | ||
+ | 由于 '' | ||
+ | <code cpp> | ||
+ | if (!p.unique()) //if p is not the only shared_ptr to the object | ||
+ | p.reset(new string(*p); //it is ok to change to where p points | ||
+ | *p += newVal; //now p is the only shared_ptr on newVal, ok to make some changes. | ||
+ | </ | ||
+ | 可以看出来,通过 // | ||
+ | ===智能指针与异常=== | ||
+ | 在异常抛出以后,下一步处理通常是确保异常程序使用的资源被正确的释放。使用智能指针可以容易的解决这个需求: | ||
+ | <code cpp> | ||
+ | void f() | ||
+ | { | ||
+ | shared_ptr< | ||
+ | // code that throws an exception that is not caught inside f | ||
+ | } // shared_ptr freed automatically when the function ends | ||
+ | </ | ||
+ | 从上述例子中可以看出: | ||
+ | * 如果将智能指针作为局部变量,该指针会随着函数的结束而销毁,同时释放掉指向的内存。 | ||
+ | * 而当异常抛出以后,函数本身会退出执行并销毁其所有局部变量。 | ||
+ | 根据以上两点,如果我们将需要的资源使用**局部的智能指针**进行管理,就能达到自动释放内存的效果。\\ \\ | ||
+ | <color # | ||
+ | 来看下面的程序: | ||
+ | <code cpp> | ||
+ | void f() | ||
+ | { | ||
+ | int *ip = new int(42); // dynamically allocate a new object | ||
+ | // code that throws an exception that is not caught inside f | ||
+ | delete ip; // free the memory before exiting | ||
+ | } | ||
+ | </ | ||
+ | 上述代码使用 '' | ||
+ | ==实例:使用智能指针管理类的资源== | ||
+ | 类与 // | ||
+ | 一个解决办法是利用之前提到的,利用临时变量的自我销毁机制,以及 shared_ptr 的销毁会释放资源的机制,来确保资源最终会被妥善释放。下面的例子中,假设我们的网络库同时涉及到 C 与 C++: | ||
+ | <code cpp> | ||
+ | struct destination; | ||
+ | struct connection; // information needed to use the connection | ||
+ | connection connect(destination*); | ||
+ | void disconnect(connection); | ||
+ | </ | ||
+ | 本例中,我们主要关注 // | ||
+ | <code cpp> | ||
+ | void f(destination &d /* other parameters */) | ||
+ | { | ||
+ | // get a connection; must remember to close it when done | ||
+ | connection c = connect(& | ||
+ | //close the connection. | ||
+ | disconnect(c); | ||
+ | } | ||
+ | </ | ||
+ | 但注意,如果 '' | ||
+ | 我们可以通过 shared_ptr 来管理 '' | ||
+ | <code cpp> | ||
+ | shared_ptr< | ||
+ | </ | ||
+ | 其中 '' | ||
+ | <code cpp> | ||
+ | void end_connection(connection *p) { disconnect(*p); | ||
+ | </ | ||
+ | 这里我们创建了一个 '' | ||
+ | <code cpp> | ||
+ | void f(destination &d) | ||
+ | void f(destination &d /* other parameters */) | ||
+ | { | ||
+ | connection c = connect(& | ||
+ | shared_ptr< | ||
+ | // use the connection | ||
+ | // when f exits, even if by an exception, the connection will be properly closed | ||
+ | } | ||
+ | </ | ||
+ | 通过将 shared_ptr 与 '' | ||
+ | ==智能指针的隐患与应对== | ||
+ | 智能指针只有在正确使用的前提下才能管理好动态分配的内存。有几个准则是需要注意的: | ||
+ | * 不要使用**同一个**普通指针初始化**不同**的智能指针 | ||
+ | * 不要 '' | ||
+ | * 不要使用 //get()// 的返回值**初始化** 另外的智能指针,或者作为 //reset()// 的初始值 | ||
+ | * //get()// 返回的指针指向的内容受调用 //get()// 的智能指针影响。该**内容**会在对应**智能指针销毁后被释放**。 | ||
+ | * 如果使用智能指针管理来源于 '' | ||
+ | ===unique_ptr=== | ||
+ | // | ||
+ | \\ < | ||
+ | ==unique_ptr的初始化== | ||
+ | 定义 unique_ptr 也与 shared_ptr 稍有不同。不像 shared_ptr, unique_ptr 并没有类似 // | ||
+ | <code cpp> | ||
+ | unique_ptr< | ||
+ | unique_ptr< | ||
+ | </ | ||
+ | 由于 unique_ptr " | ||
+ | <code cpp> | ||
+ | unique_ptr< | ||
+ | unique_ptr< | ||
+ | unique_ptr< | ||
+ | p3 = p2; // error: no assign for unique_ptr | ||
+ | </ | ||
+ | 不过,unique_ptr 可以通过两个成员 // | ||
+ | <code cpp> | ||
+ | // transfers ownership from p1 (which points to the string Stegosaurus) to p2 | ||
+ | unique_ptr< | ||
+ | unique_ptr< | ||
+ | // transfers ownership from p3 to p2 | ||
+ | p2.reset(p3.release()); | ||
+ | </ | ||
+ | // | ||
+ | * 卸除当前 unique_ptr 的拥有权 | ||
+ | * 将当前 unique_ptr 设置为空指针 | ||
+ | * 返回一个指向当前对象的指针 | ||
+ | //reset()// 的带参数形式会释放当前 unique_ptr 指向的对象,并将 unique_ptr 指向参数指针指向的对象。\\ \\ | ||
+ | 因此上面的过程可以解释为: | ||
+ | - 卸除了 '' | ||
+ | - 使 '' | ||
+ | - '' | ||
+ | 很显然,这两个成员函数: | ||
+ | * // | ||
+ | * //reset()// 主要用于**重置**当前 unique_ptr,使其可以接收新的绑定对象(可以是新的对象,也可以是通过 release() 传递来的拥有权) | ||
+ | 需要注意的是, 为了正确释放被解绑的资源,// | ||
+ | <code cpp> | ||
+ | p2.release(); | ||
+ | auto p = p2.release(); | ||
+ | </ | ||
+ | ==传递和返回 unique_ptr== | ||
+ | 之前提到的 unique_ptr 无法被拷贝的规则有一个例外:我们可以**拷贝一个即将被销毁**的 unique_ptr。这种情况往往发生在我们将 unique_ptr 作为返回值的时候: | ||
+ | <code cpp> | ||
+ | /* return by unique_ptr */ | ||
+ | unique_ptr< | ||
+ | // ok: explicitly create a unique_ptr< | ||
+ | return unique_ptr< | ||
+ | } | ||
+ | |||
+ | /* return by local object */ | ||
+ | unique_ptr< | ||
+ | unique_ptr< | ||
+ | // . . . | ||
+ | return ret; | ||
+ | } | ||
+ | </ | ||
+ | 编译器在这里为 unique_ptr 定义了**特殊的**拷贝方法,允许返回与**即将被销毁的**对象绑定的 unique_ptr。 | ||
+ | <WRAP center round info 100%> | ||
+ | 在旧的 C++ 版本中,标准库提供了 auto_ptr 类。该类拥有某些 unique_ptr 的属性;但由于 auto_ptr 无法在容器中存储,也无法返回函数,现在已经逐渐被 unique_ptr 代替。 | ||
+ | </ | ||
+ | ==传递 deleter 给 unique_ptr== | ||
+ | unique_ptr 默认使用 '' | ||
+ | 实际上,重载 unique_ptr 的 deleter 会同时影响到 unique_ptr 的类型和其构造对象(或 reset 对象)的方式。与关系容器的自定义排序规则类似,deleter 的类型需要与 unique_ptr 支持的对象类型一起写入到 unique_ptr 的三角括号中: | ||
+ | <code cpp> | ||
+ | // object to which points by p, has type objT; | ||
+ | // the deleter has type delT | ||
+ | // it will call an object named fcn of type delT | ||
+ | unique_ptr< | ||
+ | </ | ||
+ | 这里的 '' | ||
+ | <code cpp> | ||
+ | { | ||
+ | connection c = connect(& | ||
+ | // when p is destroyed, the connection will be closed | ||
+ | unique_ptr< | ||
+ | // use the connection | ||
+ | // when f exits, even if by an exception, the connection will be properly closed | ||
+ | } | ||
+ | </ | ||
+ | 这里使用了 '' | ||
+ | ===weak_ptr=== | ||
+ | weak_ptr 通常与 shard_ptr 搭配使用。weak_ptr 指向 shard_ptr 管理的对象,但即**不会影响该对象的生存周期**,也**不会影响该对象的计数**。weak_ptr 通过一系列的工具函数来辅助 shared_ptr 的使用: | ||
+ | \\ < | ||
+ | ==weak_ptr 的初始化与访问== | ||
+ | weak_ptr 需要使用 shared_ptr 进行初始化: | ||
+ | <code cpp> | ||
+ | auto p = make_shared< | ||
+ | weak_ptr< | ||
+ | </ | ||
+ | 由于 weak_ptr 指向的对象很可能会被 shared_ptr 释放掉,因此该对象是无法直接使用 weak_ptr 访问的。一种常见的访问方式是使用 //lock()// 成员来验证 weak_ptr 指向的内容是否还存在。当 //lock()// 返回的 shared_ptr 是 nullptr 时,该 shared_ptr 的计数值为 0, | ||
+ | <code cpp> | ||
+ | if(shared_ptr< | ||
+ | </ | ||
+ | ==实例:使用 weak_ptr 访问 StrBlob 类== | ||
+ | 使用 weak_ptr 最主要的目的是防止用户访问已经不存在的资源。在本例中,我们通过定义一个 // | ||
+ | * // | ||
+ | * //curr//: '' | ||
+ | 除此之外,还需要几个成员: | ||
+ | * // | ||
+ | * // | ||
+ | * //incr()//: // | ||
+ | 除此之外,我们还将提供两个 //StrBlob// 的成员 //begin()// 和 // | ||
+ | == StrBlobPtr 类的实现== | ||
+ | <color # | ||
+ | 由于 weak_ptr 使用 shared_ptr 进行初始化,因此我们需要指定 shared_ptr 所在的类,并将 vector 的下标也列入构造函数的初始化列表(注:练习中使用了默认构造函数+私有成员的默认值): | ||
+ | <code cpp> | ||
+ | StrBlobPtr(): | ||
+ | StrBlobPtr(StrBlob &a, size_t sz): wptr(a.data), | ||
+ | </ | ||
+ | <color # | ||
+ | 由于 //deref()// 和 //incr()// 成员在调用前都需要保证被访问元素的有效性,// | ||
+ | * 当访问的 vector 不存在时,抛出 runtime_error 异常说明解引用的目标不存在。 | ||
+ | * 当 // | ||
+ | 同时,为了方便 //deref()// 使用,// | ||
+ | <code cpp> | ||
+ | std:: | ||
+ | StrBlobPtr:: | ||
+ | { | ||
+ | auto ret = wptr.lock(); | ||
+ | if(!ret) //if the vector is invalid | ||
+ | throw std:: | ||
+ | if(i >= a.data-> | ||
+ | throw std:: | ||
+ | return ret; | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | <color # | ||
+ | //deref()// 成员的功能是在当前 vector 元素存在的情况下对其进行访问。由于 vector 的元素类型是 string,因此 //deref()// 的返回类型是 '' | ||
+ | <code cpp> | ||
+ | std:: | ||
+ | StrBlobPtr:: | ||
+ | { | ||
+ | auto vsp = check(curr, " | ||
+ | return (*vsp)[curr]; | ||
+ | } | ||
+ | </ | ||
+ | <color # | ||
+ | 由于 // | ||
+ | <code cpp> | ||
+ | StrBlobPtr& | ||
+ | StrBlobPtr:: | ||
+ | { | ||
+ | check(curr, | ||
+ | ++curr; | ||
+ | return *this; | ||
+ | } | ||
+ | </ | ||
+ | <color # | ||
+ | 该两个成员函数是 //StrBlob// 的成员函数,功能类似于容器的首尾迭代器。该两个函数都是基于 // | ||
+ | <code cpp> | ||
+ | StrBlobPtr | ||
+ | StrBlob:: | ||
+ | { | ||
+ | return StrBlobPtr(*this, | ||
+ | } | ||
+ | |||
+ | StrBlobPtr | ||
+ | StrBlob:: | ||
+ | { | ||
+ | return StrBlobPtr(*this, | ||
+ | } | ||
+ | </ | ||
+ | 其他有两点需要注意: | ||
+ | * //check()// 与 //deref()// 都是 inspector 类型的函数,因此都应该是 const member function。并且, //deref()// 的返回类型是引用,在其 const 版本中需要添加 const。 | ||
+ | * 为了访问 //StrBlob// 中的私有成员,需要在 //StrBlob// 中添加 // | ||
+ | <code cpp> | ||
+ | StrBlob | ||
+ | { | ||
+ | friend class StrBlobPtr; | ||
+ | //.... | ||
+ | }; | ||
+ | </ | ||
+ | ====动态数组==== | ||
+ | 当我们需要一次分配多个对象(比如当 vector reallocated 的时候)时,可以将 '' | ||
+ | * 使用 allocator 模板(之后介绍) | ||
+ | * 使用 '' | ||
+ | <WRAP center round tip 100%> | ||
+ | 更多情况下,尤其是在 C++11 的标准下,我们应该使用**容器**分配多个堆上的对象。容器会为我们提供更好的内存管理,以及更好的性能。同时,基于容器实现的类还可以使用默认版本的拷贝、赋值与析构操作。 | ||
+ | </ | ||
+ | ===new 和数组=== | ||
+ | 使用 '' | ||
+ | <code cpp> | ||
+ | int *pia = new int[getsize()]; | ||
+ | </ | ||
+ | 该定义也可以使用 type alias 来完成: | ||
+ | <code cpp> | ||
+ | typedef int arrT[42]; //arrT names the type array of 42 ints | ||
+ | int *p = new arrT; //allocates an array of 42 ints; p points to the first one | ||
+ | </ | ||
+ | ==分配数组会得到指向元素的指针== | ||
+ | 通常我们把通过 '' | ||
+ | 由于数组的维度也是数组类型的一部分,通过 '' | ||
+ | <WRAP center round important 100%> | ||
+ | 通过 new 分配的动态数组**没有数组类型**。 | ||
+ | </ | ||
+ | ==初始化动态数组== | ||
+ | 与单个的动态对象的初始化一致,默认的情况下 '' | ||
+ | <code cpp> | ||
+ | int *pia = new int[10]; // block of ten uninitialized ints | ||
+ | int *pia2 = new int[10](); // block of ten ints value initialized to 0 | ||
+ | string *psa = new string[10]; // block of ten empty strings | ||
+ | string *psa2 = new string[10](); | ||
+ | </ | ||
+ | C++ 11中也允许我们通过初始化列表初始化动态数组: | ||
+ | <code cpp> | ||
+ | // block of ten ints each initialized from the corresponding initializer | ||
+ | int *pia3 = new int[10]{0, | ||
+ | // block of ten strings; the first four are initialized from the given initializers | ||
+ | // remaining elements are value initialized | ||
+ | string *psa3 = new string[10]{" | ||
+ | </ | ||
+ | 这种形式的初始化会有两种特殊的情况: | ||
+ | * 如果初始化列表的元素数量超出分配数组的大小,那么 '' | ||
+ | * 如果初始化列表的元素数量小于分配数组的大小,那么剩余的所有元素将**值初始化** | ||
+ | 还需要注意的是,使用 parentheses 可以对动态数组进行值初始化,但初始值并不能添加到括号中间。这也意味着无法使用 '' | ||
+ | ==分配空的动态数组是合法的== | ||
+ | 动态数组的维度可以使用任意的表达式来决定,当然 '' | ||
+ | <code cpp> | ||
+ | char arr[0]; | ||
+ | char *cp = new char[0]; // ok: but cp can't be dereferenced | ||
+ | </ | ||
+ | 可以保证的是,该指针与任意其他被 '' | ||
+ | <code cpp> | ||
+ | size_t n = get_size(); // get_size returns the number of elements needed | ||
+ | int* p = new int[n]; // allocate an array to hold the elements | ||
+ | for (int* q = p; q != p + n; ++q) | ||
+ | /* process the array */ ; | ||
+ | </ | ||
+ | 如果当前 '' | ||
+ | ==释放动态数组== | ||
+ | 动态数组的释放通过一种特殊的 '' | ||
+ | <code cpp> | ||
+ | delete p; // p must point to a dynamically allocated object or be null | ||
+ | delete [] pa; // pa must point to a dynamically allocated array or be null | ||
+ | </ | ||
+ | 在 '' | ||
+ | 需要注意的是,即便是使用 type alias 分配了动态数组,也**不能省略**这对方括号: | ||
+ | <code cpp> | ||
+ | typedef int arrT[42]; // arrT names the type array of 42 ints | ||
+ | int *p = new arrT; // allocates an array of 42 ints; p points to the first one | ||
+ | delete [] p; // brackets are necessary because we allocated an array | ||
+ | </ | ||
+ | <WRAP center round important 100%> | ||
+ | 多数情况下编译器不会对忘记添加方括号的行为提出警告。整个程序通常会以错误的方式继续运行下去。 | ||
+ | </ | ||
+ | ==智能指针与动态数组== | ||
+ | 标准库提供了使用 unique_ptr 管理动态数组的方案。使用 unique_ptr 的时候,其类型声明后面需要加一对方括号: | ||
+ | <code cpp> | ||
+ | // up points to an array of ten uninitialized ints | ||
+ | unique_ptr< | ||
+ | up.release(); | ||
+ | </ | ||
+ | ''< | ||
+ | 需要注意的是,unique_ptr 在动态数组上的操作与在单个对象上有一些不同: | ||
+ | * 指向动态数组的 unique_ptr 无法使用 '' | ||
+ | * 可以使用下标运算符 '' | ||
+ | 因此,unique_ptr 遍历访问动态数组需要以**维度 + 下标**的形式实现: | ||
+ | <code cpp> | ||
+ | for(size_t i = 0; i != 10; ++i) | ||
+ | up[i] = i; | ||
+ | </ | ||
+ | < | ||
+ | < | ||
+ | 如果希望对动态数组使用 shared_ptr, 我们需要提供 deleter: | ||
+ | <code cpp> | ||
+ | // to use a shared_ptr we must supply a deleter | ||
+ | shared_ptr< | ||
+ | sp.reset(); // uses the lambda we supplied that uses delete[] to free the array | ||
+ | </ | ||
+ | 这里使用了 lambda 作为 deleter,定义了使用 '' | ||
+ | shared_ptr 不支持直接管理动态数组的特性还会影响其访问数组的方式: | ||
+ | <code cpp> | ||
+ | // shared_ptrs don't have subscript operator and don't support pointer arithmetic | ||
+ | for (size_t i = 0; i != 10; ++i) | ||
+ | *(sp.get() + i) = i; // use get to get a built-in pointer | ||
+ | </ | ||
+ | ===Allocator 类=== | ||
+ | 在分配动态内存的过程中, '' | ||
+ | <code cpp> | ||
+ | string *const p = new string[n]; // construct n empty strings | ||
+ | string s; | ||
+ | string *q = p; // q points to the first string | ||
+ | while (cin >> s && q != p + n) | ||
+ | *q++ = s; // assign a new value to *q | ||
+ | // use the array | ||
+ | delete[] p; // p points to an array; must remember to use delete[] | ||
+ | </ | ||
+ | <color # | ||
+ | 按上例来说: | ||
+ | * 创建而未使用的对象是一种浪费。上例中,'' | ||
+ | * 双重写入会造成浪费。上例中,我们使用 '' | ||
+ | * 没有默认构造函数的类无法使用动态分配的数组 | ||
+ | ==Allocator 类简介== | ||
+ | // | ||
+ | \\ \\ < | ||
+ | <WRAP cen<WRAP center round box 100%> | ||
+ | |||
+ | C++ 17 中,直接使用 allocator 类的成员已经不被推荐了: | ||
+ | >//While we cannot remove these members without breaking backwards compatibility with code that explicitly used this allocator type, we should not be recommending their continued use. If a type wants to support generic allocators, it should access the allocator' | ||
+ | 取而代之的是 [[https:// | ||
+ | 详情:[[http:// | ||
+ | </ | ||
+ | 像所有模板类一样,定义 allocator 需要指定对象类型。之后,我们使用 // | ||
+ | <code cpp> | ||
+ | allocator< | ||
+ | auto const p = alloc.allocate(n); | ||
+ | </ | ||
+ | // | ||
+ | ==allocator 的整个流程== | ||
+ | allocator 分配的是 // | ||
+ | <code cpp> | ||
+ | auto q = p; // q will point to one past the last constructed element | ||
+ | alloc.construct(q++); | ||
+ | alloc.construct(q++, | ||
+ | alloc.construct(q++, | ||
+ | </ | ||
+ | <WRAP center round info 100%> | ||
+ | 之前版本的 consturct 只能接收两个参数,因此只能以拷贝的形式创建对象。 | ||
+ | </ | ||
+ | 对于已经创建的对象,使用指针的一般操作形式访问即可。需要注意的是,访问 raw member 的行为是 **undefined** 的。\\ \\ | ||
+ | 当创建的对象使用完毕之后,我们需要使用 // | ||
+ | <code cpp> | ||
+ | while (q != p) | ||
+ | alloc.destroy(--q); | ||
+ | </ | ||
+ | 本例中, '' | ||
+ | <WRAP center round important 100%> | ||
+ | // | ||
+ | </ | ||
+ | 当对象的销毁操作完毕,我们可以选择继续使用该片内存,或者是释放该片内存。如果选择释放,我们需要调用成员 // | ||
+ | <code cpp> | ||
+ | alloc.deallocate(p, | ||
+ | </ | ||
+ | 整个的流程如下图所示: | ||
+ | \\ \\ < | ||
+ | ==allocator 与算法== | ||
+ | 标准库提供了两种算法 // | ||
+ | \\ \\ < | ||
+ | 比如我们想要拷贝整个 int vector 到一片内的内存中,并使得 vector 占其一半的空间,剩下全部填充为 '' | ||
+ | <code cpp> | ||
+ | // allocate twice as many elements as vi holds | ||
+ | auto p = alloc.allocate(vi.size() * 2); | ||
+ | // construct elements starting at p as copies of elements in vi | ||
+ | auto q = uninitialized_copy(vi.begin(), | ||
+ | // initialize the remaining elements to 42 | ||
+ | uninitialized_fill_n(q, | ||
+ | </ | ||
+ | 上例中,// | ||
+ | ====实例:Text-Query程序==== | ||
+ | 本章要求实现一个程序。该程序允许用户对指定的文件内容进行关键字查找,并将关键字出现的行,与其所在行的内容全部打印出来。格式如下: | ||
+ | < | ||
+ | element occurs 112 times | ||
+ | (line 36) A set element contains only a key; | ||
+ | (line 158) operator creates a new element | ||
+ | (line 160) Regardless of whether the element | ||
+ | (line 168) When we fetch an element from a map, we | ||
+ | (line 214) If the element is not found, find returns | ||
+ | </ | ||
+ | ===程序的设计=== | ||
+ | 该程序有几个核心的要求: | ||
+ | - 程序需要在读取数据的同时,记录下所有词对应的行。 | ||
+ | - 对应的行需要按升序排列,并没有重复。 | ||
+ | - 程序需要打印出关键词所在行,与其对应的内容。 | ||
+ | 对应的解决方案: | ||
+ | - 使用 istringstream 拆分输入。 | ||
+ | - 使用 vector 存储读取所有的文本数据,并使用 set 存储行号。当需要访问对应行号的内容时,使用行号作为下标访问 vector 即可。 | ||
+ | - 行号使用 set 存储即可解决排序与重复的问题。 | ||
+ | - 使用 map 将关键词与对应的行号集合 set 关联起来。 | ||
+ | ==使用类数据结构== | ||
+ | 本例中使用了两个类作为数据的载体: | ||
+ | * // | ||
+ | * // | ||
+ | 由于 QueryResult 需要打印存储在 TextQuery 中的内容,这两个类之间需要进行数据共享。有几种方式: | ||
+ | * 拷贝 vector 和 map 中的 set 部分。不推荐这么做,因为拷贝开销太大。 | ||
+ | * 使用指针传递上述数据。不推荐这么做,因为普通指针无法保证共享数据的有效性,很可能会产生悬挂指针。 | ||
+ | * 使用 shared_ptr 传递数据。推荐。 | ||
+ | 因此,将本程序中需要共享的部分以 shared_ptr 的方式传递,我们可以得到如下图所示的简单关系图: | ||
+ | \\ \\ < | ||
+ | ===TextQuery 类实现=== | ||
+ | 除了基本的数据成员之外,TextQuery 还需要构建关键词 map 与 输出关键词对应 set 的功能。构建关键词 map 的功能可以整合到构造函数中,而输出对应 set 的功能由 //query()// 函数实现: | ||
+ | <code cpp> | ||
+ | class QueryResult; | ||
+ | class TextQuery { | ||
+ | public: | ||
+ | using line_no = std:: | ||
+ | TextQuery(std:: | ||
+ | QueryResult query(const std:: | ||
+ | private: | ||
+ | std:: | ||
+ | // map of each word to the set of the lines in which that word appears | ||
+ | std:: | ||
+ | | ||
+ | }; | ||
+ | </ | ||
+ | ==TextQuery 构造函数的实现== | ||
+ | TextQuery 的构造函数需要生成 map,并将关键词 map 与对应的文本储存到指定的数据成员中。整个构造过程可以描述为如下: | ||
+ | - 构造函数接受一个 '' | ||
+ | - 使用 '' | ||
+ | - 将该行文本存储到 vector 成员中 | ||
+ | - 使用 '' | ||
+ | - 使用 shared_ptr 判断该词是否存在于 map 中。如果是第一次见到,则为该词对应行号 set 申请**堆上**的空间 | ||
+ | - 使用 set 的 // | ||
+ | 实现代码如下: | ||
+ | <code cpp> | ||
+ | // read the input file and build the map of lines to line numbers | ||
+ | TextQuery:: | ||
+ | { | ||
+ | string text; | ||
+ | while (getline(is, | ||
+ | file-> | ||
+ | int n = file-> | ||
+ | istringstream line(text); | ||
+ | string word; | ||
+ | while (line >> word) { // for each word in that line | ||
+ | // if word isn't already in wm, subscripting adds a new entry | ||
+ | auto &lines = wm[word]; // lines is a shared_ptr | ||
+ | if (!lines) // that pointer is null the first time we see word | ||
+ | lines.reset(new set< | ||
+ | lines-> | ||
+ | } | ||
+ | } | ||
+ | } | ||
+ | </ | ||
+ | 几个需要注意的小细节: | ||
+ | * 修改 set 直接使用了 shared_ptr 的**引用** | ||
+ | * shared_ptr 可以使用 //reset()// 成员申请堆上的空间 | ||
+ | * 行号使用了 '' | ||
+ | <code cpp> | ||
+ | lineNo lineNum {1}; //started at the line 1 | ||
+ | for (string text; getline(is, text); ++lineNum) | ||
+ | { | ||
+ | //.... | ||
+ | }//move to the next line | ||
+ | </ | ||
+ | ==query 成员函数的实现== | ||
+ | //query()// 成员的目标是根据**指定的关键词**,输出对应关键词的行号 set 与对应的文本内容。可见该函数是一个**只读**函数,因此应该定义为 const member。同时,根据之前的设想,// | ||
+ | //query()// 的处理逻辑如下: | ||
+ | - 在关键词 map 中寻找指定关键词 | ||
+ | - 如果找到,返回包含对应行号 set 的 // | ||
+ | - 否则,返回包含**空** set 的 // | ||
+ | 实现代码如下: | ||
+ | <code cpp> | ||
+ | QueryResult | ||
+ | TextQuery:: | ||
+ | { | ||
+ | // we'll return a pointer to this set if we don't find sought | ||
+ | static shared_ptr< | ||
+ | // use find and not a subscript to avoid adding words to wm! | ||
+ | auto loc = wm.find(sought); | ||
+ | if (loc == wm.end()) | ||
+ | return QueryResult(sought, | ||
+ | else | ||
+ | return QueryResult(sought, | ||
+ | } | ||
+ | </ | ||
+ | 几个注意点: | ||
+ | * 空 set 是通过一个静态的 shared_ptr 指针成员来实现的。这样写可以使所有的 | ||
+ | * 这里的 '' | ||
+ | |||
+ | ===QueryResult 类的实现=== | ||
+ | // | ||
+ | * 关键词 | ||
+ | * 关键词对应的行号 set | ||
+ | * 数据文本 vector | ||
+ | 因此,// | ||
+ | <code cpp> | ||
+ | class QueryResult { | ||
+ | friend std:: | ||
+ | public: | ||
+ | QueryResult(std:: | ||
+ | std:: | ||
+ | std:: | ||
+ | sought(s), lines(p), file(f) { } | ||
+ | private: | ||
+ | std::string sought; | ||
+ | std:: | ||
+ | std:: | ||
+ | }; | ||
+ | </ | ||
+ | ===print 函数的实现=== | ||
+ | //Print()// 函数接收 // | ||
+ | <code cpp> | ||
+ | ostream & | ||
+ | { | ||
+ | // if the word was found, print the count and all occurrences | ||
+ | os << qr.sought << " occurs " << qr.lines-> | ||
+ | << | ||
+ | // print each line in which the word appeared | ||
+ | for (auto num : *qr.lines) // for every element in the set | ||
+ | // don't confound the user with text lines starting at 0 | ||
+ | os << " | ||
+ | << | ||
+ | return os; | ||
+ | } | ||
+ | </ | ||
+ | '' | ||
+ | <code cpp> | ||
+ | (*qr.file)[num - 1]; | ||
+ | </ | ||
+ | 如果行号从 '' |