本文共 9081 字,大约阅读时间需要 30 分钟。
转载请注明出处,版权归作者所有
yanzhong.lee
作者按:
从这篇文章中,我们主要会认识到一下几点:
一、不类中的特征标相同的同名函数,它们是不同的函数,原因就是类具有“名称空间”的功能;
二、类的对象是不包含类声明中所提到的成员函数所占的内存,对象只包含类声明中非static成员数据,如类声明中有虚函数,则对象还会有个vtbl指针。同一个类的所有对象都是使用同一份成员函数拷贝。
三、VS编译器是如何实现函数的重载的,以及如何使用this指针的。
这是写给C++初学者的文章,高手就不用浪费您宝贵的时间看了。
我们知道在同一个类中函数不能完全相同,当然可以重载了,我所要说的是函数名以及它的特征标完全一样的函数在类中只能有一个,但是在不同的类中可以同时存在函数名以及特征标完全一致的函数,这个是为什么呢?这个就是C++类的功劳,这个有点类似于C++中的“名称空间”功能。
那么这些C++语言特性又是如何得到C++编译支持的呢?
为了研究这个问题,我特地写了一个测试程序如下:
//CTestA类
class CTestA{
public: CTestA(); ~CTestA(); int func(int param); float func(float param); private: int m_value; float m_float; }; int CTestA::func(int param) { m_value += 1; return 0; } float CTestA::func(float param) { m_float += 1.0; return m_float; } CTestA::CTestA() { m_value = 0; m_float = 0.0; } CTestA::~CTestA() { }
//CTestB类
class CTestB{ public: CTestB(); ~CTestB(); int func(int param); private: int m_value; };int CTestB::func(int param)
{ m_value += 1; return 0; } CTestB::CTestB() { m_value = 0; } CTestB::~CTestB() { }//main函数
int _tmain(int argc, _TCHAR* argv[]) { float x = 2.0; CTestA testA; CTestB testB;testA.func(1);
testA.func(x); //OKtestA.func(2.0f); //Ok//testA.func(2.0); //error ambiguous calltestB.func(2);
return 0; }
上面是源代码,我们在VS2005中看到的对应的汇编代码是这样的:
--- f:\game\classtest\classtest\classtest.cpp ----------------------------------
int _tmain(int argc, _TCHAR* argv[]) { 00411610 push ebp 00411611 mov ebp,esp 00411613 push 0FFFFFFFFh 00411615 push offset __ehhandler$_wmain (414830h) 0041161A mov eax,dword ptr fs:[00000000h] 00411620 push eax 00411621 sub esp,0F4h 00411627 push ebx 00411628 push esi 00411629 push edi 0041162A lea edi,[ebp-100h] 00411630 mov ecx,3Dh 00411635 mov eax,0CCCCCCCCh 0041163A rep stos dword ptr es:[edi] 0041163C mov eax,dword ptr [___security_cookie (418000h)] 00411641 xor eax,ebp 00411643 push eax 00411644 lea eax,[ebp-0Ch] 00411647 mov dword ptr fs:[00000000h],eax float x = 2.0; 0041164D fld dword ptr [__real@40000000 (416750h)] 00411653 fstp dword ptr [ebp-14h] CTestA testA; 00411656 lea ecx,[ebp-24h] 00411659 call CTestA::CTestA (411163h) 0041165E mov dword ptr [ebp-4],0 CTestB testB; 00411665 lea ecx,[ebp-30h] 00411668 call CTestB::CTestB (41116Dh) 0041166D mov byte ptr [ebp-4],1
testA.func(1);
00411671 push 1 00411673 lea ecx,[ebp-24h]00411676 call CTestA::func (4110F0h)testA.func(x); 0041167B push ecx 0041167C fld dword ptr [ebp-14h] 0041167F fstp dword ptr [esp] 00411682 lea ecx,[ebp-24h]00411685 call CTestA::func (4110EBh) 0041168A fstp st(0) testA.func(2.0f); 0041168C push ecx 0041168D fld dword ptr [__real@40000000 (416750h)] 00411693 fstp dword ptr [esp] 00411696 lea ecx,[ebp-24h]00411699 call CTestA::func (4110EBh)0041169E fstp st(0) //testA.func(2.0); //error ambiguous calltestB.func(2);
004116A0 push 2 004116A2 lea ecx,[ebp-30h]004116A5 call CTestB::func (4110B9h) return 0; 004116AA mov dword ptr [ebp-0FCh],0 004116B4 mov byte ptr [ebp-4],0 004116B8 lea ecx,[ebp-30h] 004116BB call CTestB::~CTestB (4110FFh) 004116C0 mov dword ptr [ebp-4],0FFFFFFFFh 004116C7 lea ecx,[ebp-24h] 004116CA call CTestA::~CTestA (411104h) 004116CF mov eax,dword ptr [ebp-0FCh] } 004116D5 push edx 004116D6 mov ecx,ebp 004116D8 push eax 004116D9 lea edx,[ (411708h)] 004116DF call @ILT+135(@_RTC_CheckStackVars@8) (41108Ch) 004116E4 pop eax 004116E5 pop edx 004116E6 mov ecx,dword ptr [ebp-0Ch] 004116E9 mov dword ptr fs:[0],ecx 004116F0 pop ecx 004116F1 pop edi 004116F2 pop esi 004116F3 pop ebx 004116F4 add esp,100h 004116FA cmp ebp,esp 004116FC call @ILT+345(__RTC_CheckEsp) (41115Eh) 00411701 mov esp,ebp 00411703 pop ebp 00411704 ret 00411705 lea ecx,[ecx] 00411708 db 02h 00411709 db 00h 0041170A db 00h 0041170B db 00h 0041170C db 10h 0041170D db 17h 0041170E db 41h 0041170F db 00h 00411710 db dch 00411711 db ffh 00411712 db ffh 00411713 db ffh 00411714 db 08h 00411715 db 00h 00411716 db 00h 00411717 db 00h 00411718 db 2eh 00411719 db 17h 0041171A db 41h 0041171B db 00h 0041171C db d0h 0041171D db ffh 0041171E db ffh 0041171F db ffh 00411720 db 04h 00411721 db 00h 00411722 db 00h 00411723 db 00h 00411724 db 28h 00411725 db 17h 00411726 db 41h 00411727 db 00h 00411728 db 74h 00411729 db 65h 0041172A db 73h 0041172B db 74h 0041172C db 42h 0041172D db 00h 0041172E db 74h 0041172F db 65h 00411730 db 73h 00411731 db 74h 00411732 db 41h 00411733 db 00h--- No source file -------------------------------------------------------------我们看到汇编代码中用蓝色标出的两条汇编语句,就是两条调用两个类中func函数的跳转语句。
00411676 call CTestA::func (4110F0h)
004116A5 call CTestB::func (4110B9h) 其中,00411676和004116A5是这个两个语句的本身地址,而在每条语句的最后面用括号括起来的,如 (4110F0h) 和(4110B9h)都是call指令要去的目的地址,这还不是func函数所在内存的地址,只是一个跳转指令的地址。我们可以看出这个两个函数的地址是不一样的,这个就说明两个类中具有相同特征标的同名方法,在内存中有不占据不同的内存区域。那么编译器是如何区别这样的函数呢,我们从上面蓝色标志的两句汇编语句就可以知道,是使用了类的作用域来表示,如CTestA::和CTestB::,这类似于“名称空间”功能。下面的代码片段,就是在语句“00411676 call CTestA::func (4110F0h)”处按F11跳转到的目的地。如下面红色标志的一句。
004110F0 jmp CTestA::func (4113F0h)
这红色标志的语句jmp CTestA::func(4113F0h)才真正的跳到类CTestA中的func内存处,而该函数的首地址就是4113F0h,如下代码段(红色标志的一句):
int CTestA::func(int param)
{ 004113F0 push ebp 004113F1 mov ebp,esp 004113F3 sub esp,0CCh 004113F9 push ebx 004113FA push esi 004113FB push edi 004113FC push ecx 004113FD lea edi,[ebp-0CCh] 00411403 mov ecx,33h 00411408 mov eax,0CCCCCCCCh 0041140D rep stos dword ptr es:[edi] 0041140F pop ecx 00411410 mov dword ptr [ebp-8],ecx m_value += 1; 00411413 mov eax,dword ptr [this] 00411416 mov ecx,dword ptr [eax] 00411418 add ecx,1 0041141B mov edx,dword ptr [this] 0041141E mov dword ptr [edx],ecx return 0; 00411420 xor eax,eax } 00411422 pop edi 00411423 pop esi 00411424 pop ebx 00411425 mov esp,ebp 00411427 pop ebp 00411428 ret 4--- No source file -------------------------------------------------------------
同理我们看看第二条语句“call CTestB::func (4110B9h)”该语句是跳到地址4110B9h处,如下面的代码:
004110B9 jmp CTestB::func (411530h)
该语句是一条跳转指令,同上,该指令会跳到正真的成员函数所在的内存地址处(00411530),代码如下所示:
int CTestB::func(int param) { 00411530 push ebp 00411531 mov ebp,esp 00411533 sub esp,0CCh 00411539 push ebx 0041153A push esi 0041153B push edi 0041153C push ecx 0041153D lea edi,[ebp-0CCh] 00411543 mov ecx,33h 00411548 mov eax,0CCCCCCCCh 0041154D rep stos dword ptr es:[edi] 0041154F pop ecx 00411550 mov dword ptr [ebp-8],ecx m_value += 1; 00411553 mov eax,dword ptr [this] 00411556 mov ecx,dword ptr [eax] 00411558 add ecx,1 0041155B mov edx,dword ptr [this] 0041155E mov dword ptr [edx],ecx return 0; 00411560 xor eax,eax } 00411562 pop edi 00411563 pop esi 00411564 pop ebx 00411565 mov esp,ebp 00411567 pop ebp 00411568 ret 4
小结一下:
不同类中具有相同特征标的同名方法,编译器是通过类的作用域操作符(::)来区分的,这样的函数分别有自己的内存空间,这点可以从上面它们具有不同的内存地址可以得到证实。
同一个类的所有实例对象都是使用内存中的同一组成员方法拷贝,所以类的成员方法不属于任何一个对象,所有的对象共享内存中的同一份成员函数拷贝;因此一个类的对象只包含类声明中的数据部分,包括一个VTBL指针数据(如果该类中有virtual成员函数的话),那么如果某个对象要使用类声明中的某个成员函数怎么办呢?这个就涉及到C++编译中引入的this指针了,这this指针就是指向调用成员函数的对象内存的地址;我们以程序为证:
我修改过了上面的main函数,如下:
主要看下面用红色标志的地方,我用同一类声明了两个对象testA和testA2,然后我们再看看VS2005编译是如何处理对象调用函数的,还是看VS给出的汇编代码吧。
int _tmain(int argc, _TCHAR* argv[]) { float x = 2.0;CTestA testA; CTestA testA2;CTestB testB;
testA.func(1); testA2.func(4);testA.func(x); testA.func(2.0f); //testA.func(2.0); //error ambiguous call
testB.func(2); return 0; }
汇编代码如如下:
这次我只给出有关这两个对象的汇编代码片段:
testA.func(1);
0041167D push 1 0041167F lea ecx,[ebp-24h]00411682 call CTestA::func (4110F0h) testA2.func(4); 00411687 push 4 00411689 lea ecx,[ebp-34h]0041168C call CTestA::func (4110F0h)可以看出一个类的不同对象,调用的成员函数func地址是一样的,这就证明了我们上面的结论 ——“一个类的不同对象是共享同内存处的同一组函数拷贝”。
那么我们接下来就是要证明的就是对象只包含数据不包含函数而且成员函数是通过this指针来区别同一类的不同对象的????
我们还是看汇编代码吧,我们在上面的两条红色标志的代码处分别按下F11两次,第一次按F11是跳到如下语句
004110F0jmp CTestA::func(4113F0h)
第二次按F11就会到达成员函数func所在的内存处,汇编代码如下:
int CTestA::func(int param)
{ 004113F0push ebp 004113F1 mov ebp,esp 004113F3 sub esp,0CCh 004113F9 push ebx 004113FA push esi 004113FB push edi 004113FC push ecx 004113FD lea edi,[ebp-0CCh] 00411403 mov ecx,33h 00411408 mov eax,0CCCCCCCCh 0041140D rep stos dword ptr es:[edi] 0041140F pop ecx 00411410 mov dword ptr [ebp-8],ecxm_value += 1;00411413 mov eax,dword ptr [this]00411416 mov ecx,dword ptr [eax] 00411418 add ecx,10041141B mov edx,dword ptr [this] 0041141E mov dword ptr [edx],ecx return 0; 00411420 xor eax,eax }看到没有在操作具体数据时用到了this指针,我们用VS提供的QuichWatch功能,就看到this的地址,以及它所指向的对象的值:
this值为0x0012ff44
this所指向的对象值为{m_value=0 m_float=0.00000000}
我们还没有证明我们刚才所说的结论,还必须要看一下this所指向的下一个对象的地址,也就说在用下一个对象(testA2)调用成员函数时的this指针的值。
还是看汇编代码比较有说服力:
int CTestA::func(int param)
{ 004113F0 push ebp 004113F1 mov ebp,esp 004113F3 sub esp,0CCh 004113F9 push ebx 004113FA push esi 004113FB push edi 004113FC push ecx 004113FD lea edi,[ebp-0CCh] 00411403 mov ecx,33h 00411408 mov eax,0CCCCCCCCh 0041140D rep stos dword ptr es:[edi] 0041140F pop ecx 00411410 mov dword ptr [ebp-8],ecxm_value += 1; 00411413 mov eax,dword ptr [this] 00411416 mov ecx,dword ptr [eax] 00411418 add ecx,1 0041141B mov edx,dword ptr [this]0041141E mov dword ptr [edx],ecx return 0; 00411420 xor eax,eax } 代码和上面是一摸一样的,不同的就是this值,使用同样的方法查看this值:this值为0x0012ff34
可以明显的看出此处的this值不等于上面的this值(0x0012ff34 != 0x0012ff44),这就证明了我们的编译器使用this指针来区别同一类的不同对象,已经对象只包含类声明时的数据(注意如果是static数据成员 就不会包含在对象中;只有类声明中包含virtual成员函数是对象中才有vtbl指针,这些留给读者可以自己去验证!)