C之不可回避的指针

指针是C语言永远也绕不过的话题,毕竟是C语言的精华所在。强行记忆指针的类型并没有多大的意义,只有完全理解一个复杂类型,融会贯通,举一反三,这样才能在实际使用中坦然处之。总结其原则为:始于变量名,合于优先运算符,逐步分析终得之

上图所示为常用类型,彻底理解这些类型,触类旁通其他的类型也可以分析理解了,过于复杂的类型会破坏程序的可读性,谨记!!

一、指针基础

指针是一个特殊的变量,其内存储的数值被解释成为内存里的一个地址。充分理解指针的前提是要搞清四个方面:指针的类型、指针所指向的类型、指针的值或者指针所指向的内存区、指针本身所占据的内存区。以下图为例逐一说明:

1、指针的类型

从语法角度看,只要把指针声明语句里的指针名字去掉,剩下的部分即为指针的类型。这是指针本身所具有的类型。

(1)int *ptr;  //指针的类型是int*

(2)char *ptr;  //指针的类型是char*

(3)int **ptr;  //指针的类型是int **

(4)int(*ptr)[3];  //指针的类型是int(*)[3]

(5)int*(*ptr)[4];  //指针的类型是int*(*)[4]

2、指针所指向的类型

当通过指针来访问指针所指向的内存区时,指针所指向的类型决定了编译器将把那片内存区里的内容当做什么来看待。从语法上看,只须把指针声明语句中的指针名字和名字左边的指针声明符*去掉即可,剩下即为指针所指向的类型。如下所示:

(1)int *ptr;  //指针指向的类型是int

(2)char *ptr;  //指针所指向的类型是char

(3)int **ptr;  //指针所指向的类型是int*

(4)int(*ptr)[3];  //指针所指向的类型是int()[3]

(5)int*(*ptr)[4];  //指针所指向的类型是int*()[4]

在指针相关运算中,指针所指向的类型有很大的作用。指针的类型(即指针本身的类型)和指针所指向的类型是两个概念。当你对C越来越熟悉时,就会发现,把与指针搅和在一起的“类型”这个概念分成“指针的类型”和“指针所指向的类型”两个概念,是精通指针的关键之一。

3、指针的值——指针所指向的内存区或地址

指针的值是指针本身存储的数值,该值被编译器当作一个地址,而不是一个一般的数值。在32位程序里,所有类型的指针的值都是一个32位整数,原因在于32位程序里内存地址全都是32位长。指针所指向的内存区就是从指针的值所代表的的那个内存地址开始,长度为sizeof(指针所指向的类型)的一片内存区。故指针的值是XX,即为该指针指向了以XX为首地址的一片内存区域;指针指向了某块内存区域,即为该指针的值是这块内存区域的首地址。指针所指向的内存区和指针所指向的类型是两个完全不同的概念。指针所指向的类型已具备,由于指针还未初始化,故它指向的内存区的是不存在的,或者说是无意义的。

实际项目中遇到指针,都应明确:这个指针的类型是什么?指针指的类型是什么?该指针指向了哪里?(重点注意)

4、指针本身所占据的内存区

指针本身占了多大的内存?你只要用函数sizeof(指针的类型)测一下即可。在32位平台里,指针本身占据了4个字节的长度。指针本身占据的内存这个概念在判断一个指针表达式是否是左值时很有用。

二、指针的算术运算

指针可以加上或减去某个整数。这种运算的意义和通常的数值加减运算是不同的,以字节为单位。如下图所示:

指针ptr的类型是int*,指针指向的类型是int,其被初始化为指向整型变量a。若ptr加1,编译器如下处理:把指针ptr的值加上了sizeof(int)。由于char类型的长度是一个字节,故原来ptr是指向数组a的第0号单元开始的四个字节,应用于遍历:

该例将整数数组中各个单元的值加1,由于每次循环都将指针ptr加1个单元,故每次循环都能访问数组的下一个单元。

正解:ptr的类型是char **,指向的类型是一个char *类型,该指向的地址即为p的地址(&p),当执行ptr++时,会使指针加一个sizeof(char*),即&p+4;那么*(&p+4)指向哪呢?这个问题你去问上帝吧,所以最后的输出会是一个随机的值,或许是一个非法操作。

总价如下:一个指针ptrold加(减)一个整数n后,结果是一个新的指针ptrnew,ptrnew的类型和ptrold的类型相同,ptrnew所指向的类型和ptrold所指向的类型也相同。ptrnew的值将比ptrold的值增加(减少)了n乘sizeof(ptrold所指向的类型)个字节。指针和指针进行加减:两个指针不能进行加法运算,这是非法操作,因为进行加法后,得到的结果指向一个不知所向的地方,而且毫无意义。两个指针可以进行减法操作,但必须类型相同,一般用在数组方面。

三、运算符&和*

&是取地址运算符,*是间接运算符。

&a的运算结果是一个指针,指针的类型是a的类型加个*,指针所指向的类型是a的类型,指针所指向的地址嘛就是a的地址。

四、指针表达式

一个表达式的结果如果是一个指针,那么这个表达式就叫指针表式。

由于指针表达式的结果是一个指针,故指针表达式亦具有指针所具有的四个要素:指针的类型、指针所指向的类型、指针指向的内存区、指针本身占据的内存。当一个指针表达式的结果指针已经明确地具有了指针自身占据的内存的话,这个指针表达式即为左值,否则则不是,如&a不是一个左值,*ptr为一个左值,因为*ptr这个指针已经占据了内存。

五、数组和指针的关系

上图中,str是一个三单元的数组,该数组的每个单元都是一个指针,这些指针各指向一个字符串。把指针数组名str当作一个指针的话,它指向数组的第0号单元,它的类型是char **,它指向的类型是char *。

声明了一个数组TYPE array[n],则数组名称array存在双重含义:

第一,代表了整个数组,类型是TYPE[n];

第二,代表一个常量指针,该指针的类型是TYPE*,该指针指向的类型是TYPE,即数组单元的类型,该指针指向的内存即为数组第0号单元,该指针自己占有单独的内存区,注意它和数组第0号单元占据的内存区时不同的。该指针是不能修改的,即类似array++的表达式是错误的。

ptr是一个指针,其类型是int(*)[10],其指向的类型是int[10],故用整个数组的首地址来初始化它。在ptr = &array中,array代表数组本身。实际上,sizeof(对象)测出的都是对象自身的类型的大小。

六、指针和结构类型的关系

可以声明一个指向结构类型对象的指针。

请问怎样通过指针ptr来访问ss的三个成员变量?答案如下所示:

ptr->a;  //指向运算符,或者可以这样(*ptr).a,建议使用前者

ptr->b;

ptr->c;

又问怎样通过指针pstr来访问ss的三个成员变量?答案是:

*pstr;  //访问了ss的成员a

*(pstr + 1);  //访问了ss的成员b

*(pstr + 2);  //访问了ss的成员c

虽然可以通过pstr来进行访问,但是此类访问不合规矩,为了说明问题,将结构体换为数组,看看怎样通过指针来访问数组的各单元。

从格式上看与通过指针访问结构成员的不正规并无区别。所有的C/C++编译器在排列组合的单元时,总是把各个数组单元存放在连续的存储区里,单元和单元之间没有空隙。但在存放结构对象的各个成员时,在特定编译环境下,可能会需要对齐或双字对齐或者其他对齐,需要在相邻两个成员之间加若干个“填充字节”,这就导致各个成员之间可能会有若干个字节的空隙。故即使*pstr访问到了结构对象ss的第一个成员变量a,也不能保证*(pstr+1)一定能访问到结构成员b。因为成员a和成员b之间可能会有若干填充字节。指针访问结构成员的正确方法应该是上例中使用指针ptr的方法。

七、指针和函数的关系

可以把一个指针声明成一个指向函数的指针。

int fun1(char *, int);

int (*pfun1)(char *, int);

pfun1 = fun1;

int a = (*pfun1)(“abcdefg”, 7);  //通过函数指针调用函数

可以把指针作为函数的形参。在函数调用语句中,可以用指针表达式来作为实参。

上例所示函数fun统计一个字符串中各个字符的ASCII码值之和。数组的名字可以认为是一个指针(有待商榷)。在函数调用中,当把str作为实参传递给形参s后,实际上把str的值传递给了s,s所指向的地址就和str所指向的地址一致,但是str和s各自占用各自的存储空间。在函数体内对s进行自加1运算,并不意味着同时对str进行了自加1运算。

八、指针类型转换

绝大多数情况下,赋值号左边指针的类型和赋值号右边指针表达式的类型是一样的,指针所指向的类型和指针表达式所指向的类型是一样的。

如上所示:假如想让指针p指向实数f,该如何是好?

这样操作可以吗?p = &f;

NO NO NO ! ! ! 因为指针p的类型是int*,它指向的类型是int。表达式&f的结果是一个指针,指针的类型是float *,它指向的类型是float,两者不一致,直接赋值的方法不可行。而是需要“强制类型转换”:

p = (int *)&f;

如果有一个指针p,我们需要把它的类型和所指向的类型改为TYEP *TYPE, 那么语法格式是: (TYPE *)p;这样强制类型转换的结果是一个新指针,该新指针的类型是TYPE *,它指向的类型是TYPE,它指向的地址就是原指针指向的地址。
而原来的指针p 的一切属性都没有被修改。(切记)

一个函数如果使用了指针作为形参,那么在函数调用语句的实参和形参的结合过程中,必须保证类型一致,否则需要进行强制转换,如下fun((char *)&a);所示。

结合上面这个例子,想象编译器进行转换的过程:编译器先构造一个临时指针char *temp,然后执行temp = (char *)&a,最后再把temp的值传递给s。故最后的结果是:s的类型是char *,它指向的类型是char,它指向的地址即a的首地址。

既然指针的值就是指针指向的地址,在32位程序中,指针的值其实是一个32位整数。可不可以把一个整数当作指针的值直接赋给指针呢?

严格说来此处(TYPE *)和指针类型转换中的(TYPE *)还不一样。此处(TYPE *)意为把无符号整数a的值当作一个地址来看待。上面强调了a的值必须代表一个合法的地址,否则的话,在你使用ptr的时候,就会出现非法操作错误。设想一下能不能反过来,把指针指向的地址即指针的值当作一个整数取出来。@@完全可以@@。把一个指针的值当作一个整数取出来,再把这个整数当作一个地址赋给一个指针:

九、指针的安全问题

指针ptr是一个int*类型的指针,它指向的类型是int。它指向的地址就是s的首地址。在32位程序中,s占一个字节,int类型占四个字节。最后一条语句不但改变了s所占的一个字节,还把和s相临的高地址方向的三个字节也改变了。这三个字节是干什么的?只有编译程序知道,而写代码的人不太可能知道。也许大概可能这三个字节存储了非常重要的数据,也许大概可能这三个字节里正好是程序的一条代码,而由于你对指针的马虎应用,这三个字节的值被改变了!!!这会造成崩溃性的错误!!!

该例完全可以通过编译,并能成功执行。但是看到没有???第3句对指针ptr进行自加1运算后,ptr指向了和整型变量a相邻的高地址方向的一块存储区。这块存储区里是什么?我们不知道,有可能它是一个非常重要的数据,甚至可能是一条代码。而第4句竟然往这片存储区里写入一个数据!!!这是严重的错误。所以在使用指针时,程序猿心里必须非常清楚:编写的指针究竟指向了哪里?在用指针访问数组的时候,也要注意不要超出数组的低端和高端界限,否则也会造成类似的错误。

在指针的强制类型转换:ptr1 = (TYPE *)ptr2中,如果sizeof(ptr2的类型)大于sizeof(ptr1的类型),那么在使用指针ptr1来访问ptr2所指向的存储区时是安全的。如果sizeof(ptr2的类型)小于sizeof(ptr1 的类型),那么在使用指针ptr1 来访问ptr2 所指向的存储区时是不安全的。

发表评论

电子邮件地址不会被公开。 必填项已用*标注